一月
🔮 1月28日:发布Thinc v8.0 alpha版本,这是一个轻量级深度学习库,提供基于类型检查的函数式编程API,支持与PyTorch、TensorFlow等框架的层组合,专为spaCy v3.0的新工作流重构。
二月
🎤 2月8日:在PyCon Colombia大会上分享《Python中NLP的未来》,探讨如何通过NLP技术进步缩小原型与生产环境的差距。
📺 同日接受访谈,讨论spaCy发展历程及NLP入门方法。
三月
📺 3月2日:发布《spaCy NLP入门》新章节,演示如何训练编程语言识别NER模型。
📺 3月16日:发布端到端视频教程,展示使用Prodigy工具通过半自动标注和迁移学习训练实体识别模型。
💻 3月20日:开源Typer库,基于Python类型提示构建现代化CLI工具。
📺 3月24日:演示Prodigy自定义图像标注流程及PyTorch模型集成。
四月
🏫 4月21日:发布德语版spaCy免费课程《Modernes NLP mit spaCy》。
五月
🏫 5月6日/11日:相继发布日语、西班牙语版spaCy课程。
📺 5月7日:发布实体链接模型训练教程,涵盖知识库消歧与数据创建。
六月
💫 6月16日:
- 发布spaCy v2.3,新增中文等5种语言管道,优化15个模型家族的词向量与加载效率
- Prodigy v1.10.0支持依赖关系标注、音视频标注及改进的图像标注界面
📺 发布新功能演示视频,涵盖生物医学事件抽取等场景
十月
💫 10月15日:发布spaCy v3.0 nightly版本,核心升级包括:
- 基于transformer的SOTA精度管道
- 支持多任务学习共享transformer
- 可配置的PyTorch/TensorFlow模型集成
- 通过spaCy projects实现端到端工作流定义
十一月
📻 11月4日:探讨构建健壮NLP应用的方法论。
技术亮点
- 架构革新:spaCy v3.0引入transformer管道与多框架模型支持
- 工具链完善:Thinc提供跨框架模型组合能力,Prodigy增强多模态标注
- 开发者生态:多语言课程、社区讨论板与可视化工具(spacy-streamlit)建设
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
公众号二维码