2020年NLP技术进展与工具发布回顾

一月

🔮 1月28日:发布Thinc v8.0 alpha版本,这是一个轻量级深度学习库,提供基于类型检查的函数式编程API,支持与PyTorch、TensorFlow等框架的层组合,专为spaCy v3.0的新工作流重构。

二月

🎤 2月8日:在PyCon Colombia大会上分享《Python中NLP的未来》,探讨如何通过NLP技术进步缩小原型与生产环境的差距。
📺 同日接受访谈,讨论spaCy发展历程及NLP入门方法。

三月

📺 3月2日:发布《spaCy NLP入门》新章节,演示如何训练编程语言识别NER模型。
📺 3月16日:发布端到端视频教程,展示使用Prodigy工具通过半自动标注和迁移学习训练实体识别模型。
💻 3月20日:开源Typer库,基于Python类型提示构建现代化CLI工具。
📺 3月24日:演示Prodigy自定义图像标注流程及PyTorch模型集成。

四月

🏫 4月21日:发布德语版spaCy免费课程《Modernes NLP mit spaCy》。

五月

🏫 5月6日/11日:相继发布日语、西班牙语版spaCy课程。
📺 5月7日:发布实体链接模型训练教程,涵盖知识库消歧与数据创建。

六月

💫 6月16日:

  • 发布spaCy v2.3,新增中文等5种语言管道,优化15个模型家族的词向量与加载效率
  • Prodigy v1.10.0支持依赖关系标注、音视频标注及改进的图像标注界面
    📺 发布新功能演示视频,涵盖生物医学事件抽取等场景

十月

💫 10月15日:发布spaCy v3.0 nightly版本,核心升级包括:

  • 基于transformer的SOTA精度管道
  • 支持多任务学习共享transformer
  • 可配置的PyTorch/TensorFlow模型集成
  • 通过spaCy projects实现端到端工作流定义

十一月

📻 11月4日:探讨构建健壮NLP应用的方法论。

技术亮点

  1. 架构革新:spaCy v3.0引入transformer管道与多框架模型支持
  2. 工具链完善:Thinc提供跨框架模型组合能力,Prodigy增强多模态标注
  3. 开发者生态:多语言课程、社区讨论板与可视化工具(spacy-streamlit)建设

更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
公众号二维码
外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值