北大的分词工具
(1)多领域分词。新闻、科研、网络、医药、旅游、金融、工业。
(2)更高的分词准确率
(3)支持用户自训练模型,支持用户使用全新的标注数据进行训练。
如果PyPI官方源下载速度不理想建议使用镜像源,比如
初次安装:
pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple pkuseg
医药领域的模型下载地址:
https://github.com/lancopku/pkuseg-python/releases/download/v0.0.16/medicine.zip" to C:\Users\fangb/.pkuseg
手动下载zip文件 https://github.com/lancopku/pkuseg-python/releases
nlp分词之pkuseg
最新推荐文章于 2025-07-18 12:44:01 发布