- 博客(2)
- 收藏
- 关注
转载 Spring Boot 集成 tess4j 实现图片识别文本
Tesseract 是世界上最知名、应用最广泛的开源 OCR 引擎。它通常作为核心引擎被集成到各种应用程序、脚本和更大型的系统中,是许多需要文本提取功能的项目的首选开源解决方案。链接: https://pan.baidu.com/s/13oPR2r7qOE6lt6SgbpWOQA 提取码: uaaw。转载于: https://www.cnblogs.com/songweipeng/p/18956710。* @Description: ocr识别实现类。* @Description: ocr识别接口。
2025-07-09 06:37:53
2
转载 PaddleNLP UIE -- 药品说明书信息抽取(名称、规格、用法、用量)
目录环境配置创建项目上传代码定制模型--训练代码结构数据标注准备语料库数据标注导出数据数据转换doccanoLabel Studio模型微调模型评估定制模型--预测效果PaddleNLP UIE 实体关系抽取 -- 抽取药品说明书(名称、规格、用法、用量)对于细分场景推荐使用轻定制功能(标注少量数据进行模型微调)以进一步提升效果schema =['药品名称','用法','用量','频次']...
2024-09-14 02:49:22
452
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人