48、文本识别模型性能与概率校准研究

rock5

于 2025-06-30 12:40:02 发布

阅读量11

点赞数

CC 4.0 BY-SA版权

分类专栏：神经信息处理：ICONIP 2019会议精华文章标签：文本识别概率校准 Bi-MPM模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/rock5/article/details/149522895

神经信息处理：ICONIP 2019会议精华专栏收录该内容

68 篇文章 ¥399.00 ¥499.90

订阅专栏

超级会员免费看

文本识别模型性能与概率校准研究

在当今的科技领域，文本识别和问答系统的发展日新月异。本文将聚焦于Bi - MPM模型在重复问题数据集上的性能表现，以及循环文本识别网络中的概率校准问题。

Bi - MPM模型在重复问题数据集上的性能

模型性能数据
| 数据集 | 测试集准确率 |
| — | — |
| Quora Question Pairs | 88.17% |
| Meta StackExchange | 88.95% |
| AskUbunutu | 92.34% |
| Comp1710 Piazza | 91.78% |

从这些数据中，我们可以展开两点讨论：
1. 问题长度与模型性能的关系 ：平均问题长度似乎对模型性能有反向影响。模型在平均问题长度最小的数据集上表现最差。这有点令人惊讶，因为较长的问题通常包含与潜在问题核心并非完全相关的信息。
2. 不同数据集准确率的比较 ：尽管COMP1710 Piazza数据集与AskUbuntu和Meta StackExchange数据集存在重大差异，但在这些数据集上实现的测试准确率相当。这可能是由两个相互冲突的因素造成的：
- COMP1710 Piazza数据集的领域范围狭窄，使得模型从训练集中学习相对容易，因为它的词汇量非常有限，因此可以进行更好的分析。
- 缺乏维护高问题质量的激励措施，导致数据集中的问题存在大量拼写错误，并且语法通常较差。

考虑到这两点，COMP1

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。