【论文泛读54】一个简单有效的回答多跨度问题的模型

最新推荐文章于 2021-11-23 00:06:25 发布

及时行樂_

最新推荐文章于 2021-11-23 00:06:25 发布

阅读量423

点赞数 1

CC 4.0 BY-SA版权

分类专栏：论文 # Bert # NLP_paper 文章标签： QA paper

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41485273/article/details/115870987

论文同时被 3 个专栏收录

216 篇文章

订阅专栏

190 篇文章

订阅专栏

77 篇文章

订阅专栏

本文提出了一种简单有效的多跨度问题解答模型，该模型通过序列标记技术解决多跨度问题，显著提高了模型性能，在QUOREF数据集上取得了最先进的结果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

贴一下汇总贴：论文阅读记录

论文链接：《A Simple and Effective Model for Answering Multi-span Questions》

一、摘要

阅读理解（RC）模型通常将其输出空间限制为来自输入的所有单个连续范围的集合，以减轻学习问题并避免需要模型来显式生成文本。但是，将答案强制为单个跨度可能会受到限制，并且一些最近的数据集还包含多跨度问题，即其答案是文本中一组非连续跨度的问题。自然，返回单个跨度的模型无法回答这些问题。在这项工作中，我们提出了一个简单的体系结构，用于通过将任务转换为序列标记问题来回答多跨度问题，即为每个输入令牌预测是否应该将其作为输出的一部分。我们的模型在将DROP和Quoref的跨度提取问题上的性能提高了9.9和5。

二、结论

在这项工作中，我们将回答多跨度问题的任务转换为一个序列标记问题，并给出了一个简单的相应的多跨度体系结构。我们表明，用我们的多跨度体系结构替换标准的单跨度体系结构可以显著提高多跨度问题的结果，而不会损害单跨度问题的性能，从而在QUOREF上获得最先进的结果。此外，将我们的多跨架构集成到现有模型中进一步提高了DROP的性能，这从DROP排行榜上的领先模型中可以明显看出。代码：github。

三、模型

Span Extraction as Sequence Tagging
Decoding Spans from a Tagging

在这里插入图片描述

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。