【论文泛读54】一个简单有效的回答多跨度问题的模型

本文提出了一种简单有效的多跨度问题解答模型,该模型通过序列标记技术解决多跨度问题,显著提高了模型性能,在QUOREF数据集上取得了最先进的结果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

贴一下汇总贴:论文阅读记录

论文链接:《A Simple and Effective Model for Answering Multi-span Questions》

一、摘要

阅读理解(RC)模型通常将其输出空间限制为来自输入的所有单个连续范围的集合,以减轻学习问题并避免需要模型来显式生成文本。但是,将答案强制为单个跨度可能会受到限制,并且一些最近的数据集还包含多跨度问题,即其答案是文本中一组非连续跨度的问题。自然,返回单个跨度的模型无法回答这些问题。在这项工作中,我们提出了一个简单的体系结构,用于通过将任务转换为序列标记问题来回答多跨度问题,即为每个输入令牌预测是否应该将其作为输出的一部分。我们的模型在将DROP和Quoref的跨度提取问题上的性能提高了9.9和5。

二、结论

在这项工作中,我们将回答多跨度问题的任务转换为一个序列标记问题,并给出了一个简单的相应的多跨度体系结构。我们表明,用我们的多跨度体系结构替换标准的单跨度体系结构可以显著提高多跨度问题的结果,而不会损害单跨度问题的性能,从而在QUOREF上获得最先进的结果。此外,将我们的多跨架构集成到现有模型中进一步提高了DROP的性能,这从DROP排行榜上的领先模型中可以明显看出。代码:github

三、模型

  • Span Extraction as Sequence Tagging
  • Decoding Spans from a Tagging

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值