共指消解与语篇连贯性解析
立即解锁
发布时间: 2025-09-04 00:39:23 阅读量: 13 订阅数: 36 AIGC 


自然语言处理入门
# 共指消解与语篇连贯性解析
## 1. 共指消解概述
共指消解是自然语言处理中的重要任务,早期方法虽能高精度编码基于实体的特征,但在处理普通名词共指时,难以应对所需的语义问题。例如,在一些复杂语境中,对于具有相同指代对象的不同名词表述,早期方法无法准确识别其共指关系。
后来,监督学习的回归促使提及排名模型取得了一系列进展,并扩展到了神经架构中。具体操作步骤如下:
1. 使用强化学习直接优化共指评估模型,如Clark和Manning(2016a)的研究。
2. 实现从跨度提取开始的端到端共指,如Lee等人(2017b)和Zhang等人(2018)的工作。
3. 设计神经模型以利用全局实体级信息,如Clark和Manning(2016b)、Wiseman等人(2016)以及Lee等人(2018)的研究。
共指消解与实体链接任务相关,二者相互促进。共指消解能为实体链接提供更多可能的表面形式,帮助链接到正确的维基百科页面;反之,实体链接能帮助提高共指消解的效果。例如:
```
[Michael Eisner]1 and [Donald Tsang]2 announced the grand opening of [[Hong Kong]3 Disneyland]4 yesterday. [Eisner]1 thanked [the President]2 and welcomed [fans]5 to [the park]4.
```
将实体链接集成到共指消解中,可以借助百科知识来消除提及的歧义。如Ponzetto和Strube(2006、2007)以及Ratinov和Roth(2012)的研究表明,从维基百科页面提取的属性可用于构建更丰富的共指实体提及模型。近期研究还展示了如何联合进行链接和共指消解,甚至与命名实体标记一起进行,如Hajishirzi等人(2013)、Zheng等人(2013)以及Durrett和Klein(2014)的工作。
在实际文本中,共指关系可能比简单的同一性假设更复杂,存在转喻等情况。例如:
```
a strict interpretation of a policy requires The U.S. to notify foreign dictators of certain coup plots ... Washington rejected the bid ...
```
这里“Washington”转喻地指代“the US”。
## 2. 语篇连贯性
### 2.1 语篇连贯性的概念
语篇连贯性是指语篇中句子之间的关系,使真实语篇与随机句子组合区分开来。真实语篇具有局部连贯性和全局连贯性。
### 2.2 局部连贯性的体现
#### 2.2.1 句子间的系统关系
句子或子句在真实语篇中与附近句子存在系统关系,通过连贯关系连接。例如:
```
(27.1) John took a train from Paris to Istanbul. He likes spinach.(不连贯)
(27.2) Jane took a train from Paris to Istanbul. She had to attend a conference.(连贯,第二句为第一句提供了原因)
```
连贯关系如REASON等,是语篇结构化的重要因素。
#### 2.2.2 基于实体的连贯性
在连贯语篇中,某些实体是突出的,语篇围绕它们展开,不会在多个实体之间频繁切换。例如:
```
(27.3) John wanted to buy a piano for his living room. Jenny also wanted to buy a piano. He went to the piano store. It was nearby. The living room was on the second floor. She didn't find anything she liked. The piano he bought was hard to get up to that floor.(不连贯,突出实体频繁切换)
```
基于实体的连贯性模型通过跟踪语篇中的突出实体来衡量这种连贯性。例如,Centering Theory(Grosz等人,1995)是最具影响力的基于实体连贯性的理论,它跟踪语篇模型中任何时刻突出的实体(突出实体更有可能被代词化或出现在主语或宾语等突出句法位置)。在Centering Theory中,保持相同突出实体的句子转换比频繁切换实体的转换更连贯。实体网格模型(Barzilay和Lapata,2008)是一种常用的模型,实现了Centering Theory框架的一些直觉。
#### 2.2.3 主题连贯性
附近句子通常围绕同一主题,使用相同或相似的词汇来讨论这些主题,表现出词汇衔接的表面属性。例如:
```
(27.4) Before winter I built a chimney, and shingled the sides of my house... I have thus a tight s
```
0
0
复制全文
相关推荐


