在这一章中,我们主要介绍的内容有句法理论,基于CFG的线图分析法和CYK算法,以及PCFG算法,并对短语结构标准进行相关介绍。
1. 句法理论
从刚开始的以单词为核心的词法理论,再到现在的句法理论以及后面讲的语义和篇章,自然语言处理的对象逐渐变大,而且越来越难以处理。准确来讲,目前尚且称为合格的,可以成熟的用作商业上的层次,大概也就在句法这一级别,再高的层次上,其普适应用还尚未形成。
句法分析的任务就是识别句子的句法结构。如果用过斯坦福的句法分析工具,应该知道,句法分析出的结果有两种,一种是短语结构分析,另一种是依存句法分析。
在这一讲中,我们主要讲解短语结构分析。短语结构分析的样子大概如下所示:
如果这样可能不容易看,那么使用树状表示,则可以更清楚的看出,它在做什么。