文章目录
课程视频连接:《 深度学习与自然语言处理(6)》
——————————————————————————
对于英文来说,并没有牵扯到分词的问题,因此,这里第一个自然语言处理任务为句法分析。
句法分析的目的是分析出句子的结构,基于词的意思,对于整个句子有一个更深的理解。
1. 原理
1.1. 为什么需要句子结构?
单单依靠句子中一个个的词,是不能够准确理解句子的含义。人类的语言非常复杂和难以理解,不同的单词的组合会有不同的含义。尤其是长句子,有很多的从句和修饰,这就使得其句子的意思可能有多种理解角度。
1.2 如何理解句子结构?
从句子成分上讲,我们可能会有主谓宾定状补表等成分,但是单纯的成分表示并不能从全局上对于句子结构有一个清晰的认识。因此,基于最早于公元前4世纪的印度语言学家Panini对语义、句法和形态依存的分类研究。现代的句法分析逐渐分为两个方向,成分句法分析和依存句法分析。根据hankcs的说法;这并不是随机选择,而是由于前者的优势。90年代的句法分析论文99%都是短语结构树,但后来人们发现依存句法树标注简单,parser准确率高,所以后来(特别是最近十年)基本上就是依存句法