27、自然语言处理:NLTK文本分析实战

自然语言处理:NLTK文本分析实战

1. 上下文搜索与同义词查找

在NLTK中,除了常规的单词搜索,还可以进行上下文搜索。上下文搜索即查找目标单词的前一个和后一个单词。可以使用 common_contexts() 函数来实现这一功能。

text.common_contexts(['Stage'])

输出结果如下:

the_ bloody_: the_,

理解了NLTK在搜索时对单词及其上下文的概念后,就很容易理解同义词的概念。即具有相同上下文的所有单词都可能是同义词。要搜索与被搜索单词具有相同上下文的所有单词,可以使用 similar() 函数。

text.similar('Stage')

输出结果如下:

fogge ayre bleeding reuolt good shew heeles skie other sea feare
consequence heart braine seruice herbenger lady round deed doore

这些搜索方法对于不熟悉文本处理和分析的人来说可能有些奇怪,但它们非常适合分析文本中单词的含义。

2. 单词频率分析

文本分析中最简单和最基本的示例之一是计算文本中单词的频率。NLTK

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值