自然语言处理、文本处理笔记

Python自然语言处理:nltk库实践
本文介绍了使用Python的nltk库进行自然语言处理的相关步骤,包括解决nltk下载问题、文本搜索、词频计数、定义函数、频率分布和词语搭配分析等,详细讲解了各部分的操作和函数应用。

1 准备工作

  1. 安装nltk packages

  2. 下载和安装nltk资料库

import nltk
nltk.download()

运行上述命令,发现无法下载,但可以在弹出的界面找到默认安装路径

2 解决 nltk.download() 无法下载语料库的问题

解决办法:本地下载packages存入默认安装路径,也可以存在 D 盘下(python会在好几个默认地址自动寻找packages),存入D:/ 地址下

**如果你无法下载,我存在网盘了
链接:https://pan.baidu.com/s/1jgGyPFKksN1uNPTjnTJaFg
提取码:crg6

下载下来,解压,解压完你会得到一个名为 nltk_data 的文件夹
然后存到 nltk.download() 默认的安装地址 或 D 盘下 。如果你存在 D 盘,你的 D 盘下面会有一个叫 nltk_data 的文件夹, 目录下有这些文件
在这里插入图片描述

上述语料库放好以后,重新打开python(pycharm),运行

from nltk.book import *

出现text1 ~ text9,则表示安装成功,可以使用。

3、正式开始

** 正式开始 NLKT(基于pycharn需用 print函数 打出来才能看到结果)**