Python实例: wordcloud 政府工作报告词云

本文详细介绍如何使用Python的jieba和wordcloud库生成词云,包括基本步骤如读取文件、分词整理,以及如何设置和输出词云。还介绍了如何通过调整参数实现任意图形的词云,提供代码示例。

基本思路

  • 步骤1:读取文件、分词整理
  • 步骤2:设置并输出词云
  • 步骤3:观察结果,优化迭代
import jieba
import wordcloud
f = open(r"C:\Users\锦樽\Desktop\新时代中国特色社会主义.txt", "r", encoding="utf-8")
t = f.read()
f.close()
ls = jieba.lcut(t)
txt = " ".join(ls)
w = wordcloud.WordCloud( \
    width=1000, height=700, \
    background_color="white",
    font_path="msyh.ttc",
    max_words=40
)
w.generate(txt)
w.to_file("grwordcloud1.png")

在这里插入图片描述

#任意规则词云
import jieba
import wordcloud
from imageio import imread # 这个库 可以读取图片,并把图片变成图片文件表达的变量
mask = imread("per.jpeg") # 用mask 变量表达 per.jpeg 变量
f = open(r"C:\Users\锦樽\Desktop\新时代中国特色社会主义.txt", "r", encoding="utf-8")
t = f.read()
f.close()
ls = jieba.lcut(t)
txt = " ".join(ls)
w = wordcloud.WordCloud( font_path = "msyh.ttc",mask = mask,
width = 1000, height = 700, background_color = "white") # 添加maks参数
w.generate(txt)
w.to_file("grwordcloud2.png")

在这里插入图片描述
比较两个代码,只是修改了三个地方就可以表示任意图形的词云。
imread 方法 就是把图片容量作为词云的容量。
import jieba 、 import wordcloud 这两个库不太明白的 可以点击下方链接了解:
Python——有趣神奇的wordcloud 库,词云统计
Python—— jieba中文分词库 + 文本中文的名字词频统计,有意思没?

扩展能力

  • 了解wordcloud更多参数,扩展词云能力
  • 特色词云:设计一款属于自己的特色词云风格
  • 更多文件:用更多文件练习词云生成
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

唐樽

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值