python wordcloud 词云

python wordcloud 词云

词云是对文本数据中出现频率较高的“关键词”在视觉上的突出呈现,形成关键词的渲染形成类似云一样的彩色图片,从而一眼就可以领略文本数据的主要表达意思。
而python在生成词云上也是非常的方便。

需要安装的包

使用pip安装下述包

  • jieba:一个国人开发的优秀的分词工具
  • wordcloud:词云的核心包
  • matplotlibPILnumpy用于处理和绘制图像

wordcloud安装的问题

我是windows下安装,由于缺乏VS编译器在pip install时无法正确安装wordcloud。

  1. 此时想用minGW去编译,发现python3.5.2的版本在windows下不支持minGW。。。
  2. 于是转战linux平台,发现安装还是出问题。提示没有python-tk。即tkinter,一个python默认使用的GUI平台。此平台在windows下是随安装包可选安装的,但linux下并未安装。于是使用apt来安装。之后就开开心心的安装成功了。

    注意使用的python版本

    sudo apt-get Install python3-tk
    

代码

生成词云的大致过程可分为:

  • 读取和处理文本
  • 读取背景
  • 设置参数并生成词云
  • 绘图

具体使用请见下述源码

import jieba
import wordcloud
import matplotlib.pyplot as plt
import PIL
import numpy as np

# Read raw file
with open('word.txt', 'r') as f:
    raw_txt = f.read()

# Read background pic
pic = PIL.Image.open("backgroud.jpg")
pic_mask = np.array(pic)

# word split
raw_txt = jieba.cut(raw_txt, cut_all=True)
raw_txt = ' '.join(raw_txt) # split word with space

# Make word cloud, The parameters setting please see help()
wc = wordcloud.WordCloud()
wc.font_path        = 'msyh.ttf' # microsoft yahei
wc.width            = 1200
wc.height           = 800
wc.max_word         = 2000
wc.mask             = pic_mask
wc.radom_state      = 42
wc.max_font_size    = 84
wc.min_font_size    = 16
wc.background_color = "white"
word_cloud = wc.generate(raw_txt)

# plot word cloud
plt.imshow(word_cloud)
plt.axis('off')
plt.figure()

# plot word cloud with re-color by mask
img_color   = wordcloud.ImageColorGenerator(pic_mask)
img_recolor = word_cloud.recolor(color_func=img_color)
plt.imshow(img_recolor)
plt.axis("off")
plt.show()

输出结果

由于背景图片没有处理过,所以看上去有些凌乱。但还是能够看出大致轮廓和相似的色彩。另外,大家看的出用于词云分析的是什么文章吗?:)

词云图:

这里写图片描述

结合原图颜色处理后的词云图:

这里写图片描述

原图:

原图

参考


版权声明:本文为mint_ying原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/mint_ying/article/details/78817126

智能推荐

python词云 wordcloud 简单实例 入门

构建词云的方法很多, 但是个人觉得python的wordcloud包功能最为强大,不仅可以去停用词还可以自定义图片. 官网: https://amueller.github.io/word_cloud/ github:https://github.com/amueller/word_cloud 安装 分词 首先需要进行分词,也就是将一个句子分割成一个个的词语,我这里使用的是jieba分词, 数据是...

python-wordcloud词云练习

python-wordcloud词云练习 主要内容: 1、配置环境(win 7(64位) + pycharm + anaconda(python3.5)) 2、如何生成词云? 说在前面,以下内容资料已打包,网址为:https://pan.baidu.com/s/1WzrE7oNsyVTlv2LX93A8lQ ,密码:r78n 具体内容: 一、环境的配置 1、安装wordcloud &nb...

python3+wordcloud词云展示

wordcloud是基于Python的词云生成类库,很好用,而且功能强大。  github:https://github.com/amueller/word_cloud  官方地址:https://amueller.github.io/word_cloud/ 先看一下WordCloud中的一些的参数 font_path=None, #字体 默认是none 在英文词云中可以不用设...

【Python】实现词云效果 wordcloud

1 首先安装相关的包 pip install wordcloud jieba imageio 2 代码 3 效果 可以从外部的.txt文件读取内容并抓取重点...

Python使用wordcloud生成词云

设置PIP国内源 安装wordcloud和matplotlib 测试样例 图片为背景生成词云 背景图 结果图...

猜你喜欢

Python词云库wordcloud 显示中文 !!!

背景: wordcloud是基于Python开发的词云生成库,功能强大使用简单。 github地址:https://github.com/amueller/word_cloud wordcloud默认是不支持显示中文的,中文会被显示成方框。 安装: 方法一: 方法二: 下载.whl文件http://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud 改后缀为...

python使用wordcloud创建词云

最近对词云比较感兴趣,所以简单学习了一下,希望这篇文章能对同样想要学习词云的朋友有所帮助。本文用的是python实现词云的创建,当然也可以用词云生成器来生成。 模块安装 这里需要用到的模块有:wordcloud ,jieba,PIL,numpy,matplotlib 我电脑已安装pip工具:pip install ‘xxx’ numpy安装详细内容请看这篇文章:http:/...

Python使用wordcloud做词云

一 先是安装Wordcloud模块,jieba模块,使用 pip install 模块名字 二  如果你安装好了之后,先是按照 网上的代码来敲的话,毫无疑问你会遇到这个问题 三  再然后就是解决这个问题   在WordCloud安装的目录下找到WordCloud.py文件,对源码进行修改。   编辑wordcloud.py,找到FONT_PATH,将Droi...

Linux环境下配置和安装hadoop及hadoop集群搭建(VMware)

文章目录 一、安装准备 二、hadoop的配置 1.首先配置hadoop-env.sh 2.配置core-site.xml 3.配置hdfs-site.xml 4.配置mapred-site.xml 5.配置yarn-site.xml 6.配置slaves 7.配置hadoop环境变量 三、格式化HDFS 四、启动hadoop 五、集群搭建 1.克隆虚拟机 2.配置免密登录 3.修改主机器的配置文...

使用QProcess打开和关闭第三方应用,比如CMD

使用QProcess打开和关闭第三方应用,比如CMD 注意: 很多教程不一定是对的,但我这篇绝对是对的,因为我踩坑过啊。 为了节省时间,直接上图、上代码,so easy! 重要事情说3遍: 杀死进程,一定要加/F 和 /T 杀死进程,一定要加/F 和 /T 杀死进程,一定要加/F 和 /T 开始 验证下,打开任务管理器就能看到 总结 从上面看,是不是很简单,taskkill不知道是啥,是windo...