龙空技术网

利用python的WordCloud库制作词云

麦序人间 57

前言:

此时小伙伴们对“python如何安装wordcloud库”大约比较关心,同学们都需要学习一些“python如何安装wordcloud库”的相关资讯。那么小编也在网上网罗了一些有关“python如何安装wordcloud库””的相关文章,希望小伙伴们能喜欢,我们快快来学习一下吧!

WordCloud库是python的一个第三方库,主要以词语为基本单位,进行词云的展示,词频越大,在显示出来的词云中词语就越大。本文主要记录如何去使用WordCloud读取文件生成词云。

实验环境:Win10+PyCharm+Anaconda3

语言:Python

程序输入:csv/txt文件名

程序输出:词云图

首先要安装wordcloud库,以前一直用的是“pip install 库名”,有时候在安装很多库的时候会出现下载很慢的情况,最后自己查资料摸索出了使用国内镜像去安装第三方库的方法,发现很实用。以安装wordcloud为例,在DOS中输入以下代码即可,以后要安装其他第三方库,只需要更改库名就可以:

pip install -i wordcloud

一、wordcloud的基本使用

安装好第三方库之后,就可以使用了。wordcloud库把词云当作一个WordCloud对象。所以首先要想使用wordcloud,分为三步:

创建对象加载文本(使用generate()方法,括号里面是文本参数)输出文件(使用to_file()方法,括号里面是文件名称)

以下为一个基本的例子(暂不考虑中文):

创建对象:wc= wordcloud.WordCloud()加载文本:wc.generate("Choose a life of action, not one of ostentation.")输出文件:wc.to_file("./picture/1.png")

通过以上三行代码,一个基本的词云就生成了,如下图所示。

看起来还不错,哈哈哈,那就再试试中文,同样的代码,将generate方法中的语句换成汉字“今天是个好日子”,生成的词云如下图所示。

出现这种情况,是因为没有设置字体,个人觉得这开发语言是老外发明的,他无法理解我大天朝的文化,那怎么去解决呢?只需要去加入字体的参数就可以。这里主要记录以下各个参数的用途,如下图所示:(图片来源于网络)

按照上面的参数,先设置一下字体就可以显示出来了。下图为代码和生成的词云。

问题又出来了,wordcloud应该以词语的形式来展示云图,为什么我们显示出来的是一个句子呢?这是因为没有将句子进行切分,个人还是觉得老外不懂中文,才会这么麻烦。哈哈,怎么办呢,使用jieba分词就可以解决这个问题。以下为代码及词云。

至此已经可以使用wordcloud去画词云了。总结以下:中文画词云一定要设置字体参数,先用jieba切词,再画图。

二、wordcloud的高级使用

以上是wordcloud的基本使用,画出来的图不怎么好看,以下主要是通过读取txt文件或者csv文件生成好看且带有形状的词云。

首先我们去网上下载一张自己喜欢的图片,以白底为主,比如我选择了如下图片

通过读取文件生成有形状的词云主要分为以下四步:

读取文件jieba切分中文读取准备好的图片,用wordcloud生成词云显示(保存)词云

读取文件:

text=open("./Data/微博评论数据女排20191230.csv",'r',encoding='UTF-8').read()

jieba分词:

words = jieba.cut(text)results = " ".join(words)

读取准备好的图片,用wordcloud生成词云:

显示(保存)词云:

通过以上的操作,就可以生成词云了,最后的结果如下图所示:

以上就是wordcloud的基本使用。

GitHub地址:

古人崇尚“大隐隐于市”,低调于繁华都市,独善其身。依我说,闲逸潇洒的生活不一定非到山野林泉不可。如果能在市朝中排除嘈杂的干扰,做自己喜欢的事,那也算是找到了一份宁静。

标签: #python如何安装wordcloud库