词云图是根据词出现的频率生成词云,词的字体大小表现了其频率大小。
用wc.generate(text)直接生成词频的方法使用很多,所以不再赘述。
但是对于根据generate_from_frequencies()给定词频如何画词云图的资料找了很久,下面只讲这种方法。
generate_from_frequencies适用于我已知词及其对应的词频是多少,不需要自动生成的情况下。
官方文档说generate_from_frequencies函数的参数是array of tuple,但是我试了很久都不行,最后发现居然应该是dict 字典形式!
即形如:{ word1: fre1, word2: fre2, word3: fre3,......, wordn: fren }
注意词云wordcloud的中文显示,需要特殊处理,在网上看了不少是说加字体路径之类的方法我试了都不行,最后只好采用改变编码的形式才解决好Σ(っ°Д°;)っ:
( • ̀ω•́ )✧还有,示例词云的轮廓背景图由back.jpg给出,如下图:
1、price.csv
第一列是城市名,第二列是词频数值,
csv文件本质上就是以逗号(,)分隔开的txt文件,所以用excel打开形式为:
可参考Windows下安装Python、matplotlib包 及相关https://blog.csdn.net/mikasa3/article/details/78942650
1、numpy
2、pandas
3、wordcloud
4、matplotlib
如下:
1、词云图