把自己发的微博爬下来,用 numpy 和 matplotlib 绘制而成图片,图片中的文字是微博中出现频率最高的词语
1
keisuu 2017-02-17 21:21:49 +08:00
不明觉厉
|
2
zzcchh 2017-02-17 21:28:58 +08:00
哥们,真 666
|
3
qingshi 2017-02-17 22:02:52 +08:00
分词是怎么处理的?
|
5
lzjun OP @kuntang 是用的结巴分词,不过它的局限在在于没法处理 HTML 标签。论英文分词还是 Java 中的 Lucene 牛
|
6
willhunger 2017-02-17 22:59:59 +08:00
挺有想法的
|
7
coolloves 2017-02-18 14:09:24 +08:00 via iPhone
马克下
|
9
mingyun 2017-02-19 13:17:10 +08:00
$ python heart.py
Traceback (most recent call last): File "heart.py", line 9, in <module> from scipy.misc import imread File "d:\python3\lib\site-packages\scipy\__init__.py", line 61, in <module> from numpy._distributor_init import NUMPY_MKL # requires numpy+mkl ImportError: cannot import name 'NUMPY_MKL' 这个怎么办? |