寻找替代品是因为我发现, NLTK 这货源码写得非常之烂,重复代码非常多,有些功能写是写了,但根本没接到用户能调用的 API 上,更不要说一堆传了就根本没用到过的参数。。。文档还奇乱无比。。。
所以,有什么替代品推荐呢?希望能符合以下之一:
大而全,从 Tokenizer/CorpusReader ,到各种 Bracket/Tree 结构定义,从 Parser 到 SentimentAnalyzer ,各个方面都有覆盖到,并且 API 的正交性比较好,能快速用 API 组合出所需要的功能。
小而精,专注一其中某一方面,并且做得比较完美的库。
欢迎同步知乎回答: https://www.zhihu.com/question/51766732
1
linkht 2016-10-28 18:38:30 +08:00 via iPhone
如果考虑商用的 推荐
玻森 nlp 或者 腾讯文智 |
2
shm7 2019-07-01 19:11:21 +08:00 via iPhone
spacy,hanlp snownlp ?
|