1
keller 2014-02-12 17:16:37 +08:00
关系到分词算法和语意分析
具体能够直接应用的API应该还没有 |
2
9hills 2014-02-12 17:21:09 +08:00
没有这么高级的API。。
|
3
RangerWolf 2014-02-12 17:21:24 +08:00
我只知道有一些api 能自动的检测是不是垃圾评论
比如 wordpress 自带的那个 名字一下不记得了 |
4
shikailun 2014-02-12 17:31:01 +08:00
如果分类事先确定的话,贝叶斯分类算法貌似可以实现楼主的需求
|
5
y051313 2014-02-12 17:32:45 +08:00
有,但是收费的
我们公司在用的是Automony提供的http://www.autonomy.com.cn/content/Functionality/idol-functionality-categorization/index.zh.html,需要人工写规则,然后大批量文本做training |
6
shikailun 2014-02-12 17:40:18 +08:00
朴素贝叶斯在文本分类中的应用 http://yzmduncan.iteye.com/blog/1930695
|
7
txlty 2014-02-12 17:44:56 +08:00 1
这东西应该很值钱的。可以直接用于做垃圾站赚钱。
|
9
cctvsmg 2014-02-12 18:07:45 +08:00
jieba分词,自己做个词库
|
11
YouXia 2014-02-12 18:55:50 +08:00 via Android
@shinebay 卖服务就可以啊。大公司养这么多科学家,比如做数据挖掘,文本分类,聚类等等相关的,就是为了解决此或类似的问题啊。小公司没有这么多人力和财力,如果需要用到这种东西,可能会考虑买别人的服务了。
|
12
crossmaya 2014-02-12 21:39:34 +08:00
mark一下。
|
14
y051313 2014-02-12 21:59:49 +08:00 1
具体价格我不是很清楚,是global负责的,他们提过一句这个是按照用量来收费的。
我们用到这个CatEngine的是一个多语言数据库,这个程序实现了对全部13种语言文档的自动分类识别。 |