主题模型的一些优点

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 3571 天前的主题，其中的信息可能已经有所发展或是发生改变。

1）衡量文档之间的语义相似性。得到文档概率分布，我们通过距离公式（KL距离）来计算两篇文档的语义距离。
2）解决多义性问题。例如：对于多义词 ‘苹果’ ，通过‘词语-主题’ 概率分步，通过主题的匹配计算其与其他词的相似度，
确定词义
3）排除文档中的噪音。丢弃次要主题。噪音一般存在于次要主题中。
4）无监督，不需要标注
5）语言无关性。

目前尚无回复

语义文档多义性