基于LDA模型的评论热点挖掘:原理与实现

被引:19
作者
余传明
张小青
陈雷
机构
[1] 上海理工大学管理学院
关键词
热点话题识别; 热点挖掘; 用户评论; 模型;
D O I
10.16353/j.cnki.1000-7490.2010.05.006
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
本文提出了潜在狄利克雷分布模型与自然语言处理技术相结合的一种挖掘用户评论热点的方法。为验证该方法的有效性,以22157篇餐馆评论为样本,利用Gibbs抽样计算模型参数,获取了评论热点及相应的热点词语。实验获得的9个主题内容较好地反映了餐馆评论中的热点,与现实生活中用户所关心的餐饮热点基本吻合,表明该模型具有较好的热点识别效果。
引用
收藏
页码:103 / 106
页数:4
相关论文
共 6 条