基于LDA的网络评论主题发现研究

被引:42
作者
阮光册
机构
[1] 华东师范大学商学院信息学系
关键词
网络评论; 主题发现; 网络信息分析; LDA(latent Dirichlet allocation); 语义分析; 文本挖掘;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
网络用户评论的主题发现研究是Web2.0时代信息分析的重要方式,如何从冗杂的用户评论中分析出有价值的信息是研究的热点。针对网络用户评论信息内容短、信息量少的特征,提出基于LDA(latent Dirichlet allocation)主题发现模型结合HowNet知识库进行信息分析的方法,对网络评论进行主题发现的研究。首先通过评论文本的词性标注、语义分析,形成语料库,然后利用HowNet对语料库中的词项进行语义相似度的计算,完成语义去重、合并,最后通过LDA主题模型将用户评论的内容映射到主题上,实现对用户评论信息主题的发现。
引用
收藏
页码:161 / 164
页数:4
相关论文
共 4 条
  • [1] 用户评论中的标签抽取以及排序
    李丕绩
    马军
    张冬梅
    韩晓晖
    [J]. 中文信息学报, 2012, 26 (05) : 14 - 19+45
  • [2] 基于Labeled-LDA模型的文本分类新算法
    李文波
    孙乐
    张大鲲
    [J]. 计算机学报, 2008, (04) : 620 - 627
  • [3] 基于概率图模型的科研文献主题演化研究[J]. 王金龙,徐从富,耿雪玉.情报学报. 2009 (03)
  • [4] 基于概率主题模型的文献知识挖掘[J]. 王萍.情报学报. 2011 (06)