基于LDA模型的研究领域热点及趋势分析

被引:14
作者
杨星
李保利
金明举
机构
[1] 河南工业大学信息科学与工程学院
关键词
研究热点; LDA模型; Gibbs抽样; 主题数目; 主题演化;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
随着研究的不断深入以及信息传播手段的进步,与某个研究领域相关的科学文献越来越多,也越来越容易得到,然而要阅读和分析这些数以千计的文献,仅凭人力已经难于实现对该领域研究重点、研究热点以及趋势进行全面系统地分析。鉴于此,提出一种基于LDA模型对某研究领域在一定时期内的热点及趋势进行自动识别的方法。该方法利用Gibbs抽样计算模型参数,获取领域热点主题以及热点词语,通过按时间后离散的主题演化方法分析热点主题在时间轴上的强度演化。以中文信息处理领域为例,通过对《中文信息学报》2001—2010十年间发表的学术论文进行分析,自动获取中文信息处理领域十年内的研究热点以及热点主题在时间轴上的演化趋势。实验结果初步证明了该方法的有效性。
引用
收藏
页码:66 / 69+74 +74
页数:5
相关论文
共 6 条