基于LDA主题关联过滤的领域主题演化研究

被引:27
作者
秦晓慧 [1 ,2 ]
乐小虬 [1 ]
机构
[1] 不详
[2] 中国科学院文献情报中心
[3] 不详
[4] 中国科学院大学
[5] 不详
关键词
主题关联; 主题演化; 主题模型; LDA;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
【目的】发现领域文献中主题的新生、消亡、继承、分裂和合并的演化轨迹。【方法】根据文献出版时间划分多个时间窗口,通过LDA主题模型识别各个时间窗口中的主题;利用主题关联(Topic Association)过滤规则确定相邻时间窗口主题间的演化关系;形成连续时间段内主题新生、消亡、继承、分裂和合并的演化轨迹。【结果】在保证主题延续性的条件下,更准确地识别主题的新生、消亡、继承、分裂和合并的演化类型。【局限】固定的时间窗口,未考虑主题演化周期的多样性。【结论】该方法可以有效降低LDA主题模型中相似度较小主题的干扰,提升主题演化关系识别的准确性。
引用
收藏
页码:18 / 25
页数:8
相关论文
共 13 条
[1]   基于动态LDA主题模型的内容主题挖掘与演化 [J].
胡吉明 ;
陈果 .
图书情报工作, 2014, 58 (02) :138-142
[2]   作者主题演化模型及其在研究兴趣演化分析中的应用 [J].
史庆伟 ;
乔晓东 ;
徐硕 ;
农国武 .
情报学报, 2013, 32 (09) :912-919
[3]   基于潜在狄利克雷分配模型的微博主题演化分析 [J].
唐晓波 ;
王洪艳 .
情报学报, 2013, (03) :281-287
[4]   基于LDA的主题演化研究附视频 [J].
李勇 ;
安新颖 .
医学信息学杂志, 2013, (02) :57-61
[5]   利用LDA的领域新兴主题探测技术综述 [J].
范云满 ;
马建霞 .
现代图书情报技术, 2012, (12) :58-65
[6]   基于LDA模型和话题过滤的研究主题演化分析 [J].
李保利 ;
杨星 .
小型微型计算机系统, 2012, 33 (12) :2738-2743
[7]  
一种话题演化建模与分析方法[J]. 胡艳丽,白亮,张维明.自动化学报. 2012(10)
[8]   科技文献话题演化研究 [J].
贺亮 ;
李芳 .
现代图书情报技术, 2012, (04) :61-67
[9]   基于LDA模型的新闻话题的演化 [J].
楚克明 ;
李芳 .
计算机应用与软件, 2011, 28 (04) :4-7+26
[10]   一种基于LDA的在线主题演化挖掘模型 [J].
崔凯 ;
周斌 ;
贾焰 ;
梁政 .
计算机科学, 2010, 37 (11) :156-159+193