基于改进的在线LDA模型的主题演化分析

被引:14
作者
何建云
陈兴蜀
杜敏
江浩
机构
[1] 四川大学计算机学院
关键词
主题演化; 主题遗传; 主题强度; LDA模型;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
为了解决OLDA模型中的主题混合和新主题不能及时发现的问题,基于OLDA模型提出一种改进的在线LDA模型(improved online LDA,IOLDA)。该模型根据主题强度为每个主题设置不同的遗传度,提出一种新的主题强度度量方法,根据文档-主题分布的集中程度为文档设置不同的权值,该方法可以有效降低宽泛主题的强度得分;利用模型主题对齐的特点,采用Jensen-Shannon距离横向计算话题间的关联。实验结果表明:本文提出的方法能够有效地在线分析主题的演化。
引用
收藏
页码:547 / 553
页数:7
相关论文
共 11 条
[1]   利用LDA的领域新兴主题探测技术综述 [J].
范云满 ;
马建霞 .
现代图书情报技术, 2012, (12) :58-65
[2]  
一种话题演化建模与分析方法[J]. 胡艳丽,白亮,张维明.自动化学报. 2012(10)
[3]   网络舆情中一种基于OLDA的在线话题演化方法 [J].
胡艳丽 ;
白亮 ;
张维明 .
国防科技大学学报, 2012, 34 (01) :150-154
[4]   自然语言处理中主题模型的发展 [J].
徐戈 ;
王厚峰 .
计算机学报, 2011, 34 (08) :1423-1436
[5]   基于LDA话题关联的话题演化 [J].
楚克明 ;
李芳 .
上海交通大学学报, 2010, 44 (11) :1496-1500
[6]   基于主题的自适应、在线网络热点发现方法及新闻推荐系统 [J].
吴永辉 ;
王晓龙 ;
丁宇新 ;
徐军 ;
郭鸿志 .
电子学报, 2010, 38 (11) :2620-2624
[7]   一种基于LDA的在线主题演化挖掘模型 [J].
崔凯 ;
周斌 ;
贾焰 ;
梁政 .
计算机科学, 2010, 37 (11) :156-159+193
[8]   基于LDA话题演化研究方法综述 [J].
单斌 ;
李芳 .
中文信息学报, 2010, (06) :43-49+68
[9]  
统计自然语言处理[M]. 清华大学出版社 , 宗成庆, 2007
[10]  
Multiscale topic tomography .2 Nallapati,R. M,Ditmore,S,Lafferty,J. D. etc. Proceedings of the 13th ACM SIGKDD international conference on Knowledge discovery and data mining . 2007