基于LDA话题关联的话题演化

被引:18
作者
楚克明
李芳
机构
[1] 上海交通大学电子信息与电气工程学院
关键词
话题探测; 话题关联; 话题演化; 潜在狄里特里分配;
D O I
10.16183/j.cnki.jsjtu.2010.11.005
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
话题演化可以帮助人们快速获取信息和了解趋势.提出了一种挖掘话题随时间变化的方法,通过话题抽取和话题关联实现话题的演化.对不同时间段的文集进行话题的自动抽取,话题数目在不同时间段是可变的;计算相邻时间段中任意2个话题的分布距离和话题的特征向量相似度实现话题的关联.实验结果证明,该方法不但可以描述同一个话题随时间的强度变化,还可以描述新话题的产生,旧话题的消失以及话题内容随时间的演化.
引用
收藏
页码:1496 / 1500
页数:5
相关论文
共 6 条
  • [1] On-Line LDA: Adaptive Topic Models for Mining Text Streams with Applications to Topic Detection and Tracking. L AlSumait,D Barbar‘a,C Domeniconi. IEEE International Conference on Data Mining . 2008
  • [2] Latent Dirichlet allocation. Blei D M,Ng A Y,Jordan M I. Journal of Machine Learning Research . 2003
  • [3] Dynamic topic models. Blei D M,Lafferty J D. Proceedings of the 23rd International Conference onMachine Learning . 2006
  • [4] Topic over time:A non-mark-ov continuous-time model of topical trends. Wang X,,McCallum A. ACMSIGKDD-2006 . 2006
  • [5] Studying the History of Ideas Using Topic Models. David Hall,Daniel Jurafsky,Christopher D Manning. Proceedings of the 2008 Conference on Empirical Methods in Natural Language Processing . 2008
  • [6] Finding scientific topics. Griffiths T L,Steyvers M. Proc.National Academy of Science . 2004