基于EM-LDA综合模型的电商微博热点话题发现

被引:13
作者
伍万坤 [1 ]
吴清烈 [1 ]
顾锦江 [1 ,2 ]
机构
[1] 东南大学经济管理学院
[2] 江苏经贸职业技术学院信息技术学院
关键词
电商微博; 热点话题挖掘; 哈希标签; EM-LDA;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
【目的】在社交营销环境下,准确且有效地挖掘电商微博中的热点话题。【方法】提出一种综合模型EM-LDA对电商微博文本数据进行主题挖掘。EM-LDA综合模型包含两个子模型:ET-LDA模型和IT-LDA模型,前者对含有哈希标签的微博进行主题挖掘,后者对不含有哈希标签的微博进行主题挖掘。【结果】在确定合适的主题个数之后,标准LDA模型和EM-LDA综合模型均被用来挖掘电商微博文本数据的热点话题,与标准LDA模型相比,EM-LDA综合模型的热词挖掘准确率和有效性均较高,且能提高主题可解释性。【局限】在ET-LDA模型中,未考虑微博联系人之间的关联关系,即模型中未引入用户特征;在IT-LDA模型中没有考虑如何处理那些既是转发式又是对话式的电商微博。【结论】EM-LDA综合模型根据数据的特点,改进了标准LDA模型,能够提升电商微博热点话题识别的准确性。
引用
收藏
页码:33 / 40
页数:8
相关论文
共 10 条
[1]   基于LDA模型和微博热度的热点挖掘 [J].
唐晓波 ;
向坤 .
图书情报工作, 2014, 58 (05) :58-63
[2]   基于LDA的微博文本主题建模方法研究述评 [J].
张培晶 ;
宋蕾 .
图书情报工作, 2012, 56 (24) :120-126
[3]   基于MB-LDA模型的微博主题挖掘 [J].
张晨逸 ;
孙建伶 ;
丁轶群 .
计算机研究与发展, 2011, (10) :1795-1802
[4]   LDA模型在话题追踪中的应用 [J].
张晓艳 ;
王挺 ;
梁晓波 .
计算机科学, 2011, 38(S1) (S1) :136-139+152
[5]  
基于微博的热点话题发现[D]. 朱颖.西南大学. 2014
[6]  
大数据分析[M]. 清华大学出版社 , 王星, 2013
[7]   Learning Author-Topic Models from Text Corpora [J].
Rosen-Zvi, Michal ;
Chemudugunta, Chaitanya ;
Griffiths, Thomas ;
Smyth, Padhraic ;
Steyvers, Mark .
ACM TRANSACTIONS ON INFORMATION SYSTEMS, 2010, 28 (01)
[8]  
A density-based method for adaptive LDA model selection[J] . Juan Cao,Tian Xia,Jintao Li,Yongdong Zhang,Sheng Tang.Neurocomputing . 2008 (7)
[9]  
Labeled LDA:A supervised topic model for credit attribution in multi-labeled corpora .2 Ramage D,Hall D,Nallapati R,et al. Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing . 2009
[10]  
Empirical study of topic modeling in twitter .2 HONG L,DAVISON B D. Proceedings of the 1st Workshop on Social Media Analytics . 2010