微博主题发现研究方法述评

被引:27
作者
梁晓贺
田儒雅
吴蕾
张学福
机构
[1] 中国农业科学院农业信息研究所
关键词
微博; 主题发现; 文本聚类; 主题模型;
D O I
暂无
中图分类号
G206 [传播理论]; G254 [文献标引与编目];
学科分类号
050302 [传播学];
摘要
[目的/意义]对现有微博主题发现的研究文献进行全面的梳理和评述,为研究人员深入开展相关研究提供借鉴。[方法/过程]针对传统的主题发现的基本原理和主要研究方法,分析微博文本的组织特征,从基于短文本特征和基于非文本特征的这两个角度对微博主题发现方法进行梳理,并对两类方法进行详细的阐述及特点分析,最后对微博主题发现研究的发展趋势进行展望。[结果/结论]目前微博主题发现的研究还处于探索阶段,未来应该继续深化理论探索、创新研究方法。
引用
收藏
页码:141 / 148
页数:8
相关论文
共 10 条
[1]
基于向量空间的文本聚类方法与实现 [D]. 
邬启为 .
北京交通大学,
2014
[2]
Text clustering using frequent itemsets [J].
Zhang, Wen ;
Yoshida, Taketoshi ;
Tang, Xijin ;
Wang, Qing .
KNOWLEDGE-BASED SYSTEMS, 2010, 23 (05) :379-388
[3]
Text document clustering based on frequent word meaning sequences.[J].Yanjun Li;Soon M. Chung;John D. Holt.Data & Knowledge Engineering.2007, 1
[4]
Topic discovery based on text mining techniques.[J].Aurora Pons-Porrata;Rafael Berlanga-Llavori;José Ruiz-Shulcloper.Information Processing and Management.2006, 3
[5]
Hierarchical clustering algorithms for document datasets [J].
Zhao, Y ;
Karypis, G .
DATA MINING AND KNOWLEDGE DISCOVERY, 2005, 10 (02) :141-168
[6]
Rock: A robust clustering algorithm for categorical attributes [J].
Guha, S ;
Rastogi, R ;
Shim, K .
INFORMATION SYSTEMS, 2000, 25 (05) :345-366
[7]
基于频繁项集的海量短文本聚类与主题抽取 [J].
彭敏 ;
黄佳佳 ;
朱佳晖 ;
黄济民 ;
刘纪平 .
计算机研究与发展, 2015, (09) :1941-1953
[8]
基于LDA模型和微博热度的热点挖掘 [J].
唐晓波 ;
向坤 .
图书情报工作, 2014, (05) :58-63
[9]
基于隐主题分析的中文微博话题发现 [J].
史剑虹 ;
陈兴蜀 ;
王文贤 .
计算机应用研究, 2014, 31 (03) :700-704
[10]
一种基于密度的自适应最优LDA模型选择方法 [J].
曹娟 ;
张勇东 ;
李锦涛 ;
唐胜 .
计算机学报, 2008, (10) :1780-1787