面向微博热点话题发现的多标签传播聚类方法研究

被引:31
作者
陈羽中
方明月
郭文忠
机构
[1] 福州大学 福建省网络计算与智能信息处理重点实验室
[2] 福州大学 数学与计算机科学学院
关键词
微博; 热点话题发现; 老化理论; 热词抽取; 多标签传播;
D O I
10.16451/j.cnki.issn1003-6059.201501001
中图分类号
TP393.092 []; TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
微博热点话题发现是目前的研究热点.针对传统热词抽取方法难以适用于微博数据的问题,提出一种基于老化理论的词生命值计算模型用于热词抽取,并基于热词间的相关性构建词共现网络;针对传统的词聚类算法不能较好地解决话题间存在重叠热词以及时间效率不佳的问题,引入多标签传播思想,设计一种接近线性时间复杂度的多标签传播聚类算法(TCMLPA)用于词共现网络的热词聚类,获得热点话题集.实验结果表明,词生命值计算模型能够有效过滤噪声并提取热词,TCMLPA算法则能够在保证聚类结果稳定性的情况下,有效提高热点话题发现的精度和效率.
引用
收藏
页码:1 / 10
页数:10
相关论文
共 6 条
[1]
基于概念和语义网络的近似网页检测算法 [J].
曹玉娟 ;
牛振东 ;
赵堃 ;
彭学平 .
软件学报, 2011, 22 (08) :1816-1826
[2]
基于词聚类的热点话题检测算法 [J].
龙志祎 ;
程葳 .
计算机工程与设计, 2011, 32 (06) :2214-2217
[3]
网络文本主题词的提取与组织研究 [J].
曾依灵 ;
许洪波 ;
白硕 .
中文信息学报, 2008, (03) :64-70+80
[4]
流量内容词语相关度的网络热点话题提取 [J].
周亚东 ;
孙钦东 ;
管晓宏 ;
李卫 ;
陶敬 .
西安交通大学学报, 2007, (10) :1142-1145+1150
[5]
Overlapping community detection in networks.[J].Jierui Xie;Stephen Kelley;Boleslaw K. Szymanski.ACM Computing Surveys (CSUR).2013, 4
[6]
Finding overlapping communities in networks by label propagation.[J].Steve Gregory.New Journal of Physics.2010, 10