一种融合用户关系的自适应微博话题跟踪方法

被引:23
作者
柏文言 [1 ,2 ]
张闯 [1 ]
徐克付 [1 ]
张志明 [3 ]
机构
[1] 中国科学院信息工程研究所
[2] 北京邮电大学计算机学院
[3] 北京英孚泰克信息技术股份有限公司
关键词
微博; 话题跟踪; 自适应; 用户关系; 极坐标; K-means算法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
针对微博口语化、文本短小等特点以及现有研究的不足,本文提出了一种融合用户关系的自适应微博话题跟踪方法.首先,在当前跟踪的时间窗内,推文被映射到特征空间,并作为候选推文集合.然后,针对推文的分布特点以及话题跟踪的目的,变换推文特征空间.在此基础上,利用改进的K-means聚类算法对候选推文集合进行二元聚类,从而划分出相关推文集合,即当前话题目标模型.本文通过Twitter平台获取数据进行实验,实验结果表明,该方法能够实时地跟踪话题热度的变化以及焦点的演变,并提高了微博中话题跟踪的稳定性.该方法为用户推荐、舆情分析等领域提供了有效的支撑.
引用
收藏
页码:1375 / 1381
页数:7
相关论文
共 9 条
[1]
基于隐主题分析和文本聚类的微博客中新闻话题的发现 [J].
路荣 ;
项亮 ;
刘明荣 ;
杨青 .
模式识别与人工智能, 2012, 25 (03) :382-387
[2]
基于语义的微博短信息分类 [J].
崔争艳 .
现代计算机(专业版), 2010, (08) :18-20+24
[3]
基于语义域语言模型的中文话题关联检测 [J].
洪宇 ;
张宇 ;
范基礼 ;
刘挺 ;
李生 .
软件学报, 2008, (09) :2265-2275
[4]
微博话题追踪方法研究与设计 [D]. 
王慧 .
北京交通大学,
2014
[5]
微博话题追踪系统的研究与实现 [D]. 
刘彦伟 .
北京交通大学,
2013
[6]
微博突发话题检测、跟踪与传播预测技术研究 [D]. 
郝建波 .
哈尔滨工程大学,
2013
[7]
微博客话题追踪及实时检索的相关研究 [D]. 
史存会 .
大连理工大学,
2011
[8]
中文微博客热点话题检测与跟踪技术研究 [D]. 
孙胜平 .
北京交通大学,
2011
[9]
Enriching short text representation in microblog for clustering [J].
Tang, Jiliang ;
Wang, Xufei ;
Gao, Huiji ;
Hu, Xia ;
Liu, Huan .
FRONTIERS OF COMPUTER SCIENCE, 2012, 6 (01) :88-101