基于中心化的微博热点发现方法

被引:15
作者
蔡淑琴 [1 ]
张静 [1 ]
王旸 [1 ]
马玉涛 [1 ]
林勇 [2 ]
机构
[1] 华中科技大学管理学院
[2] 英国格林威治大学商学院
关键词
热点发现; 微博; 中心化; 元数据模型;
D O I
暂无
中图分类号
G206 [传播理论];
学科分类号
050302 ;
摘要
以解决微博平台海量信息碎片为切入点,结合微博信息文本短小、来源广泛、传播方式多样等特点,设计基于中心化的微博热点的发现机制。通过微博平台开放API记录的结构化元数据信息,设计微博的元数据模型,将微博热点发现看作是原始语料到热点语料簇的生产加工增值过程,设计以数据预处理技术为核心的语料初加工方法,以及基于短文本聚类、基于传播路径与用户行为的中心化深加工方法,构建完整的生产加工过程模型,并通过实例验证理论研究成果。
引用
收藏
页码:874 / 879
页数:6
相关论文
共 6 条
[1]   话题识别与跟踪研究 [J].
李保利 ;
俞士汶 .
计算机工程与应用, 2003, (17) :7-10+109
[2]  
基于内容计算和链接分析的Web话题跟踪方法[J]. 宋丹,林鸿飞,杨志豪.情报学报. 2007 (04)
[3]  
2004年中国社会形势分析与预测[M]. 社会科学文献出版社 , 汝信, 2003
[4]  
Distance-based outliers: algorithms and applications[J] . Edwin M. Knorr,Raymond T. Ng,Vladimir Tucakov.The VLDB Journal . 2000 (3-4)
[5]  
Data clustering[J] . A. K. Jain,M. N. Murty,P. J. Flynn.ACM Computing Surveys (CSUR) . 1999 (3)
[6]  
Merging results from isolated search engines .2 N. Craswell,D. Hawking,P. B. Thistlewaite. Australasian Database Conference . 1999