共 7 条
基于微博转发集的微博过滤研究
被引:3
作者:
孙建旺
吕学强
郭跇秀
机构:
[1] 北京信息科技大学网络文化与数字传播北京市重点实验室
基金:
北京市自然科学基金;
关键词:
微博转发集;
三元组;
相似度;
微博权重;
过滤;
D O I:
10.16508/j.cnki.11-5866/n.2013.03.006
中图分类号:
TP393.092 [];
学科分类号:
080402 ;
摘要:
针对微博文本的特点,提出了基于微博转发集的过滤方法。借助微博转发集,构建<子串,频次,转发时间差>三元组,形成用户需求模板;以知网为知识源计算微博文本与用户需求模板的相似度,抽取用户感兴趣的内容形成候选文本集;根据提出的基于三元组的微博权重计算方法,对候选集做进一步筛选,最终得到用户需求的微博文本。实验结果表明,基于微博转发集的过滤方法在滤准率和滤全率2个指标上比基于关键词与KNN的方法有了显著的提高。
引用
收藏
页码:27 / 33
页数:7
相关论文