基于语义分析和相似强度的微博热点发现方法

被引:11
作者
吴妮
赵捧未
秦春秀
机构
[1] 西安电子科技大学经济与管理学院
基金
中央高校基本科研业务费专项资金资助;
关键词
潜在语义分析; 相似强度; 二次聚类; 热点发现;
D O I
暂无
中图分类号
G353.1 [情报资料的分析和研究]; G206 [传播理论];
学科分类号
1205 ; 050302 ;
摘要
【目的】通过改进热点发现方法,解决传统方法存在的语义理解不足和聚类算法局限性的问题。【方法】从语义分析角度表示文本,使用信息增益和潜在语义分析方法构建词–文档矩阵;提出二次聚类算法方案,实现热点发现与更新,并使用相似强度的大小选取最优热点。【结果】该热点发现方法的查全率为91.3%,查准率为92.9%,较前人方法的聚类效果有所提高;该热点发现方法也可以更新数据,降低实验复杂度。【局限】实验数据的时间跨度较小,使得更新热点方法的效果不太显著。【结论】本文提出的热点发现方法具有良好的准确性。
引用
收藏
页码:57 / 64
页数:8
相关论文
共 25 条
[1]   基于隐含语义分析的微博话题发现方法 [J].
马雯雯 ;
魏文晗 ;
邓一贵 .
计算机工程与应用, 2014, 50 (01) :96-100
[2]   基于改进CURE算法的微博热点话题发现 [J].
杨长春 ;
周猛 ;
叶施仁 ;
徐小松 .
计算机仿真, 2013, 30 (11) :383-387
[3]   网络论坛热点话题的关注度预测 [J].
张乐 ;
祁超 .
计算机与数字工程, 2013, 41 (05) :772-774+861
[4]   基于潜在语义分析的微博主题挖掘模型研究 [J].
唐晓波 ;
王洪艳 .
图书情报工作, 2012, 56 (24) :114-119
[5]   微博舆情热点分析系统设计研究 [J].
张洋 ;
何楚杰 ;
段俊文 ;
杨春程 .
信息网络安全, 2012, (09) :60-64
[6]   基于特定领域的中文微博热点话题挖掘系统BTopicMiner [J].
李劲 ;
张华 ;
吴浩雄 ;
向军 .
计算机应用, 2012, 32 (08) :2346-2349
[7]  
Finding and evaluating the community structure in semantic peer-to-peer overlay networks.[J]..Science China(Information Sciences).2011, 07
[8]   一种面向网络话题发现的增量文本聚类算法 [J].
殷风景 ;
肖卫东 ;
葛斌 ;
李芳芳 .
计算机应用研究, 2011, 28 (01) :54-57
[9]   周期分类和Single-Pass聚类相结合的话题识别与跟踪方法 [J].
税仪冬 ;
瞿有利 ;
黄厚宽 .
北京交通大学学报, 2009, (05) :85-89
[10]   基于聚类的网络舆情热点发现及分析 [J].
王伟 ;
许鑫 .
现代图书情报技术, 2009, (03) :74-79