基于聚类的网络舆情热点发现及分析

被引:151
作者
王伟
许鑫
机构
[1] 华东师范大学信息学系
关键词
网络舆情; 热点发现; 舆情分析; 文本聚类;
D O I
暂无
中图分类号
G353.1 [情报资料的分析和研究];
学科分类号
120502 [情报学];
摘要
根据对网络舆情分析的需求,构建出基于聚类的网络舆情热点发现及分析系统。通过对样本网页文本的特征提取,构建向量空间模型,使用OPTICS算法获取网页热点簇,根据热点簇特征向量对网页进行二次聚类,从而获取关于舆情的时间演变模式,为相关领域研究提供决策支持。通过二次聚类,提高舆情网页相关度的质量,使网络舆情分析更为准确可靠。
引用
收藏
页码:74 / 79
页数:6
相关论文
共 5 条
[1]
一种基于TFIDF方法的中文关键词抽取算法 [J].
徐文海 ;
温有奎 .
情报理论与实践, 2008, (02) :298-302
[2]
基于文本聚类技术的主题发现 [J].
郭建永 ;
蔡勇 ;
甄艳霞 .
计算机工程与设计, 2008, (06) :1426-1428+1432
[3]
基于主题的Web文档聚类研究 [J].
孙学刚 ;
陈群秀 ;
马亮 .
中文信息学报, 2003, (03) :21-26
[4]
WEB信息检索与分类中的数据采掘研究 [D]. 
李晓黎 .
中国科学院研究生院(计算技术研究所),
2001
[5]
基于向量空间模型的中文文本聚类方法的研究 [D]. 
姚清耘 .
上海交通大学,
2008