学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于聚类的网络舆情热点发现及分析
被引:151
作者
:
论文数:
引用数:
h-index:
机构:
王伟
论文数:
引用数:
h-index:
机构:
许鑫
机构
:
[1]
华东师范大学信息学系
来源
:
现代图书情报技术
|
2009年
/ 03期
关键词
:
网络舆情;
热点发现;
舆情分析;
文本聚类;
D O I
:
暂无
中图分类号
:
G353.1 [情报资料的分析和研究];
学科分类号
:
120502
[情报学]
;
摘要
:
根据对网络舆情分析的需求,构建出基于聚类的网络舆情热点发现及分析系统。通过对样本网页文本的特征提取,构建向量空间模型,使用OPTICS算法获取网页热点簇,根据热点簇特征向量对网页进行二次聚类,从而获取关于舆情的时间演变模式,为相关领域研究提供决策支持。通过二次聚类,提高舆情网页相关度的质量,使网络舆情分析更为准确可靠。
引用
收藏
页码:74 / 79
页数:6
相关论文
共 5 条
[1]
一种基于TFIDF方法的中文关键词抽取算法
[J].
徐文海
论文数:
0
引用数:
0
h-index:
0
机构:
西安电子科技大学经济管理学院
徐文海
;
论文数:
引用数:
h-index:
机构:
温有奎
.
情报理论与实践,
2008,
(02)
:298
-302
[2]
基于文本聚类技术的主题发现
[J].
论文数:
引用数:
h-index:
机构:
郭建永
;
蔡勇
论文数:
0
引用数:
0
h-index:
0
机构:
江南大学信息工程学院
蔡勇
;
论文数:
引用数:
h-index:
机构:
甄艳霞
.
计算机工程与设计,
2008,
(06)
:1426
-1428+1432
[3]
基于主题的Web文档聚类研究
[J].
孙学刚
论文数:
0
引用数:
0
h-index:
0
机构:
智能技术与系统国家重点实验室清华大学计算机科学与技术系
孙学刚
;
陈群秀
论文数:
0
引用数:
0
h-index:
0
机构:
智能技术与系统国家重点实验室清华大学计算机科学与技术系
陈群秀
;
马亮
论文数:
0
引用数:
0
h-index:
0
机构:
智能技术与系统国家重点实验室清华大学计算机科学与技术系
马亮
.
中文信息学报,
2003,
(03)
:21
-26
[4]
WEB信息检索与分类中的数据采掘研究
[D].
李晓黎
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院研究生院(计算技术研究所)
中国科学院研究生院(计算技术研究所)
李晓黎
.
中国科学院研究生院(计算技术研究所),
2001
[5]
基于向量空间模型的中文文本聚类方法的研究
[D].
论文数:
引用数:
h-index:
机构:
姚清耘
.
上海交通大学,
2008
←
1
→
共 5 条
[1]
一种基于TFIDF方法的中文关键词抽取算法
[J].
徐文海
论文数:
0
引用数:
0
h-index:
0
机构:
西安电子科技大学经济管理学院
徐文海
;
论文数:
引用数:
h-index:
机构:
温有奎
.
情报理论与实践,
2008,
(02)
:298
-302
[2]
基于文本聚类技术的主题发现
[J].
论文数:
引用数:
h-index:
机构:
郭建永
;
蔡勇
论文数:
0
引用数:
0
h-index:
0
机构:
江南大学信息工程学院
蔡勇
;
论文数:
引用数:
h-index:
机构:
甄艳霞
.
计算机工程与设计,
2008,
(06)
:1426
-1428+1432
[3]
基于主题的Web文档聚类研究
[J].
孙学刚
论文数:
0
引用数:
0
h-index:
0
机构:
智能技术与系统国家重点实验室清华大学计算机科学与技术系
孙学刚
;
陈群秀
论文数:
0
引用数:
0
h-index:
0
机构:
智能技术与系统国家重点实验室清华大学计算机科学与技术系
陈群秀
;
马亮
论文数:
0
引用数:
0
h-index:
0
机构:
智能技术与系统国家重点实验室清华大学计算机科学与技术系
马亮
.
中文信息学报,
2003,
(03)
:21
-26
[4]
WEB信息检索与分类中的数据采掘研究
[D].
李晓黎
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院研究生院(计算技术研究所)
中国科学院研究生院(计算技术研究所)
李晓黎
.
中国科学院研究生院(计算技术研究所),
2001
[5]
基于向量空间模型的中文文本聚类方法的研究
[D].
论文数:
引用数:
h-index:
机构:
姚清耘
.
上海交通大学,
2008
←
1
→