学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
一种改进的孤立点消除及网络文本聚类算法
被引:2
作者
:
论文数:
引用数:
h-index:
机构:
罗姗姗
论文数:
引用数:
h-index:
机构:
杜庆治
论文数:
引用数:
h-index:
机构:
杨秋萍
龙华
论文数:
0
引用数:
0
h-index:
0
机构:
昆明理工大学信息工程与自动化学院
龙华
机构
:
[1]
昆明理工大学信息工程与自动化学院
来源
:
云南师范大学学报(自然科学版)
|
2012年
/ 32卷
/ 01期
关键词
:
层次聚类;
CURE;
孤立点;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
081203 ;
0835 ;
摘要
:
通过对CURE(Clustering Using Representatives)的研究,在此基础上,针对网络话题文本内容广泛、孤立点较多的特点,增加对孤立点的预处理过程,提出一种适用于网络话题文本聚类的层次聚类算法。该算法能降低算法对孤立点的敏感度,同时提高聚类效率,通过实验证明改进后的算法更适合运用在网络话题文本的快速聚类中。
引用
收藏
页码:48 / 51
页数:4
相关论文
共 5 条
[1]
一种挖掘负关联规则的有效方法
[J].
论文数:
引用数:
h-index:
机构:
张雅芬
;
论文数:
引用数:
h-index:
机构:
王新
.
云南民族大学学报(自然科学版),
2011,
20
(04)
:301
-304
[2]
基于改进CURE聚类算法的无监督异常检测方法
[J].
周亚建
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学网络与交换技术国家重点实验室信息安全中心
北京邮电大学网络与信息攻防技术教育部重点实验室
北京邮电大学灾备技术国家工程实验室
北京邮电大学网络与交换技术国家重点实验室信息安全中心
周亚建
;
论文数:
引用数:
h-index:
机构:
徐晨
;
李继国
论文数:
0
引用数:
0
h-index:
0
机构:
河海大学计算机与信息学院
北京邮电大学网络与交换技术国家重点实验室信息安全中心
李继国
.
通信学报,
2010,
31
(07)
:18
-23+32
[3]
基于K-means的文本聚类算法
[J].
毛嘉莉
论文数:
0
引用数:
0
h-index:
0
机构:
西华师范大学计算机学院
毛嘉莉
.
计算机系统应用,
2009,
18
(10)
:85
-87
[4]
一种基于参考点和密度的快速聚类算法
[J].
马帅
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
马帅
;
王腾蛟
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
王腾蛟
;
论文数:
引用数:
h-index:
机构:
唐世渭
;
杨冬青
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
杨冬青
;
高军
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
高军
.
软件学报,
2003,
(06)
:1089
-1095
[5]
数据仓库和数据挖掘.[M].苏新宁[等]编著;.清华大学出版社.2006,
←
1
→
共 5 条
[1]
一种挖掘负关联规则的有效方法
[J].
论文数:
引用数:
h-index:
机构:
张雅芬
;
论文数:
引用数:
h-index:
机构:
王新
.
云南民族大学学报(自然科学版),
2011,
20
(04)
:301
-304
[2]
基于改进CURE聚类算法的无监督异常检测方法
[J].
周亚建
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学网络与交换技术国家重点实验室信息安全中心
北京邮电大学网络与信息攻防技术教育部重点实验室
北京邮电大学灾备技术国家工程实验室
北京邮电大学网络与交换技术国家重点实验室信息安全中心
周亚建
;
论文数:
引用数:
h-index:
机构:
徐晨
;
李继国
论文数:
0
引用数:
0
h-index:
0
机构:
河海大学计算机与信息学院
北京邮电大学网络与交换技术国家重点实验室信息安全中心
李继国
.
通信学报,
2010,
31
(07)
:18
-23+32
[3]
基于K-means的文本聚类算法
[J].
毛嘉莉
论文数:
0
引用数:
0
h-index:
0
机构:
西华师范大学计算机学院
毛嘉莉
.
计算机系统应用,
2009,
18
(10)
:85
-87
[4]
一种基于参考点和密度的快速聚类算法
[J].
马帅
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
马帅
;
王腾蛟
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
王腾蛟
;
论文数:
引用数:
h-index:
机构:
唐世渭
;
杨冬青
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
杨冬青
;
高军
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
高军
.
软件学报,
2003,
(06)
:1089
-1095
[5]
数据仓库和数据挖掘.[M].苏新宁[等]编著;.清华大学出版社.2006,
←
1
→