学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
文档聚类综述
被引:64
作者
:
刘远超
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机科学与技术学院
刘远超
论文数:
引用数:
h-index:
机构:
王晓龙
徐志明
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机科学与技术学院
徐志明
论文数:
引用数:
h-index:
机构:
关毅
机构
:
[1]
哈尔滨工业大学计算机科学与技术学院
来源
:
中文信息学报
|
2006年
/ 03期
关键词
:
计算机应用;
中文信息处理;
综述;
文档聚类;
降维;
概念相关;
聚类算法;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
摘要
:
聚类作为一种自动化程度较高的无监督机器学习方法,近年来在信息检索、多文档自动文摘等领域获得了广泛的应用。本文首先讨论了文档聚类的应用背景和体系结构,然后对文档聚类算法、聚类空间的构造和降维方法、文档聚类中的语义问题进行了综述。最后还介绍了聚类质量评测问题。
引用
收藏
页码:55 / 62
页数:8
相关论文
共 9 条
[1]
基于k-means聚类的无导词义消歧
论文数:
引用数:
h-index:
机构:
陈浩
何婷婷
论文数:
0
引用数:
0
h-index:
0
机构:
华中师范大学计算机科学系
何婷婷
姬东鸿
论文数:
0
引用数:
0
h-index:
0
机构:
华中师范大学计算机科学系
姬东鸿
[J].
中文信息学报,
2005,
(04)
: 10
-
16
[2]
一种基于参考点和密度的快速聚类算法
马帅
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
马帅
王腾蛟
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
王腾蛟
唐世渭
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
唐世渭
杨冬青
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
杨冬青
高军
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
高军
[J].
软件学报,
2003,
(06)
: 1089
-
1095
[3]
基于主题的Web文档聚类研究
孙学刚
论文数:
0
引用数:
0
h-index:
0
机构:
智能技术与系统国家重点实验室清华大学计算机科学与技术系
孙学刚
陈群秀
论文数:
0
引用数:
0
h-index:
0
机构:
智能技术与系统国家重点实验室清华大学计算机科学与技术系
陈群秀
马亮
论文数:
0
引用数:
0
h-index:
0
机构:
智能技术与系统国家重点实验室清华大学计算机科学与技术系
马亮
[J].
中文信息学报,
2003,
(03)
: 21
-
26
[4]
基于免疫规划的K-means聚类算法
行小帅
论文数:
0
引用数:
0
h-index:
0
机构:
西安电子科技大学雷达信号处理国家重点实验室
行小帅
论文数:
引用数:
h-index:
机构:
潘进
焦李成
论文数:
0
引用数:
0
h-index:
0
机构:
西安电子科技大学雷达信号处理国家重点实验室
焦李成
[J].
计算机学报,
2003,
(05)
: 605
-
610
[5]
一种基于群体智能的Web文档聚类算法
论文数:
引用数:
h-index:
机构:
吴斌
论文数:
引用数:
h-index:
机构:
傅伟鹏
论文数:
引用数:
h-index:
机构:
郑毅
刘少辉
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所智能信息处理开放重点实验室
刘少辉
史忠植
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所智能信息处理开放重点实验室
史忠植
[J].
计算机研究与发展,
2002,
(11)
: 1429
-
1435
[6]
基于聚类的文本过滤模型
论文数:
引用数:
h-index:
机构:
林鸿飞
马雅彬
论文数:
0
引用数:
0
h-index:
0
机构:
大连理工大学计算机系
马雅彬
[J].
大连理工大学学报,
2002,
(02)
: 249
-
252
[7]
数据分析[M]. 科学出版社 , 范金城, 2002
[8]
知识发现[M]. 清华大学出版社 , 史忠植著, 2002
[9]
SELF-ORGANIZED FORMATION OF TOPOLOGICALLY CORRECT FEATURE MAPS
KOHONEN, T
论文数:
0
引用数:
0
h-index:
0
KOHONEN, T
[J].
BIOLOGICAL CYBERNETICS,
1982,
43
(01)
: 59
-
69
←
1
→
共 9 条
[1]
基于k-means聚类的无导词义消歧
论文数:
引用数:
h-index:
机构:
陈浩
何婷婷
论文数:
0
引用数:
0
h-index:
0
机构:
华中师范大学计算机科学系
何婷婷
姬东鸿
论文数:
0
引用数:
0
h-index:
0
机构:
华中师范大学计算机科学系
姬东鸿
[J].
中文信息学报,
2005,
(04)
: 10
-
16
[2]
一种基于参考点和密度的快速聚类算法
马帅
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
马帅
王腾蛟
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
王腾蛟
唐世渭
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
唐世渭
杨冬青
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
杨冬青
高军
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
高军
[J].
软件学报,
2003,
(06)
: 1089
-
1095
[3]
基于主题的Web文档聚类研究
孙学刚
论文数:
0
引用数:
0
h-index:
0
机构:
智能技术与系统国家重点实验室清华大学计算机科学与技术系
孙学刚
陈群秀
论文数:
0
引用数:
0
h-index:
0
机构:
智能技术与系统国家重点实验室清华大学计算机科学与技术系
陈群秀
马亮
论文数:
0
引用数:
0
h-index:
0
机构:
智能技术与系统国家重点实验室清华大学计算机科学与技术系
马亮
[J].
中文信息学报,
2003,
(03)
: 21
-
26
[4]
基于免疫规划的K-means聚类算法
行小帅
论文数:
0
引用数:
0
h-index:
0
机构:
西安电子科技大学雷达信号处理国家重点实验室
行小帅
论文数:
引用数:
h-index:
机构:
潘进
焦李成
论文数:
0
引用数:
0
h-index:
0
机构:
西安电子科技大学雷达信号处理国家重点实验室
焦李成
[J].
计算机学报,
2003,
(05)
: 605
-
610
[5]
一种基于群体智能的Web文档聚类算法
论文数:
引用数:
h-index:
机构:
吴斌
论文数:
引用数:
h-index:
机构:
傅伟鹏
论文数:
引用数:
h-index:
机构:
郑毅
刘少辉
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所智能信息处理开放重点实验室
刘少辉
史忠植
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所智能信息处理开放重点实验室
史忠植
[J].
计算机研究与发展,
2002,
(11)
: 1429
-
1435
[6]
基于聚类的文本过滤模型
论文数:
引用数:
h-index:
机构:
林鸿飞
马雅彬
论文数:
0
引用数:
0
h-index:
0
机构:
大连理工大学计算机系
马雅彬
[J].
大连理工大学学报,
2002,
(02)
: 249
-
252
[7]
数据分析[M]. 科学出版社 , 范金城, 2002
[8]
知识发现[M]. 清华大学出版社 , 史忠植著, 2002
[9]
SELF-ORGANIZED FORMATION OF TOPOLOGICALLY CORRECT FEATURE MAPS
KOHONEN, T
论文数:
0
引用数:
0
h-index:
0
KOHONEN, T
[J].
BIOLOGICAL CYBERNETICS,
1982,
43
(01)
: 59
-
69
←
1
→