学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
文本聚类综述
被引:87
作者
:
吴启明
论文数:
0
引用数:
0
h-index:
0
机构:
河池学院计算机与信息科学系
吴启明
论文数:
引用数:
h-index:
机构:
易云飞
机构
:
[1]
河池学院计算机与信息科学系
来源
:
河池学院学报
|
2008年
/ 02期
关键词
:
文本聚类;
综述;
降维;
聚类算法;
聚类评价;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
120506
[数字人文]
;
摘要
:
聚类作为一种自动化程度较高的无监督机器学习方法,近年来在信息检索、多文档自动文摘、智能搜索引擎、短文本信息处理等领域获得了广泛的应用。本文首先讨论了文本聚类(Text clustering)的应用,然后对文本聚类算法、聚类关键技术进行了综述。
引用
收藏
页码:86 / 91
页数:6
相关论文
共 16 条
[1]
知识发现.[M].史忠植著;.清华大学出版社.2002,
[2]
利用上下文提高文本聚类的效果
[J].
丘志宏
论文数:
0
引用数:
0
h-index:
0
机构:
汕头大学计算机系
汕头大学计算机系
丘志宏
;
宫雷光
论文数:
0
引用数:
0
h-index:
0
机构:
IBM华生研究中心
汕头大学计算机系
宫雷光
.
中文信息学报,
2007,
(06)
:109
-115
[3]
基于COSA算法的中文文本聚类
[J].
论文数:
引用数:
h-index:
机构:
谷波
;
论文数:
引用数:
h-index:
机构:
李济洪
;
论文数:
引用数:
h-index:
机构:
刘开瑛
.
中文信息学报,
2007,
(06)
:65
-70
[4]
密度敏感的半监督谱聚类
[J].
王玲
论文数:
0
引用数:
0
h-index:
0
机构:
西安电子科技大学智能信息处理研究所
王玲
;
薄列峰
论文数:
0
引用数:
0
h-index:
0
机构:
西安电子科技大学智能信息处理研究所
薄列峰
;
焦李成
论文数:
0
引用数:
0
h-index:
0
机构:
西安电子科技大学智能信息处理研究所
焦李成
.
软件学报,
2007,
(10)
:2412
-2422
[5]
SOM聚类算法在文本分类上的应用
[J].
论文数:
引用数:
h-index:
机构:
丁露
;
崔平
论文数:
0
引用数:
0
h-index:
0
机构:
北京理工大学信息科学技术学院
崔平
.
现代情报,
2007,
(09)
:162
-164
[6]
一种基于DASOM的两阶段中文文本聚类方法
[J].
朱红灿
论文数:
0
引用数:
0
h-index:
0
机构:
湘潭大学管理学院
朱红灿
;
论文数:
引用数:
h-index:
机构:
唐毅
.
情报杂志 ,
2007,
(09)
:101
-104
[7]
一种基于语义内积空间模型的文本聚类算法
[J].
论文数:
引用数:
h-index:
机构:
彭京
;
论文数:
引用数:
h-index:
机构:
杨冬青
;
唐世渭
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学信息科学技术学院
北京大学信息科学技术学院
唐世渭
;
论文数:
引用数:
h-index:
机构:
付艳
;
蒋汉奎
论文数:
0
引用数:
0
h-index:
0
机构:
成都市公安局信息通信处
北京大学信息科学技术学院
蒋汉奎
.
计算机学报,
2007,
(08)
:1354
-1363
[8]
海量短语信息文本聚类技术研究
[J].
王永恒
论文数:
0
引用数:
0
h-index:
0
机构:
国防科技大学计算机学院网络研究所
王永恒
;
论文数:
引用数:
h-index:
机构:
贾焰
;
杨树强
论文数:
0
引用数:
0
h-index:
0
机构:
国防科技大学计算机学院网络研究所
杨树强
.
计算机工程,
2007,
(14)
:38
-40
[9]
基于混合并行遗传算法的文本聚类研究
[J].
论文数:
引用数:
h-index:
机构:
何婷婷
;
论文数:
引用数:
h-index:
机构:
戴文华
;
论文数:
引用数:
h-index:
机构:
焦翠珍
.
中文信息学报,
2007,
(04)
:55
-60
[10]
一种基于《知网》的中文文本聚类算法的研究
[J].
论文数:
引用数:
h-index:
机构:
赵鹏
;
论文数:
引用数:
h-index:
机构:
蔡庆生
.
计算机工程与应用,
2007,
(12)
:162
-163
←
1
2
→
共 16 条
[1]
知识发现.[M].史忠植著;.清华大学出版社.2002,
[2]
利用上下文提高文本聚类的效果
[J].
丘志宏
论文数:
0
引用数:
0
h-index:
0
机构:
汕头大学计算机系
汕头大学计算机系
丘志宏
;
宫雷光
论文数:
0
引用数:
0
h-index:
0
机构:
IBM华生研究中心
汕头大学计算机系
宫雷光
.
中文信息学报,
2007,
(06)
:109
-115
[3]
基于COSA算法的中文文本聚类
[J].
论文数:
引用数:
h-index:
机构:
谷波
;
论文数:
引用数:
h-index:
机构:
李济洪
;
论文数:
引用数:
h-index:
机构:
刘开瑛
.
中文信息学报,
2007,
(06)
:65
-70
[4]
密度敏感的半监督谱聚类
[J].
王玲
论文数:
0
引用数:
0
h-index:
0
机构:
西安电子科技大学智能信息处理研究所
王玲
;
薄列峰
论文数:
0
引用数:
0
h-index:
0
机构:
西安电子科技大学智能信息处理研究所
薄列峰
;
焦李成
论文数:
0
引用数:
0
h-index:
0
机构:
西安电子科技大学智能信息处理研究所
焦李成
.
软件学报,
2007,
(10)
:2412
-2422
[5]
SOM聚类算法在文本分类上的应用
[J].
论文数:
引用数:
h-index:
机构:
丁露
;
崔平
论文数:
0
引用数:
0
h-index:
0
机构:
北京理工大学信息科学技术学院
崔平
.
现代情报,
2007,
(09)
:162
-164
[6]
一种基于DASOM的两阶段中文文本聚类方法
[J].
朱红灿
论文数:
0
引用数:
0
h-index:
0
机构:
湘潭大学管理学院
朱红灿
;
论文数:
引用数:
h-index:
机构:
唐毅
.
情报杂志 ,
2007,
(09)
:101
-104
[7]
一种基于语义内积空间模型的文本聚类算法
[J].
论文数:
引用数:
h-index:
机构:
彭京
;
论文数:
引用数:
h-index:
机构:
杨冬青
;
唐世渭
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学信息科学技术学院
北京大学信息科学技术学院
唐世渭
;
论文数:
引用数:
h-index:
机构:
付艳
;
蒋汉奎
论文数:
0
引用数:
0
h-index:
0
机构:
成都市公安局信息通信处
北京大学信息科学技术学院
蒋汉奎
.
计算机学报,
2007,
(08)
:1354
-1363
[8]
海量短语信息文本聚类技术研究
[J].
王永恒
论文数:
0
引用数:
0
h-index:
0
机构:
国防科技大学计算机学院网络研究所
王永恒
;
论文数:
引用数:
h-index:
机构:
贾焰
;
杨树强
论文数:
0
引用数:
0
h-index:
0
机构:
国防科技大学计算机学院网络研究所
杨树强
.
计算机工程,
2007,
(14)
:38
-40
[9]
基于混合并行遗传算法的文本聚类研究
[J].
论文数:
引用数:
h-index:
机构:
何婷婷
;
论文数:
引用数:
h-index:
机构:
戴文华
;
论文数:
引用数:
h-index:
机构:
焦翠珍
.
中文信息学报,
2007,
(04)
:55
-60
[10]
一种基于《知网》的中文文本聚类算法的研究
[J].
论文数:
引用数:
h-index:
机构:
赵鹏
;
论文数:
引用数:
h-index:
机构:
蔡庆生
.
计算机工程与应用,
2007,
(12)
:162
-163
←
1
2
→