Web中文文本聚类研究及实现

被引：18

作者：

杨学明

机构：

[1] 宁波大学网络中心

来源：

现代图书情报技术 | 2006年 / 12期

基金：

浙江省自然科学基金;

关键词：

文本自动聚类; 信息检索; HAC; K-Means;

D O I：

暂无

中图分类号：

TP393.09 []; TP391.1 [文字信息处理];

学科分类号：

120506 [数字人文];

摘要：

采用Web文本自动聚类技术,提出一种将HAC(Hierarchical Agglomerative Clustering)聚类算法与K-Means聚类算法相结合的两阶段文本聚类框架,并通过实验对该框架进行评估。

引用

页码：81 / 84

页数：4

共 6 条

[1]

中文文本分类中特征抽取方法的比较研究 [J].

代六玲 ;

黄河燕 ;

陈肇雄 .

中文信息学报, 2004, (01) :26-32

[2]

一种基于群体智能的Web文档聚类算法 [J].

吴斌 ;

傅伟鹏 ;

郑毅 ;

刘少辉 ;

史忠植 .

计算机研究与发展, 2002, (11) :1429-1435

[3]

基于模糊概念图的文档聚类及其在Web中的应用 [J].

陈宁 ;

陈安 ;

周龙骧 ;

贾维嘉 ;

罗三定 .

软件学报, 2002, (08) :1598-1605

[4]

文本聚类中的贝叶斯后验模型选择方法 [J].

姜宁 ;

史忠植 .

计算机研究与发展, 2002, (05) :580-587

[5]

Feature Weighting in <Emphasis Type="Italic">k</Emphasis>-Means Clustering[J] Dharmendra S. Modha;W. Scott Spangler Machine Learning 2003,

[6]

实用多元统计分析[M] 方开泰编著; 华东师范大学出版社 1989,

← 1 →