Web中文文本聚类研究及实现

被引:18
作者
杨学明
机构
[1] 宁波大学网络中心
基金
浙江省自然科学基金;
关键词
文本自动聚类; 信息检索; HAC; K-Means;
D O I
暂无
中图分类号
TP393.09 []; TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
采用Web文本自动聚类技术,提出一种将HAC(Hierarchical Agglomerative Clustering)聚类算法与K-Means聚类算法相结合的两阶段文本聚类框架,并通过实验对该框架进行评估。
引用
收藏
页码:81 / 84
页数:4
相关论文
共 6 条
[1]
中文文本分类中特征抽取方法的比较研究 [J].
代六玲 ;
黄河燕 ;
陈肇雄 .
中文信息学报, 2004, (01) :26-32
[2]
一种基于群体智能的Web文档聚类算法 [J].
吴斌 ;
傅伟鹏 ;
郑毅 ;
刘少辉 ;
史忠植 .
计算机研究与发展, 2002, (11) :1429-1435
[3]
基于模糊概念图的文档聚类及其在Web中的应用 [J].
陈宁 ;
陈安 ;
周龙骧 ;
贾维嘉 ;
罗三定 .
软件学报, 2002, (08) :1598-1605
[4]
文本聚类中的贝叶斯后验模型选择方法 [J].
姜宁 ;
史忠植 .
计算机研究与发展, 2002, (05) :580-587
[5]
Feature Weighting in <Emphasis Type="Italic">k</Emphasis>-Means Clustering[J] Dharmendra S. Modha;W. Scott Spangler Machine Learning 2003,
[6]
实用多元统计分析[M] 方开泰编著; 华东师范大学出版社 1989,