基于改进DBSCAN算法的文本聚类

被引:19
作者
蔡岳
袁津生
机构
[1] 北京林业大学信息学院
关键词
DBSCAN算法; 文本聚类; 最小二乘法; 簇关系树;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
目前多数聚类算法不能很好地适应文本聚类的快速自适应需求。为此,论述DBSCAN算法的基本原理和实现过程,提出一种基于改进DBSCAN算法的文本聚类算法,利用最小二乘法降低文本向量的维度,并创建一种应用于DBSCAN算法的簇关系树结构。实验结果表明,该算法能自适应地进行文本聚类,且与DBSCAN相比,准确率较高。
引用
收藏
页码:50 / 52+55 +55
页数:4
相关论文
共 4 条
[1]   SA-DBSCAN:一种自适应基于密度聚类算法 [J].
夏鲁宁 ;
荆继武 .
中国科学院研究生院学报, 2009, 26 (04) :530-538
[2]   基于模糊聚类的文本挖掘算法 [J].
刘志勇 ;
耿新青 .
计算机工程, 2009, 35 (05) :44-45+49
[3]   基于参考区域的k-means文本聚类算法 [J].
索红光 ;
王玉伟 .
计算机工程与设计, 2009, 30 (02) :401-403+407
[4]   BIRCH聚类算法优化及并行化研究 [J].
朱映辉 ;
江玉珍 .
计算机工程与设计, 2007, (18) :4345-4346+4369