共 4 条
基于改进DBSCAN算法的文本聚类
被引:19
作者:
蔡岳
袁津生
机构:
[1] 北京林业大学信息学院
来源:
关键词:
DBSCAN算法;
文本聚类;
最小二乘法;
簇关系树;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
081203 ;
0835 ;
摘要:
目前多数聚类算法不能很好地适应文本聚类的快速自适应需求。为此,论述DBSCAN算法的基本原理和实现过程,提出一种基于改进DBSCAN算法的文本聚类算法,利用最小二乘法降低文本向量的维度,并创建一种应用于DBSCAN算法的簇关系树结构。实验结果表明,该算法能自适应地进行文本聚类,且与DBSCAN相比,准确率较高。
引用
收藏
页码:50 / 52+55
+55
页数:4
相关论文