基于模糊聚类的文本挖掘算法

被引:20
作者
刘志勇 [1 ,2 ]
耿新青 [2 ]
机构
[1] 大连理工大学管理学院
[2] 鞍山师范学院数学系
关键词
聚类数; 文本聚类; 模糊聚类;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
摘要
针对传统FCM算法对孤立点比较敏感,须预先指定聚类数目的缺陷,提出一种新的模糊聚类算法NSFCM,将其应用于文本挖掘中。NSFCM对数据对象的隶属度增加一个权值,以减少孤立点对聚类中心的影响。采用平均信息熵确定聚类数,通过密度函数获得初始聚类中心。仿真结果证明,该算法聚类的精度和执行效率均高于FCM算法,效果较好。
引用
收藏
页码:44 / 45+49 +49
页数:3
相关论文
共 6 条