模糊聚类算法在汉语文本聚类中的应用

被引:11
作者
李家福
陆建江
张亚非
机构
[1] 解放军理工大学通信工程学院
[2] 解放军理工大学理学院 南京
[3] 南京
基金
国家自然科学基金重点项目;
关键词
文本聚类; 分词; 模糊c-原型算法; 非欧几里德关系数据; 竞争凝聚算法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
应用一种新的分词算法对汉语文本进行分词,该算法具备不使用词典和语法知识、不使用汉语词法规则、无监督等特点。采用模糊聚类算法对汉语文本进行聚类,该模糊聚类算法优于普通的聚类算法,聚类结果能充分体现汉语文本的多样性和大量性的特点。
引用
收藏
页码:15 / 16+33 +33
页数:3
相关论文
empty
未找到相关数据