基于语义的高质量中文短信文本聚类算法

被引:30
作者
刘金岭
机构
[1] 淮阴工学院计算机工程系
关键词
短信文本; 语义; 概念相似度;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
现有数据聚类方法在处理文本数据时,没有考虑词之间潜在的相似信息,导致聚类效果不理想。针对中文短信文本聚类提出一种基于语义的聚类算法。给出中文概念、词和中文短信文本的相似度度量方法,通过向下连锁裂变和向上两两归并完成中文短信文本聚类。实验结果表明,该算法的聚类质量高于传统算法。
引用
收藏
页码:201 / 202+205 +205
页数:3
相关论文
共 4 条
[1]   基于Bayes潜在语义模型的半监督Web挖掘 [J].
宫秀军 ;
史忠植 .
软件学报, 2002, (08) :1508-1514
[2]   基于模糊概念图的文档聚类及其在Web中的应用 [J].
陈宁 ;
陈安 ;
周龙骧 ;
贾维嘉 ;
罗三定 .
软件学报, 2002, (08) :1598-1605
[3]   一种概念空间自生成方法 [J].
傅伟鹏 ;
吴斌 ;
何清 ;
史忠植 ;
不详 .
计算机工程与应用 , 2002, (07) :63-65+88
[4]   基于义原同现频率的汉语词义排歧方法 [J].
杨尔弘 ;
张国清 ;
张永奎 .
计算机研究与发展, 2001, (07) :833-838