基于语义的高质量中文短信文本聚类算法

被引：30

作者：

刘金岭

机构：

[1] 淮阴工学院计算机工程系

来源：

关键词：

短信文本; 语义; 概念相似度;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

081203 ; 0835 ;

摘要：

现有数据聚类方法在处理文本数据时,没有考虑词之间潜在的相似信息,导致聚类效果不理想。针对中文短信文本聚类提出一种基于语义的聚类算法。给出中文概念、词和中文短信文本的相似度度量方法,通过向下连锁裂变和向上两两归并完成中文短信文本聚类。实验结果表明,该算法的聚类质量高于传统算法。

引用

页码：201 / 202+205 +205

页数：3

共 4 条

[1] 基于Bayes潜在语义模型的半监督Web挖掘 [J].

宫秀军 ;

史忠植 .

[2] 基于模糊概念图的文档聚类及其在Web中的应用 [J].

陈宁 ;

陈安 ;

周龙骧 ;

贾维嘉 ;

罗三定 .

[3] 一种概念空间自生成方法 [J].

傅伟鹏 ;

吴斌 ;

何清 ;

史忠植 ;

不详 .

[4] 基于义原同现频率的汉语词义排歧方法 [J].

杨尔弘 ;

张国清 ;

张永奎 .