共 4 条
基于语义的高质量中文短信文本聚类算法
被引:30
作者:
刘金岭
机构:
[1] 淮阴工学院计算机工程系
来源:
关键词:
短信文本;
语义;
概念相似度;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
081203 ;
0835 ;
摘要:
现有数据聚类方法在处理文本数据时,没有考虑词之间潜在的相似信息,导致聚类效果不理想。针对中文短信文本聚类提出一种基于语义的聚类算法。给出中文概念、词和中文短信文本的相似度度量方法,通过向下连锁裂变和向上两两归并完成中文短信文本聚类。实验结果表明,该算法的聚类质量高于传统算法。
引用
收藏
页码:201 / 202+205
+205
页数:3
相关论文