基于语义的VSM模型改进

被引:9
作者
苏喻 [1 ]
郑诚 [2 ]
马中杰 [1 ]
机构
[1] 安徽大学计算智能与信号处理教育部重点实验室
[2] 安徽大学计算机科学与技术学院
基金
安徽省自然科学基金;
关键词
文本聚类; VSM模型; 特征向量; 语义;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
文本聚类在很多领域都有广泛的应用,传统的文本聚类方法由于并不考虑语义因素,得出的聚类效果并不理想。利用语义对VSM模型进行变换,即基于语义对VSM模型的各维进行扭曲,将原本的正交坐标系基于语义变换为斜角坐标系,然后将文本的特征向量映射到变换后的VSM模型上再进行聚类,相对减小语义相关的特征向量间的语义距离,从而提高了文本聚类的召回率与查准率,并使得聚类的结果更加语义化。
引用
收藏
页码:158 / 161
页数:4
相关论文
共 2 条
[1]   一种基于本体的概念语义相似度计算研究 [J].
姜华 .
计算机应用与软件, 2009, 26 (07) :143-145
[2]   聚类算法研究 [J].
孙吉贵 ;
刘杰 ;
赵连宇 .
软件学报, 2008, (01) :48-61