共 2 条
基于语义的VSM模型改进
被引:9
作者:
苏喻
[1
]
郑诚
[2
]
马中杰
[1
]
机构:
[1] 安徽大学计算智能与信号处理教育部重点实验室
[2] 安徽大学计算机科学与技术学院
来源:
基金:
安徽省自然科学基金;
关键词:
文本聚类;
VSM模型;
特征向量;
语义;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
081203 ;
0835 ;
摘要:
文本聚类在很多领域都有广泛的应用,传统的文本聚类方法由于并不考虑语义因素,得出的聚类效果并不理想。利用语义对VSM模型进行变换,即基于语义对VSM模型的各维进行扭曲,将原本的正交坐标系基于语义变换为斜角坐标系,然后将文本的特征向量映射到变换后的VSM模型上再进行聚类,相对减小语义相关的特征向量间的语义距离,从而提高了文本聚类的召回率与查准率,并使得聚类的结果更加语义化。
引用
收藏
页码:158 / 161
页数:4
相关论文