共 5 条
基于概念的文本表示模型
被引:14
作者:
陈龙
范瑞霞
高琪
机构:
[1] 北京理工大学模式识别与智能系统研究所
来源:
关键词:
文本表示模型;
概念;
概念距离;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
摘要:
文本信息处理正朝着语义的方向发展,而当今主流的文本表示模型——向量空间模型(VSM)以单个词语作为特征项,这忽略了自然语言中词语之间的语义联系、导致文本中大量存在同义词与多义词现象,从而严重地降低了文本信息处理的精度。应用自然语言处理相关技术和成果,把概念和概念距离引入向量空间模型,从语义、概念的角度出发,以概念作为文本的特征项,建立基于概念的文本表示模型。实验证明:这种方法能较好地解决同义词和多义词问题、提高了文本分类的查全率和查准率。
引用
收藏
页码:162 / 164
页数:3
相关论文