基于概念的文本表示模型

被引:14
作者
陈龙
范瑞霞
高琪
机构
[1] 北京理工大学模式识别与智能系统研究所
关键词
文本表示模型; 概念; 概念距离;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
文本信息处理正朝着语义的方向发展,而当今主流的文本表示模型——向量空间模型(VSM)以单个词语作为特征项,这忽略了自然语言中词语之间的语义联系、导致文本中大量存在同义词与多义词现象,从而严重地降低了文本信息处理的精度。应用自然语言处理相关技术和成果,把概念和概念距离引入向量空间模型,从语义、概念的角度出发,以概念作为文本的特征项,建立基于概念的文本表示模型。实验证明:这种方法能较好地解决同义词和多义词问题、提高了文本分类的查全率和查准率。
引用
收藏
页码:162 / 164
页数:3
相关论文
共 5 条
[1]   一种新的汉语词义消歧方法 [J].
闫蓉 ;
张蕾 .
计算机技术与发展, 2006, (03) :22-25
[2]   基于概念的文本过滤模型 [J].
赵丰年 ;
刘林 ;
商建云 .
计算机工程与应用 , 2006, (04) :186-188
[3]   基于概念的文本自动分类研究的综述 [J].
徐建斌 ;
施亚东 .
福建电脑, 2005, (02) :2-4
[4]   基于向量空间模型的文本自动分类系统的研究与实现 [J].
庞剑锋 ;
卜东波 ;
白硕 .
计算机应用研究, 2001, (09) :23-26
[5]   Machine learning in automated text categorization [J].
Sebastiani, F .
ACM COMPUTING SURVEYS, 2002, 34 (01) :1-47