基于语义相关和概念相关的自动分类方法研究

被引:5
作者
李莼
罗振声
厉宇航
不详
机构
[1] 清华大学计算机科学与技术系
[2] 清华大学计算机科学与技术系 北京
[3] 北京
关键词
文本分类; 特征抽取; 语义; 概念属性;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
文章区别于传统的基于词的中文文本自动分类方法,在选取文本特征时,考虑了词语的语言学信息以及词语概念之间的相关性,提出基于语义的方法和基于概念属性的方法,建立了分类模型。实验表明,改进后的这两种方法使分类系统具有较高的精度。
引用
收藏
页码:106 / 109
页数:4
相关论文
共 3 条
[1]   基于汉字字频向量的中文文本自动分类系统 [J].
曹素丽 ;
曾伏虎 ;
曹焕光 .
山西大学学报(自然科学版), 1999, (02) :44-49
[2]   基于特征相关性的汉语文本自动分类模型的研究 [J].
张月杰 ;
姚天顺 .
小型微型计算机系统, 1998, (08) :50-56
[3]  
同义词词林[M]. 上海辞书出版社 , 梅家驹, 1983