人名、机构名在基于概念的文本分类中的应用研究

被引:3
作者
吴志峰
田学东
机构
[1] 河北大学数学与计算机学院
[2] 河北大学数学与计算机学院 河北保定 
[3] 河北保定 
关键词
文本分类; 概念分类; KNN; 朴素贝叶斯;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
基于概念的文本分类方法,能对同义词、多义词进行比较好的处理,是一种比较优秀的文本分类算法.但是此方法往往对人名、机构名等具有分类特征的词不能很好地处理,依然停留在关键词的层次.提出了一种将语义词典与一部人名、机构名构成的专有名词词典相结合的新的概念分类方法,并经过实验验证了其有效性.
引用
收藏
页码:657 / 661
页数:5
相关论文
共 4 条
[1]   一个基于概念的中文文本分类模型 [J].
苏伟峰 ;
李绍滋 ;
李堂秋 .
计算机工程与应用, 2002, (06) :193-195
[2]   基于向量空间模型的文本自动分类系统的研究与实现 [J].
庞剑锋 ;
卜东波 ;
白硕 .
计算机应用研究, 2001, (09) :23-26
[3]  
基于K-近邻方法的科技文献分类[J]. 鲍文,胡清华,于达仁.情报学报. 2003 (04)
[4]  
知识发现[M]. 清华大学出版社 , 史忠植著, 2002