基于类别核心词的朴素贝叶斯中文文本分类

被引:11
作者
袁方
苑俊英
机构
[1] 河北大学数学与计算机学院
关键词
文本分类; 朴素贝叶斯分类; 类别核心词;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
从人工分类的角度看,标题、摘要及关键词中的词条对于文本分类具有更重要的作用.在此基础上提出了基于类别核心词的分类模式,从标题、摘要及关键词中提取类别核心词,通过加权方式,强化它们在文本分类中的作用.基于朴素贝叶斯分类方法的实验表明,提出的方法能够有效提高中文文本的分类准确率.
引用
收藏
页码:46 / 49
页数:4
相关论文
共 7 条
[1]   Bayesian network classifiers [J].
Friedman, N ;
Geiger, D ;
Goldszmidt, M .
MACHINE LEARNING, 1997, 29 (2-3) :131-163
[2]   一种基于朴素贝叶斯分类的特征选择方法 [J].
余芳 ;
姜云飞 .
中山大学学报(自然科学版), 2004, (05) :118-120
[3]   一种文本处理中的朴素贝叶斯分类器 [J].
李静梅 ;
孙丽华 ;
张巧荣 ;
张春生 .
哈尔滨工程大学学报, 2003, (01) :71-74
[4]   文本分类中的特征抽取 [J].
秦进 ;
陈笑蓉 ;
汪维家 ;
陆汝占 .
计算机应用, 2003, (02) :45-46
[5]   中文搜索引擎的原理剖析及开发实现技术 [J].
李志蜀 ;
李果 .
计算机应用研究, 2001, (11) :96-99
[6]   基于向量空间模型的文本自动分类系统的研究与实现 [J].
庞剑锋 ;
卜东波 ;
白硕 .
计算机应用研究, 2001, (09) :23-26
[7]  
中文信息处理技术教程.[M].朱巧明[等]编著;.清华大学出版社.2005,