一种改进的朴素贝叶斯文本分类方法

被引:9
作者
梁宏胜
徐建民
成岳鹏
机构
[1] 河北大学数学与计算机学院
关键词
文本分类; 朴素贝叶斯; 特征抽取; 同义词;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
朴素贝叶斯分类器是一种简单有效的文本分类方法.改进方法利用同义词对文本的特征词集进行过滤,在一定程度上放松了朴素贝叶斯的特征独立性假设;在特征选择时迭代了2种不同的特征选择方法,有效地提高了特征集的代表性.实验结果表明,本方法有效地提高了朴素贝叶斯分类器的性能.
引用
收藏
页码:327 / 331
页数:5
相关论文
共 5 条
[1]   用于信息检索的同义词自动识别及其进展 [J].
陆勇 ;
侯汉清 .
南京农业大学学报(社会科学版), 2004, (03) :87-93
[2]   基于最小类差异的无关信息预处理算法 [J].
陈治平 ;
林亚平 ;
彭雅 ;
王雷 ;
童调生 .
电子学报, 2003, (11) :1750-1753
[3]   文本分类中的特征抽取 [J].
秦进 ;
陈笑蓉 ;
汪维家 ;
陆汝占 .
计算机应用, 2003, (02) :45-46
[4]   向量空间法中单词权重函数的分析和构造 [J].
陆玉昌 ;
鲁明羽 ;
李凡 ;
周立柱 .
计算机研究与发展, 2002, (10) :1205-1210
[5]   独立于语种的文本分类方法 [J].
黄萱菁 ;
吴立德 ;
石崎洋之 ;
徐国伟 .
中文信息学报, 2000, (06) :1-7