基于Bootstrap Averaging的贝叶斯分类算法

被引:1
作者
白莉媛 [1 ]
肖乐 [1 ]
黄晖 [2 ]
丁伟 [1 ]
机构
[1] 河南工业大学信息科学与工程学院
[2] 河南工业大学理学院
关键词
概率分布聚类; 文本分类; 朴素贝叶斯分类器; 自助平均;
D O I
暂无
中图分类号
TP183 [人工神经网络与计算]; TP311.13 [];
学科分类号
1201 ;
摘要
针对单词簇上训练朴素贝叶斯文本分类器概率估计偏差较大所导致的分类精度较低问题。在使用概率分布聚类算法得到的单词簇的基础上,根据单词与簇间互信息建立有序单词子序列,采用有放回随机抽样对单词序列构造规模相当的样本集并将估计出的参数的平均值作为训练得到的最终参数对未知文本进行分类。公共文本实验数据集上的实验结果表明,提出的训练方法相对于传统的朴素贝叶斯分类器训练方法能够获得更高的分类精度且过程相对简单。
引用
收藏
页码:189 / 190+199 +199
页数:3
相关论文
共 1 条
[1]  
Distributional clustering of English words. Pereira F,Tishby N,Lee L. 31st Annual Meeting of the ACL . 1993