基于Boosting机制的Naive Bayesian文本分类器

被引:3
作者
崔林
付克明
石生树
宋瀚涛
机构
[1] 北京理工大学计算机科学工程系,烟台大学光电信息科学与技术学院,黑龙江大学计算机科学技术学院,北京理工大学计算机科学工程系北京,烟台,哈尔滨,北京
关键词
Boosting; Naive Bayesian Classifier文; 本分类; 文本挖掘; 数据挖掘;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
Naive Bayesian分类器是一种有效的文本分类方法,但由于具有较强的稳定性,很难通过Boosting机制提高其性能。因此用Naive Bayesian分类器作为Boosting的基分类器需要解决的最大问题,就是如何破坏Naive Bayesian分类器的稳定性。提出了3种破坏Naive Bayesian学习器稳定性的方法。第一种方法改变训练集样本,第二种方法采用随机属性选择社团,第三种方法是在Boosting的每次迭代中利用不同的文本特征提取方法建立不同的特征词集。实验表明,这几种方法各有其优缺点,但都比原有方法准确、高效。
引用
收藏
页码:31 / 33+67 +67
页数:4
相关论文
empty
未找到相关数据