基于Boosting机制的Naive Bayesian文本分类器

被引：3

作者：

崔林

付克明

石生树

宋瀚涛

机构：

[1] 北京理工大学计算机科学工程系,烟台大学光电信息科学与技术学院,黑龙江大学计算机科学技术学院,北京理工大学计算机科学工程系北京,烟台,哈尔滨,北京

来源：

计算机工程与应用 | 2005年 / 08期

关键词：

Boosting; Naive Bayesian Classifier文; 本分类; 文本挖掘; 数据挖掘;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

120506 [数字人文];

摘要：

Naive Bayesian分类器是一种有效的文本分类方法,但由于具有较强的稳定性,很难通过Boosting机制提高其性能。因此用Naive Bayesian分类器作为Boosting的基分类器需要解决的最大问题,就是如何破坏Naive Bayesian分类器的稳定性。提出了3种破坏Naive Bayesian学习器稳定性的方法。第一种方法改变训练集样本,第二种方法采用随机属性选择社团,第三种方法是在Boosting的每次迭代中利用不同的文本特征提取方法建立不同的特征词集。实验表明,这几种方法各有其优缺点,但都比原有方法准确、高效。

引用

页码：31 / 33+67 +67

页数：4