一种基于朴素贝叶斯分类的特征选择方法

被引:24
作者
余芳
姜云飞
机构
[1] 暨南大学计算机科学系
[2] 中山大学软件研究所 广东广州
[3] 广东广州
关键词
朴素贝叶斯分类; 特征选择; MI标准; TFIDF标准;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
由于朴素贝叶斯文本分类中的独立假设前提,使得在特征选择步骤能否准确有效地选出能代表文本的特征显得尤为重要,而特征选择标准中的MI标准与TFIDF标准其优缺正好互补,因此在用朴素贝叶斯文本分类方法中的多项式模型实现了一个web页面分类系统———WEBCAT的基础上,提出将MI标准与TFIDF标准结合进行特征选择。实验显示:用改进的方法可以更准确地选出能代表文本的特征,文本分类结果也比单独使用TFIDF标准或单独使用MI标准进行特征选择的分类结果更加精确。
引用
收藏
页码:118 / 120
页数:3
相关论文
empty
未找到相关数据