一种改进的朴素贝叶斯文本分类方法

被引:11
作者
陈叶旺
余金山
机构
[1] 华侨大学计算机科学与技术学院
关键词
文本分类; 朴素贝叶斯方法; 文档特征; 卡方检验;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
针对网络中所存在的大量以网页等非结构化形式存在的文本资源,提出一种改进的朴素贝叶斯分类方法.首先,通过卡方检验方法求文档特征并对文档降维,提高特征词区分性信息;然后,以文本特征来代替原始词条进行朴素贝叶斯对类.实验表明,该方法不仅理论上易于建立和更新,而且分类的精确率也得到提高.
引用
收藏
页码:401 / 404
页数:4
相关论文
共 3 条
[1]   一种数据规约的近似挖掘方法的实现附视频 [J].
喻小光 ;
陈维斌 ;
陈荣鑫 .
华侨大学学报(自然科学版), 2008, (03) :370-374
[2]   独立于语种的文本分类方法 [J].
黄萱菁 ;
吴立德 ;
石崎洋之 ;
徐国伟 .
中文信息学报, 2000, (06) :1-7
[3]  
A Comparative Study on Feature Selection in Text Categorization .2 Yang Y,Pedersen J O. The Fourteenth International Conference on Machine Learning . 1997