Bayes文本分类器的改进方法研究

被引:11
作者
鲁明羽
机构
[1] 大连海事大学计算机科学与技术学院
关键词
文本分类; 朴素Bayes分类模型; 权值调整; EM算法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
在文本分类领域,Bayes分类器是一种常用且效果较好的、基于概率的分类器,具有较严密的理论基础。该文对朴素Bayes文本分类器进行了分析,提出了利用权值调整机制改善其分类性能的方法,以及在缺乏大量训练文本的情况下,利用EM算法进行非监督Bayes分类的方法,并讨论了如何运用启发式方法确定Bayes网络结构,在更贴近真实环境的情况下进行文本分类。
引用
收藏
页码:63 / 65
页数:3
相关论文
共 5 条
[1]   一种限定性的双层贝叶斯分类模型 [J].
石洪波 ;
王志海 ;
黄厚宽 ;
励晓健 .
软件学报, 2004, (02) :193-199
[2]   基于权值调整的文本分类改进方法 [J].
鲁明羽 ;
李凡 ;
庞淑英 ;
陆玉昌 ;
周立柱 .
清华大学学报(自然科学版), 2003, (04) :513-515+520
[3]   关于文本特征抽取新方法的研究 [J].
李凡 ;
鲁明羽 ;
陆玉昌 .
清华大学学报(自然科学版), 2001, (07) :98-101
[4]  
高等数理统计[M]. 高等教育出版社 , 茆诗松, 2006
[5]   Bayesian Network Classifiers [J].
Nir Friedman ;
Dan Geiger ;
Moises Goldszmidt .
Machine Learning, 1997, 29 :131-163