基于混合高斯模型的电子邮件多过滤器融合方法

被引:12
作者
李文斌 [1 ]
刘椿年 [1 ]
陈嶷瑛 [2 ]
机构
[1] 北京工业大学多媒体与智能软件北京重点实验室
[2] 石家庄经济学院信息工程学院
关键词
代价敏感; 邮件过滤; 混合高斯模型; 过滤器融合;
D O I
暂无
中图分类号
TP393.098 [];
学科分类号
摘要
本文提出了一种基于混合高斯模型(GMM)的多贝叶斯过滤器融合方法,并成功应用于电子邮件过滤.该方法使用多元统计分析方法对多个过滤器在训练例上的过滤表现矩阵进行降维和除噪,得到训练数据及各过滤器的分布;然后,从这一分布中学习出对邮件进行类别判定的GMM.GMM根据期望代价最小准则进行过滤,避免将正常邮件判定为垃圾.实验结果表明,本文方法具有较好的过滤性能,且对于特征提取率的敏感度低.
引用
收藏
页码:247 / 251
页数:5
相关论文
共 3 条
[1]   电子邮件智能分类系统的设计 [J].
熊应 ;
朱斌 ;
朱海云 .
电子学报, 2001, (12) :1653-1655
[2]   基于证据理论的多分类器融合方法研究 [J].
孙怀江 ;
胡钟山 ;
杨静宇 .
计算机学报, 2001, (03) :231-235
[3]  
An Empirical Comparison of Voting Classification Algorithms: Bagging, Boosting, and Variants[J] . Eric Bauer,Ron Kohavi.Machine Learning . 1999 (1-2)