一种基于主动贝叶斯分类技术的垃圾邮件过滤方法

被引:5
作者
李笛
张玉红
胡学钢
机构
[1] 合肥工业大学计算机与信息学院
基金
安徽省自然科学基金;
关键词
垃圾邮件; 机器学习; 文本分类; 信息过滤; 主动学习; 贝叶斯分类;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
140502 [人工智能];
摘要
目前,将机器学习、文本分类与信息过滤技术相结合的过滤方法成为研究热点。对实际邮件过滤时往往会遇到训练样本中包含大量未带类别标注的邮件,应用传统分类方法存在耗时且过滤性能差等问题,文章提出采用主动贝叶斯分类方法RANB对训练样本进行预处理,以标识其多类别;实验表明,这种方法可有效地提高训练样本质量,提高过滤器性能,在各项评价指标上具备优越性。
引用
收藏
页码:1443 / 1446
页数:4
相关论文
共 3 条
[1]
基于委员会投票选择方法的主动学习的研究 [J].
赵悦 ;
穆志纯 .
太原理工大学学报, 2006, (04) :469-472
[2]
基于内容的垃圾邮件过滤技术综述 [J].
王斌 ;
潘文锋 .
中文信息学报, 2005, (05) :1-10
[3]
主动贝叶斯网络分类器 [J].
宫秀军 ;
孙建平 ;
史忠植 .
计算机研究与发展, 2002, (05) :574-579