基于差分贡献的垃圾邮件过滤特征选择方法

被引:11
作者
张文良
黄亚楼
倪维健
机构
[1] 南开大学软件学院
关键词
垃圾邮件过滤; 特征选择; 文档频数; 互信息量;
D O I
暂无
中图分类号
TP393.098 [];
学科分类号
080402 ;
摘要
垃圾邮件过滤本质上是一个二类文本分类问题,特征选择是其一个重要的组成部分。针对垃圾邮件过滤问题的特殊性,基于“差分贡献”的思想对文档频数和互信息量这两种传统的特征选择方法进行了改进,设计了新的垃圾邮件过滤特征选择方法。实验结果表明,基于差分贡献的特征选择方法使得垃圾邮件过滤的精度得到了有效的提高。
引用
收藏
页码:80 / 82
页数:3
相关论文
empty
未找到相关数据