基于贝叶斯算法的垃圾邮件过滤技术

被引:10
作者
林巧民 [1 ]
许建真 [1 ]
许棣华 [1 ]
王诚 [2 ]
机构
[1] 南京邮电大学信息网络中心
[2] 南京邮电大学信息工程系
关键词
垃圾邮件; 文本分类; 向量空间模型; 贝叶斯算法;
D O I
暂无
中图分类号
TP393.098 [];
学科分类号
摘要
对基于朴素贝叶斯算法的垃圾邮件过滤技术进行了研究分析和实验验证.介绍了向量空间模型(VSM)方法以及特征向量抽取方法,推导和研究了引入“特征之间互相独立”假设的朴素贝叶斯分类算法.采用K次交叉验证的方法,以收集的一些邮件为语料,应用朴素贝叶斯分类算法,通过训练集计算得到类别的先验概率和特征项的类条件概率,并以此为基础对测试集中的邮件进行归属判断,以正确率和召回率为指标给出了实验结果.
引用
收藏
页码:61 / 64
页数:4
相关论文
empty
未找到相关数据