学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于Boosting算法的垃圾邮件过滤方法研究
被引:7
作者
:
论文数:
引用数:
h-index:
机构:
柴宝仁
[
1
]
论文数:
引用数:
h-index:
机构:
谷文成
[
2
]
牛占云
论文数:
0
引用数:
0
h-index:
0
机构:
北京首都国际机场股份有限公司
齐齐哈尔大学应用技术学院
牛占云
[
3
]
周宏君
论文数:
0
引用数:
0
h-index:
0
机构:
林甸县第一中学
齐齐哈尔大学应用技术学院
周宏君
[
4
]
论文数:
引用数:
h-index:
机构:
王克生
[
2
]
机构
:
[1]
齐齐哈尔大学应用技术学院
[2]
齐齐哈尔大学网络信息中心
[3]
北京首都国际机场股份有限公司
[4]
林甸县第一中学
来源
:
北京理工大学学报
|
2013年
/ 33卷
/ 01期
关键词
:
Boosting算法;
垃圾邮件;
过滤;
分类器;
评价;
D O I
:
10.15918/j.tbit1001-0645.2013.01.010
中图分类号
:
TP393.098 [];
学科分类号
:
080402 ;
摘要
:
为解决垃圾邮件过滤的精确度和有效性问题,提出了一种基于邮件内容过滤的垃圾邮件过滤方法,该方法采用Boosting算法构造了一种垃圾邮件过滤器,利用该垃圾邮件过滤器实现对垃圾邮件的过滤.本文借鉴文本分类和信息检索领域所使用的评价指标,构建了垃圾邮件过滤器的评价体系,利用该评价体系,针对基于Boosting算法所构造的垃圾邮件过滤器对垃圾邮件的过滤实验所得到的数据进行了测试和评估,测试和评估的结果验证了Boosting算法在垃圾邮件过滤中的有效性,其性能优于传统的贝叶斯算法.
引用
收藏
页码:79 / 83
页数:5
相关论文
共 6 条
[1]
基于内容过滤的个性化搜索算法
[J].
曾春
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
曾春
;
邢春晓
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
邢春晓
;
周立柱
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
周立柱
.
软件学报,
2003,
(05)
:999
-1004
[2]
基于DNS Blocklist的反垃圾邮件系统的设计与实现
[J].
论文数:
引用数:
h-index:
机构:
杨峰
;
曹麒麟
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系
曹麒麟
;
段海新
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系
段海新
;
李星
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系
李星
.
计算机工程与应用,
2003,
(07)
:11
-12+45
[3]
Boosting methods for regression
[J].
Duffy, N
论文数:
0
引用数:
0
h-index:
0
机构:
Univ Calif Santa Cruz, Dept Comp Sci, Santa Cruz, CA 95064 USA
Univ Calif Santa Cruz, Dept Comp Sci, Santa Cruz, CA 95064 USA
Duffy, N
;
Helmbold, D
论文数:
0
引用数:
0
h-index:
0
机构:
Univ Calif Santa Cruz, Dept Comp Sci, Santa Cruz, CA 95064 USA
Univ Calif Santa Cruz, Dept Comp Sci, Santa Cruz, CA 95064 USA
Helmbold, D
.
MACHINE LEARNING,
2002,
47
(2-3)
:153
-200
[4]
A decision-theoretic generalization of on-line learning and an application to boosting
[J].
Freund, Y
论文数:
0
引用数:
0
h-index:
0
机构:
AT and T Labs, Florham Park, NJ 07932
Freund, Y
;
Schapire, RE
论文数:
0
引用数:
0
h-index:
0
机构:
AT and T Labs, Florham Park, NJ 07932
Schapire, RE
.
JOURNAL OF COMPUTER AND SYSTEM SCIENCES,
1997,
55
(01)
:119
-139
[5]
THE STRENGTH OF WEAK LEARNABILITY
[J].
SCHAPIRE, RE
论文数:
0
引用数:
0
h-index:
0
SCHAPIRE, RE
.
MACHINE LEARNING,
1990,
5
(02)
:197
-227
[6]
基于内容的垃圾邮件过滤研究.[D].潘文锋.中国科学院研究生院(计算技术研究所).2004, 02
←
1
→
共 6 条
[1]
基于内容过滤的个性化搜索算法
[J].
曾春
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
曾春
;
邢春晓
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
邢春晓
;
周立柱
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
周立柱
.
软件学报,
2003,
(05)
:999
-1004
[2]
基于DNS Blocklist的反垃圾邮件系统的设计与实现
[J].
论文数:
引用数:
h-index:
机构:
杨峰
;
曹麒麟
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系
曹麒麟
;
段海新
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系
段海新
;
李星
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系
李星
.
计算机工程与应用,
2003,
(07)
:11
-12+45
[3]
Boosting methods for regression
[J].
Duffy, N
论文数:
0
引用数:
0
h-index:
0
机构:
Univ Calif Santa Cruz, Dept Comp Sci, Santa Cruz, CA 95064 USA
Univ Calif Santa Cruz, Dept Comp Sci, Santa Cruz, CA 95064 USA
Duffy, N
;
Helmbold, D
论文数:
0
引用数:
0
h-index:
0
机构:
Univ Calif Santa Cruz, Dept Comp Sci, Santa Cruz, CA 95064 USA
Univ Calif Santa Cruz, Dept Comp Sci, Santa Cruz, CA 95064 USA
Helmbold, D
.
MACHINE LEARNING,
2002,
47
(2-3)
:153
-200
[4]
A decision-theoretic generalization of on-line learning and an application to boosting
[J].
Freund, Y
论文数:
0
引用数:
0
h-index:
0
机构:
AT and T Labs, Florham Park, NJ 07932
Freund, Y
;
Schapire, RE
论文数:
0
引用数:
0
h-index:
0
机构:
AT and T Labs, Florham Park, NJ 07932
Schapire, RE
.
JOURNAL OF COMPUTER AND SYSTEM SCIENCES,
1997,
55
(01)
:119
-139
[5]
THE STRENGTH OF WEAK LEARNABILITY
[J].
SCHAPIRE, RE
论文数:
0
引用数:
0
h-index:
0
SCHAPIRE, RE
.
MACHINE LEARNING,
1990,
5
(02)
:197
-227
[6]
基于内容的垃圾邮件过滤研究.[D].潘文锋.中国科学院研究生院(计算技术研究所).2004, 02
←
1
→