基于用户兴趣集的在线垃圾邮件快速识别新方法

被引:5
作者
王友卫
刘元宁
凤丽洲
朱晓冬
机构
[1] 吉林大学计算机科学与技术系
关键词
垃圾邮件; 用户兴趣集; 支持向量机; 主动学习; 在线应用;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置]; TP393.098 [];
学科分类号
081102 [检测技术与自动化装置];
摘要
为在不显著降低垃圾邮件识别精度的同时有效提高邮件识别速度,提出了一种在线垃圾邮件快速识别新方法.首先引入用户正、负兴趣集的概念,结合用户兴趣集及支持向量机对邮件进行分类;然后根据主动学习理论,结合训练集样本密度及改进角度差异方法寻找分类最不确定的样本并推荐给用户进行类别标注;最后将标注后样本及分类最确定性样本加入训练集,并使用样本价值评价新函数淘汰冗余样本以生成新的训练集.实验表明,本文方法的用户标注负担小,垃圾邮件识别精度高、速度快,具有较高的在线应用价值.
引用
收藏
页码:1963 / 1970
页数:8
相关论文
共 9 条
[1]
基于SVM的Web文本快速增量分类算法 [J].
丁文军 ;
薛安荣 .
计算机应用研究, 2012, 29 (04) :1275-1278
[2]
基于主动学习和半监督学习的多类图像分类 [J].
陈荣 ;
曹永锋 ;
孙洪 .
自动化学报, 2011, 37 (08) :954-962
[3]
Customized crowds and active learning to improve classification.[J].Joana Costa;Catarina Silva;Mário Antunes;Bernardete Ribeiro.Expert Systems With Applications.2013,
[4]
An incremental learning algorithm based on the K -associated graph for non-stationary data classification.[J].Jo?o Roberto Bertini;Liang Zhao;Alneu A. Lopes.Information Sciences.2013,
[5]
A new and informative active learning approach for support vector machine.[J].Lisha Hu;Shuxia Lu;Xizhao Wang.Information Sciences.2013,
[6]
Combining active learning and semi-supervised learning to construct SVM classifier.[J].Yan Leng;Xinyan Xu;Guanghui Qi.Knowledge-Based Systems.2013,
[7]
A new feature selection based on comprehensive measurement both in inter-category and intra-category for text categorization.[J].Jieming Yang;Yuanning Liu;Xiaodong Zhu;Zhen Liu;Xiaoxu Zhang.Information Processing and Management.2011, 4
[8]
Online active multi-field learning for efficient email spam filtering [J].
Liu, Wuying ;
Wang, Ting .
KNOWLEDGE AND INFORMATION SYSTEMS, 2012, 33 (01) :117-136
[9]
A study of spam filtering using support vector machines [J].
Amayri, Ola ;
Bouguila, Nizar .
ARTIFICIAL INTELLIGENCE REVIEW, 2010, 34 (01) :73-108