基于关联规则的垃圾短信分类器模型

被引:2
作者
张永军
刘金岭
高尚兵
机构
[1] 淮阴工学院计算机工程学院
关键词
关联规则; 垃圾短信过滤; 文本分类; 垃圾短信变异; 特征提取;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
针对垃圾短信分类问题,提出了一种通过挖掘垃圾短信关联规则来构造垃圾短信分类器,从而实现垃圾短信过滤的模型.该方法采用改进的FP-grow算法挖掘垃圾短信关联规则集,以关联规则集为基础构建垃圾短信分类器模型,在分类过程中考虑垃圾短信特征词权重和垃圾短信的变异行为进行分类.实验结果表明,该方法的分类精确率和非垃圾短信错分率优于其他常用垃圾短信分类方法.
引用
收藏
页码:6 / 12
页数:7
相关论文
共 23 条
[1]   基于分类规则树的频繁模式文本分类 [J].
陈晓云 ;
陈袆 ;
王雷 ;
李荣陆 ;
胡运发 .
软件学报, 2006, (05) :1017-1025
[2]   基于自适应加权的文本关联分类 [J].
陈晓云 ;
胡运发 .
小型微型计算机系统, 2007, (01) :116-121
[3]  
Novel approach:Na-ve Bayes with vector space model for spam classification. Vahora S,Hasan M,Lakhani R. 2011 Nirma University International Conference on Engineering . 2011
[4]   基于朴素贝叶斯和支持向量机的短信智能分析系统设计 [J].
张兢 ;
候旭东 ;
吕和胜 .
重庆理工大学学报(自然科学版), 2010, (01) :77-80
[5]   基于粗糙集理论的文本分类算法研究 [J].
林珣 ;
李志蜀 ;
周勇 .
计算机科学, 2011, 38 (11) :239-240+263
[6]  
Feature Selection and Feature Extraction for Text Categorization. David D Lewis. Proceedings of Speech and Natural Language Workshop . 1992
[7]  
Supervised and Traditional Term Weighting Methods for Automatic Text Categorization. Man Lan,Chew Lim Tan,Jian Su,Yue Lu. Pattern Analysis and Machine Intelligence, IEEE Transactions on . 2009
[8]  
Some Effective Techniques for Naive Bayes Text Classification. Sang-Bum Kim,Kyoung-Soo Han,Hae-Chang Rim,Sung Hyon Myaeng. IEEE Transactions on Knowledge and Data Engineering . 2006
[9]  
Classifying text documents by associating terms with text categories. Osmar R Zaiane,Maria-Luiza Antonie. Proceedings of the 13th Australasian Conference on Database Technologies . 2002
[10]  
CMAR: Accurate and efficient classification based on multiple class-association rules. Li Wenmin,Han Jiawei,Pei Jian. Proceedings of the IEEE International Conference on Data Mining, ICDM 2001 . 2001