基于特征词的垃圾短信分类器模型

被引:11
作者
张永军
刘金岭
机构
[1] 淮阴工学院计算机工程学院
关键词
垃圾短信; 特征词; 文本分类; 降维; 权重学习;
D O I
暂无
中图分类号
TP18 [人工智能理论]; TP391.1 [文字信息处理];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ; 081203 ;
摘要
针对垃圾短信分类问题,提出一种计算词分类权重的方法,并以此为基础通过降维来得到分类特征词集合。提出了短信分类隶属度概念,通过计算短信分类隶属度和分类隶属度密度的方法来实现分类。为了提高分类的准确性,还对特征词进行了分类权重的迭代学习,从而保证了词分类权重取值的合理性。实验结果表明,该分类模型具有良好的分类效果和较低的时间复杂度。
引用
收藏
页码:1334 / 1337
页数:4
相关论文
共 11 条
[1]   基于SVM的垃圾短信过滤系统 [J].
李慧 ;
叶鸿 ;
潘学瑞 ;
段震 ;
张燕平 .
计算机安全, 2012, (06) :34-38
[2]   基于内容的短信分类技术 [J].
陈功平 ;
沈明玉 ;
王红 ;
张燕平 .
华东理工大学学报(自然科学版), 2011, 37 (06) :770-774
[3]   基于上下文的短信文本分类方法 [J].
刘金岭 ;
严云洋 .
计算机工程, 2011, 37 (10) :41-43
[4]   基于朴素贝叶斯和支持向量机的短信智能分析系统设计 [J].
张兢 ;
候旭东 ;
吕和胜 .
重庆理工大学学报(自然科学版), 2010, (01) :77-80
[5]   基于文本分类TFIDF方法的改进与应用 [J].
张玉芳 ;
彭时名 ;
吕佳 .
计算机工程, 2006, (19) :76-78
[6]  
基于集成学习的垃圾短信多级分类技术研究.[D].雷杨.电子科技大学.2011, 01
[7]  
垃圾短信过滤中字特征与词特征对过滤效果的比较研究.[D].冯鸥鹏.北京邮电大学.2011, 09
[8]  
基于短文本的分类算法研究.[D].徐易.上海交通大学.2010, 10
[9]  
A vector space model for automatic indexing.[J].G. Salton;A. Wong;C. S. Yang.Communications of the ACM.1975, 11
[10]  
Learning to adapt web information extraction knowledge and discovering new attributes via a bayesian approach..Wong T L;Lam W;.IEEE Transactions on Knowledge and Data Engineering.2010, 04