一种改进的高效贝叶斯短信文本分类器

被引:6
作者
张永军
刘金岭
机构
[1] 淮阴工学院计算机工程学院
关键词
短信; 文本分类; 贝叶斯; 支持向量机; 分类能量空间;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
针对短信分类问题,提出了分类能量空间的概念,将特征词转换为分类能量空间上的一个能量元,以此为基础计算短信的能量特征向量.通过计算短信能量特征向量的领域密度,结合贝叶斯公式输出了短信在不同分类的分类概率.在分类过程中,还对分类概率差别较小的短信采用支持向量机进行了二次分类以提高分类效果.实验结果表明,该分类器模型具有良好的分类效果.
引用
收藏
页码:70 / 74
页数:5
相关论文
共 20 条
[1]  
Some Effective Techniques for Naive Bayes Text Classification. Sang-Bum Kim,Kyoung-Soo Han,Hae-Chang Rim,Sung Hyon Myaeng. IEEE Transactions on Knowledge and Data Engineering . 2006
[2]  
基于短文本的分类算法研究[D]. 徐易.上海交通大学 2010
[3]  
垃圾短信过滤中字特征与词特征对过滤效果的比较研究[D]. 冯鸥鹏.北京邮电大学 2011
[4]  
基于支持向量机的垃圾短信过滤方法研究[D]. 龚垒.河南理工大学 2011
[5]  
基于内容分类的垃圾短信拦截系统的研究[D]. 宋艳艳.哈尔滨理工大学 2012
[6]   新的CDF文本分类特征提取方法 [J].
熊忠阳 ;
蒋健 ;
张玉芳 .
计算机应用, 2009, 29 (07) :1755-1757
[7]   基于朴素贝叶斯和支持向量机的短信智能分析系统设计 [J].
张兢 ;
候旭东 ;
吕和胜 .
重庆理工大学学报(自然科学版), 2010, (01) :77-80
[8]   基于内容的短信分类系统的设计与实现 [J].
綦科 ;
谢冬青 .
广州大学学报(自然科学版), 2011, 10 (05) :43-47
[9]   基于内容的短信分类技术 [J].
陈功平 ;
沈明玉 ;
王红 ;
张燕平 .
华东理工大学学报(自然科学版), 2011, 37 (06) :770-774
[10]   基于SVM的垃圾短信过滤系统 [J].
李慧 ;
叶鸿 ;
潘学瑞 ;
段震 ;
张燕平 .
计算机安全, 2012, (06) :34-38