基于内容的短信分类技术

被引:17
作者
陈功平 [1 ,2 ]
沈明玉 [1 ]
王红 [3 ,2 ]
张燕平 [3 ]
机构
[1] 合肥工业大学计算机与信息学院
[2] 六安职业技术学院信息工程系
[3] 安徽大学计算机科学与技术学院
关键词
短信分类; 贝叶斯算法; 特征提取; 向量空间模型;
D O I
10.14135/j.cnki.1006-3080.2011.06.014
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
研究了一种基于改进贝叶斯算法的短信分类方法。对中文文本短信,采用文档频度(DF)的特征项提取方法,借助自建短信语料库对改进的贝叶斯分类器进行了实验测试。实验结果表明:改进的分类器可以提高正常短信的通过率,并可以根据新的训练集训练出个性化的分类器,适应短信变化,满足用户的个性化需求,还结合黑白名单过滤机制实现对短信的过滤,减少了正常短信的误判率。
引用
收藏
页码:770 / 774
页数:5
相关论文
共 4 条
[1]   一种改进的文本分类特征选择方法 [J].
黄秀丽 ;
王蔚 .
计算机工程与应用, 2009, 45 (36) :129-130+240
[2]   基于两层向量空间模型和模糊FCA本体学习方法 [J].
邢军 ;
韩敏 .
计算机研究与发展, 2009, 46 (03) :443-451
[3]   一种新颖混合贝叶斯分类模型研究 [J].
李旭升 ;
郭耀煌 .
计算机科学, 2006, (09) :135-139
[4]   Machine learning in automated text categorization [J].
Sebastiani, F .
ACM COMPUTING SURVEYS, 2002, 34 (01) :1-47