基于免疫算法的文本分类研究

被引:7
作者
张启蕊 [1 ]
张凌 [1 ]
董守斌 [1 ]
谭景华 [2 ]
机构
[1] 华南理工大学广东省计算机网络重点实验室
[2] 中国电信集团广州研发中心
关键词
文本分类; 免疫; 克隆选择; 抗体浓度;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
借鉴免疫的生物学机理,本文提出了一种基于抗体浓度的克隆选择算法,该算法中抗体的选择概率由亲和度与浓度共同决定,具有高亲和度和低浓度的抗体才受到促进。该算法在文本分类领域得到了成功应用。在文本分类的应用中,抗原、B细胞和抗体分别对应训练文本、分类器的一个解和分类器的解与训练文本的亲和度,最后训练完成的分类器含有多个记忆细胞,有效保证了解的多样性。在数据集20_newsgroups上的实验结果显示,该方法的综合性能指标F1可达80.90%,优于Rocchio法与Naive Bayes法。
引用
收藏
页码:210 / 212
页数:3
相关论文
empty
未找到相关数据