一种基于PCA和RS的文本过滤方法

被引:4
作者
林琛
李弼程
宋辉
机构
[1] 郑州信息工程大学
基金
河南省教育厅基金;
关键词
主成分分析; 粗糙集; 特征抽取; 文本过滤;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
本文提出一种文本过滤方法,即首先利用PCA(主成分分析)的方法进行文本特征抽取,在此基础上运用RS中决策表上的规则推理方法,发现规则并形成规则库,对于新进来文档将其条件属性与规则库里规则进行相似匹配,进行文本过滤。实验结果表明,此方法用于垃圾邮件过滤能取得很高的正确率和召回率。
引用
收藏
页码:161 / 163
页数:3
相关论文
共 1 条
[1]   ROUGH SETS [J].
PAWLAK, Z .
INTERNATIONAL JOURNAL OF COMPUTER & INFORMATION SCIENCES, 1982, 11 (05) :341-356