一种基于PCA和RS的文本过滤方法

被引：4

作者：

林琛

李弼程

宋辉

机构：

[1] 郑州信息工程大学

来源：

基金：

河南省教育厅基金;

关键词：

主成分分析; 粗糙集; 特征抽取; 文本过滤;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

摘要：

本文提出一种文本过滤方法,即首先利用PCA(主成分分析)的方法进行文本特征抽取,在此基础上运用RS中决策表上的规则推理方法,发现规则并形成规则库,对于新进来文档将其条件属性与规则库里规则进行相似匹配,进行文本过滤。实验结果表明,此方法用于垃圾邮件过滤能取得很高的正确率和召回率。

引用

页码：161 / 163

页数：3