一种基于CHI值特征选取的粗糙集文本分类规则抽取方法

被引:4
作者
王明春
王正欧
张楷
郝玺龙
机构
[1] 天津大学系统工程研究所
[2] 天津工程师范学院数理系
[3] 天津海量软件公司 天津天津工程师范学院数理系
[4] 天津
关键词
CHI值; 特征选取; 粗糙集; 文本分类规则;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
结合文本分类规则抽取的特点,给出了近似规则的定义。该方法首先利用CHI值进行特征选取并为下一步特征选取提供特征重要性信息,然后使用粗糙集对离散决策表继续进行特征选取,最后用粗糙集抽取出精确规则或近似规则。该方法将CHI值特征选取和粗糙集理论充分结合,避免了用粗糙集对大规模决策表进行特征约简,同时避免了决策表的离散化。该方法提高了文本规则抽取的效率,并使其更趋实用化。实验结果表明了这种方法的有效性和实用性。
引用
收藏
页码:1026 / 1028+1033 +1033
页数:4
相关论文
共 3 条
[1]   一种基于粗糙集的文本分类规则抽取方法 [J].
孟庆春 ;
王汉萍 ;
魏天滨 ;
葛艳 ;
高云 .
青岛海洋大学学报(自然科学版), 2003, (06) :943-949
[2]   一种基于Rough Set理论的属性约简及规则提取方法 [J].
常犁云net王国胤net吴渝net .
软件学报, 1999, (11) :0-0+0
[3]  
DataMining:Concepts andTechniques .2 HanJ,KambrM. . 2001