基于模糊决策树的文本分类规则抽取

被引:9
作者
王煜
王正欧
机构
[1] 天津大学系统工程研究所
[2] 天津大学系统工程研究所 天津河北大学数学与计算机学院
[3] 河北保定
[4] 天津
关键词
相似文本分类; 规则抽取; χ2统计量; 模糊决策树;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
提出一种合并分枝的模糊决策树文本分类方法对相似文本类进行分类,并可抽取出分类精度较高的模糊分类规则。首先研究改进了的χ2统计量,并根据改进的χ2统计量对文本的特征词条进行聚合,有效地降低了文本向量空间的维数。然后使用一种合并分枝的模糊决策树进行分类,大大减少了抽取的规则数量。从而既保证了决策树分类的精度和速度,又可抽取出可理解的模糊分类规则。
引用
收藏
页码:1634 / 1637
页数:4
相关论文
共 4 条
[1]   SVMDT分类器及其在文本分类中的应用研究 [J].
韩家新 ;
何华灿 .
计算机应用研究, 2004, (01) :23-24+43
[2]   一种基于粗糙集的文本分类规则抽取方法 [J].
孟庆春 ;
王汉萍 ;
魏天滨 ;
葛艳 ;
高云 .
青岛海洋大学学报(自然科学版), 2003, (06) :943-949
[3]  
模糊示例学习与模糊控制[M]. 河北大学出版社 , 王熙照, 2002
[4]   An Evaluation of Statistical Approaches to Text Categorization [J].
Yiming Yang .
Information Retrieval, 1999, 1 (1-2) :69-90