基于规则的分类方法研究

被引:0
作者
汪雪君
机构
[1] 闽南师范大学
关键词
数据挖掘; 基于规则的分类; 关联分类;
D O I
暂无
年度学位
2013
学位类型
硕士
导师
摘要
分类技术作为数据挖掘领域的一种重要分析手段。基于规则的分类方法是目前重要的一种分类技术,得到了广泛的应用。基于规则的分类方法是指通过给定阈值,提取规则用于分类。典型的基于规则的分类方法有FOIL算法和关联分类等。传统的基于规则的分类方法能够取得较好的效率,然而在一些数据集上准确率不是很高,比如FOIL算法和决策树。主要原因可能是由于传统的基于规则的分类方法生成较少的规则,特别是当训练集较小的时候,因此可能会遗漏一些重要的规则。本文主要研究如何改进FOIL算法,以及如何将FOIL算法与关联分类结合,提取更多的高质量的规则,从而提高分类的准确率。 本文主要做了以下几方面的研究工作: 首先,提出了多规则提取的分类算法。该算法提取一批重要的属性值来构造候选集和种子集,通过连接候选集和种子集来提取更多的高质量的分类规则,而且结合了多种度量来更新种子集。 其次,提出了结合关联与FOIL算法的分类方法。该方法以类支持度和自信度为度量提取长度为1和2的规则,用Apriori算法来产生频繁2-项集F2,在频繁2-项集F2上结合FOIL算法来产生更多的分类规则。 最后,提出了改进多规则提取的分类算法。该算法将多规则提取的分类算法与FOIL算法结合起来,以类支持度和自信度为度量提取长度为1的规则,通过候选集和种子集来提取长度为2的规则,并且采用多度量来更新种子集,在新的种子集上结合FOIL算法来产生更多的高质量的分类规则。
引用
收藏
页数:49
共 30 条
[21]
多分类-关联规则分类的一种改进算法 [J].
赵传申 ;
孙志挥 .
应用科学学报, 2005, (06)
[22]
数据挖掘技术及应用.[M].陈安;陈宁;周龙骧等编著;.科学出版社.2006,
[23]
数据挖掘.[M].朱明编著;.中国科学技术大学出版社.2002,
[24]
粗糙集理论与方法.[M].张文修等编著;.科学出版社.2001,
[25]
Rough集理论与知识获取.[M].王国胤编著;.西安交通大学出版社.2001,
[26]
Induction of decision trees.[J].J. R. Quinlan.Machine Learning.1986, 1
[27]
一种改进的快速k-近邻分类算法 [J].
乔玉龙 ;
潘正祥 ;
孙圣和 .
电子学报, 2005, (06) :1146-1149
[28]
基于改进KNN的文本分类方法 [J].
钱晓东 ;
王正欧 ;
不详 .
情报科学 , 2005, (04) :550-554
[29]
数据挖掘技术的应用研究 [J].
黄解军 ;
潘和平 ;
万幼川 .
计算机工程与应用, 2003, (02) :45-48
[30]
基于属性相关性分析的贝叶斯分类模型.[J].章舜仲;王树梅;黄河燕;陈肇雄;.情报学报.2007, 02