基于规则的分类方法研究

被引:0
作者
汪雪君
机构
[1] 闽南师范大学
关键词
数据挖掘; 基于规则的分类; 关联分类;
D O I
暂无
年度学位
2013
学位类型
硕士
导师
摘要
分类技术作为数据挖掘领域的一种重要分析手段。基于规则的分类方法是目前重要的一种分类技术,得到了广泛的应用。基于规则的分类方法是指通过给定阈值,提取规则用于分类。典型的基于规则的分类方法有FOIL算法和关联分类等。传统的基于规则的分类方法能够取得较好的效率,然而在一些数据集上准确率不是很高,比如FOIL算法和决策树。主要原因可能是由于传统的基于规则的分类方法生成较少的规则,特别是当训练集较小的时候,因此可能会遗漏一些重要的规则。本文主要研究如何改进FOIL算法,以及如何将FOIL算法与关联分类结合,提取更多的高质量的规则,从而提高分类的准确率。 本文主要做了以下几方面的研究工作: 首先,提出了多规则提取的分类算法。该算法提取一批重要的属性值来构造候选集和种子集,通过连接候选集和种子集来提取更多的高质量的分类规则,而且结合了多种度量来更新种子集。 其次,提出了结合关联与FOIL算法的分类方法。该方法以类支持度和自信度为度量提取长度为1和2的规则,用Apriori算法来产生频繁2-项集F2,在频繁2-项集F2上结合FOIL算法来产生更多的分类规则。 最后,提出了改进多规则提取的分类算法。该算法将多规则提取的分类算法与FOIL算法结合起来,以类支持度和自信度为度量提取长度为1的规则,通过候选集和种子集来提取长度为2的规则,并且采用多度量来更新种子集,在新的种子集上结合FOIL算法来产生更多的高质量的分类规则。
引用
收藏
页数:49
共 30 条
[1]
关联分类算法研究及其系统实现 [D]. 
张健 .
南京师范大学,
2008
[2]
Maximizing customer satisfaction through an online recommendation system: A novel associative classification model.[J].Yuanchun Jiang;Jennifer Shang;Yezheng Liu.Decision Support Systems.2009, 3
[3]
CSMC: A combination strategy for multi-class classification based on multiple association rules [J].
Liu, Ye-Zheng ;
Jiang, Yuan-Chun ;
Liu, Xiao ;
Yang, Shan-Lin .
KNOWLEDGE-BASED SYSTEMS, 2008, 21 (08) :786-793
[4]
Polynomial-fuzzy decision tree structures for classifying medical data.[J].E.M Mugambi;Andrew Hunter;Giles Oatley;Lee Kennedy.Knowledge-Based Systems.2004, 2
[5]
Using prior probabilities in decision-tree classification of remotely sensed data.[J].D.K McIver;M.A Friedl.Remote Sensing of Environment.2002, 2
[6]
Mining frequent patterns without candidate generation [J].
Han, JW ;
Pei, J ;
Yin, YW .
SIGMOD RECORD, 2000, 29 (02) :1-12
[7]
Automatic subspace clustering of high dimensional data for data mining applications.[J].Rakesh Agrawal;Johannes Gehrke;Dimitrios Gunopulos;Prabhakar Raghavan.ACM SIGMOD Record.1998, 2
[8]
Bayesian network classifiers [J].
Friedman, N ;
Geiger, D ;
Goldszmidt, M .
MACHINE LEARNING, 1997, 29 (2-3) :131-163
[9]
Beyond market baskets.[J].Sergey Brin;Rajeev Motwani;Craig Silverstein.ACM SIGMOD Record.1997, 2
[10]
Mining association rules between sets of items in large databases.[J].Rakesh Agrawal;Tomasz Imieliński;Arun Swami.ACM SIGMOD Record.1993, 2