基于粗糙集的改进Apriori算法研究

被引:10
作者
崔旭 [1 ]
刘小丽 [2 ]
机构
[1] 延边大学工学院
[2] 北京科技大学自动化学院
关键词
粗糙集; 候选集; 频繁项集;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
针对Apriori算法的不足,提出一种基于粗糙集的频繁项集发现方法。新方法首先利用粗糙集的特征属性约简算法进行属性约简,找到其中的核心属性数据,然后在构建约简决策表的基础上应用改进的Apriori算法对这些核心数据进行数据挖掘,最终得到频繁项集。改进方法的优势在于在保证知识库分类能力不变的前提下消除不必要的冗余属性,减少了属性数目。在生成频繁项目集方面,根据k-1频繁项集中的项目个数来确定是否生成对应的k-候选集,这样就不需要进行连接操作生成k-候选集,减少了候选项集的生成数量。实验验证了所提出的改进算法的有效性,尤其在k很大的时候,可以节省大量的计算时间,避免产生大量的候选集,可显著提高数据挖掘的效率。
引用
收藏
页码:329 / 332+385 +385
页数:5
相关论文
共 1 条
[1]  
粗糙集理论与方法.[M].张文修等编著;.科学出版社.2001,