面向中观审计的规则发现算法研究

被引:0
作者
陈耿
机构
[1] 东南大学
关键词
中观审计; 数据挖掘; 关联规则; 频繁项集; 分布式关联规则; 关联规则更新;
D O I
暂无
年度学位
2005
学位类型
博士
导师
摘要
目前,我国政府部门为了规范市场经济秩序,防范各类经济风险,十分重视并积极开展各类审计工作,提出了对重点资金、重点领域、重点项目的审计监督。但是,从庞大的数据库系统中迅速地提取出有用的审计信息成为当前审计工作面临的严峻挑战,这就更加要求从多个层面探索更有效的审计思路、新方法和新技术。本论文研究工作就是试图将中观审计理论与数据挖掘等计算技术相结合,从行业中各个单位的数据库系统中提取出中观(行业)审计假设与关联模式,用以指导中观审计工作的深入开展,并在此基础上积极探索审计智能化、自动化的理论与技术。 本文的研究工作的创新性主要体现在以下几个方面: (1)从中观审计检测的实际需要出发,提出了非对等结构的分布式数据库环境下关联规则挖掘的原型系统AuditMiner体系结构,即由局部站点和全局站点协同完成关联规则的挖掘任务。 (2)提出了面向中观审计的基于二进制形式的候选频繁项目集生成和相应的计算支持数算法B-Gen,用以降低生成频繁项集的实现难度,将该算法与Apriori、FUP、FDM等算法相结合,提出了BApriori、BFUP和FDM等算法,可以显著提高关联规则的生成效率。 (3)鉴于大数据集环境下的关联规则发现日益受到重视,分布式关联规则发现是解决这一问题的有效方法。针对非对等结构分布式数据库环境,本文提出了相应的算法GFDA,算法可以高效地对分布环境下的数据进行关联规则发现。 (4)在中观审计检测中大量遇到规则增量更新问题。本文在DW.Cheung等人提出的FUP算法的基础上,引入候选支持度、次频繁项集和支持数上界等概念,提出了增量式关联规则发现算法IFUP;进一步针对分布式环境下的关联规则的增量更新问题,提出更新算法LUDA和GUDA以及更新算法LUDA2和GUDA2。这些更新算法能够充分利用已挖掘的结果,产生较少数量的候选频繁项目集,通信代价低,算法效率较高。 (5)将Benford法则应用于发现异常交易,引入差异度概念与全局关联规则进行比对获取异常模式,可以有效提高规则的审计兴趣度。 (6)研制以海关为审计主体的、面向中观审计检测的、分布式审计关联规则挖掘原型系统AuditMiner,用以验证论文中提出的各算法的适用性和有效性。
引用
收藏
页数:92
共 19 条
[1]
基于频繁模式树的约束最大频繁项目集挖掘算法研究 [J].
陈耿 ;
朱玉全 ;
宋余庆 ;
陆介平 ;
孙志挥 .
应用科学学报, 2006, (01) :64-69
[2]
关联规则挖掘中若干关键技术的研究 [J].
陈耿 ;
朱玉全 ;
杨鹤标 ;
陆介平 ;
宋余庆 ;
孙志挥 .
计算机研究与发展, 2005, (10)
[3]
一种基于异常检测的关联模式挖掘模型 [J].
陈耿 ;
朱玉全 ;
孙志挥 .
计算机工程与应用, 2004, (12) :158-159+198
[4]
新颖度——关联规则的评价指标 [J].
綦艳霞 .
计算机应用研究, 2004, (01) :17-19
[5]
基于FP-Tree的最大频繁项目集挖掘及更新算法 [J].
宋余庆 ;
朱玉全 ;
孙志挥 ;
陈耿 .
软件学报, 2003, (09) :1586-1592
[6]
有序概念格与WWW用户访问模式的增量挖掘 [J].
金阳 ;
左万利 .
计算机研究与发展, 2003, (05) :675-683
[7]
论中观审计的客观依据与现实目标 [J].
易仁萍 ;
王会金 .
审计研究, 2003, (02) :7-10
[8]
数据挖掘技术及其在审计风险管理中的应用 [J].
易仁萍 ;
陈耿 ;
杨明 ;
孙志辉 .
审计与经济研究, 2003, (01) :3-6
[9]
一个基于兴趣度的关联规则采掘算法 [J].
周皓峰 ;
朱扬勇 ;
施伯乐 .
计算机研究与发展, 2002, (04) :450-457
[10]
基于模式挖掘的用户行为异常检测 [J].
连一峰 ;
戴英侠 ;
王航 .
计算机学报, 2002, (03) :325-330