Internet环境下协同工作与数据挖掘研究

被引:0
作者
张锦
机构
[1] 复旦大学
关键词
Internet; CSCW; 数据挖掘; 工作流; 实时协同编辑; 操作变换; 操作群; 频繁模式挖掘; FP-tree;
D O I
暂无
年度学位
2004
学位类型
博士
导师
摘要
Internet的不断普及导致信息量的飞速膨胀,同时其又是一个结构异常复杂的自治体系。能否克服Internet的不足发挥其长处,从而获得更大的价值,是一个值得研究的课题。本文面向Internet,着眼于Internet环境低可靠、高延迟、极端异构、海量数据的特点,探索综合利用CSCW和数据挖掘技术来解决Internet环境下信息交互和信息获取两大现实问题。本文涉及的研究领域主要包括异步协同工作中的工作流研究、同步协同工作中的实时协同编辑以及数据挖掘中的频繁模式挖掘等。本文的研究和创新工作主要包括以下几点: 1.提出了一个基于知识的多Agent协同工作模型(KMAW)及其扩展 工作流管理系统是实现非实时协同工作的一种重要手段。本文采用基于知识推理和任务分解的模式,利用Agent的推理能力,提出了一种基于知识的多Agent协同工作模型。此模型在描述能力上强于传统的过程式工作流模型,可以实现常见的各种工作流模式,并且能够实现包括正确性验证、异常处理、动态流程等高级工作流特性。此模型具有很好的柔性和很强的描述能力,是一个很好的面向Internet的通用协作集成框架。本文还将数据挖掘技术与KMAW模型结合了起来,构成了基于知识挖掘的扩展KMAW模型(MKMAW),此模型可以自主挖掘知识,具有动态决策、动态流程优化等能力。 2.基于KMAW模型,设计实现了Athena协同工作平台 此平台基于Web Service和异步消息机制,面向Internet上异构系统间的集成和协同工作。本文中设计了Athena规则语言及支持此语言的协同工作引擎;开发了XML数据映射引擎及可视化映射工具,解决了异构系统间数据交互的问题;内置了UDDI服务,并对其作了扩展,支持UDDI服务与异步事件的绑定;设计了可视化流程建模工具,可自动生成业务流程的Athena规则。Athena协同工作平台降低了在Internet环境下实现异构系统业务集成的成本和风险。本平台在863重大专项课题中获得了初步应用,取得了重要阶段性成果。 3.在实时协同编辑中,提出了操作群的概念和相关算法 实时协同编辑是实时协同工作的一个重要研究领域,Internet环境下的实时协同编辑以操作变换算法为基础。本文首先描述了一类传统操作变换算法无法解决的冲突。为了解决上述问题,本文在操作变换中引入了操作群的概念。本文中定义了两类操作群:T-群和S-群,给出了维护T-群的操作变换算法,给出了其证明及算法实例,同时给出了维护S-群的系统策略。最后,本文简单讨论了操作群与锁机制、复合操作群等相关问题。 4.基于FP-tree提出了两种新的频繁模式挖掘算法 关联规则挖掘和频繁模式挖掘是获取知识的有效途径,面对海量Internet数据,许多算法在可伸缩性和鲁棒性上有所欠缺。研究发现不同数据集数据分布特征对于算法的效率具有较大影响,这启发我们采用一种自适应的方式,在挖掘过程中根据数据分布特征动态地调整挖掘策略,从而加强鲁棒性,获得整体上的最优。本文首先提出了一种直接在FP-tree上挖掘的算法——简单深度优先搜索算法(NDSP),此算法在稠密数据集上具有相当高的效率;然后把NDSP和FP-growth算法结合起来,构造了自适应的FP挖掘算法(SAFP)。通过实验比对证明,此算法比上述两种算法都要更优,对于不同数据集的鲁棒性明显好于上述两种算法。
引用
收藏
页数:125
共 10 条
[1]
Complete mining of frequent patterns from graphs: Mining graph data [J].
Inokuchi, A ;
Washio, T ;
Motoda, H .
MACHINE LEARNING, 2003, 50 (03) :321-354
[2]
Exception handling in workflow systems [J].
Luo, ZW ;
Sheth, A ;
Kochut, K ;
Miller, J .
APPLIED INTELLIGENCE, 2000, 13 (02) :125-147
[3]
AN OVERVIEW OF WORKFLOW MANAGEMENT - FROM PROCESS MODELING TO WORKFLOW AUTOMATION INFRASTRUCTURE [J].
GEORGAKOPOULOS, D ;
HORNICK, M ;
SHETH, A .
DISTRIBUTED AND PARALLEL DATABASES, 1995, 3 (02) :119-153
[4]
在FP-树中挖掘频繁模式而不生成条件FP-树 [J].
范明 ;
李川 ;
不详 .
计算机研究与发展 , 2003, (08) :1216-1222
[5]
基于频繁模式树的关联规则增量式更新算法 [J].
朱玉全 ;
孙志挥 ;
季小俊 .
计算机学报, 2003, (01) :91-96
[6]
在ObjectARX中嵌入CLIPS的技术实现 [J].
文晟 ;
唐红娥 ;
陈敏 ;
不详 .
计算机工程与应用 , 2003, (01) :121-122+139
[7]
基于专家系统的工作流管理系统模型研究 [J].
李东波 ;
徐平 ;
韩祥兰 ;
林海凡 ;
宋志刚 .
南京理工大学学报, 2001, (01) :96-99
[8]
基于Agent的工作流协调模型研究 [J].
朱云龙 ;
薛劲松 ;
李红信 ;
于海斌 ;
马力 .
小型微型计算机系统, 2000, (07) :737-739
[9]
在C++ Builder中嵌入CLIPS的技术实现 [J].
叶雪梅 ;
原清 ;
谭书伦 .
计算机应用, 2000, (04) :51-53
[10]
Agent在工作流管理系统中的应用研究 [J].
李红臣 ;
史美林 ;
不详 .
通信学报 , 1999, (09) :16-22