基于关联规则的Web日志挖掘研究与实现

被引:0
作者
孙金华
机构
[1] 南昌大学
关键词
Web日志; Web数据挖掘; 关联规则; Web日志预处理;
D O I
暂无
年度学位
2007
学位类型
硕士
导师
摘要
Web日志挖掘是Web数据挖掘中非常重要的一个研究领域和研究方向,通过分析和发现Web日志记录中的规律,可以挖掘出Web用户潜在的使用规律和模式,这可被广泛用于发现电子商务中的潜在客户、提高Web服务的质量和效率以及优化企业信息门户性能等领域。 本文介绍了Internet的发展状况及Web数据挖掘的产生背景,系统地阐述了数据挖掘技术与Web数据挖掘的思想、理论、技术、方法和策略,对Web日志数据挖掘过程及其中各环节的关键技术进行了深入的探讨,重点研究了Web日志挖掘的数据预处理技术和关联规则及基于关联规则的算法,并将其用于指导实际系统的构建。 在Web日志数据预处理方面,在分析比较前人已有的各种方法基础上,将统一建模语言(UML)引入到对Web日志预处理过程的建模上,使用UML对预处理的过程各步骤进行建模,设计出相关数据库表,并在此基础上给出了简明清晰的算法实现。 在关联规则及基于关联规则算法研究方面,本文分析了经典的基于关联规则的挖掘算法Apriori的特点,找出算法存在的不足,并对其进行了改进和优化,使其具有更高的效率。 在对Web日志挖掘理论和技术研究的基础上,结合当前的主流开发技术平台,设计和实现了Web日志挖掘实验系统WebLogMiner,并用其对Web服务器的日志记录进行挖掘实验,得到较为理想的结果。
引用
收藏
页数:94
共 21 条
[21]
Web日志挖掘中的数据预处理的研究 [J].
陆丽娜 ;
杨怡玲 ;
管旭东 ;
魏恒义 .
计算机工程, 2000, (04) :66-67+72