基于关联规则的Web日志挖掘研究与实现

被引：0

作者：

孙金华

机构：

[1] 南昌大学

关键词：

Web日志; Web数据挖掘; 关联规则; Web日志预处理;

D O I：

暂无

年度学位：

2007

学位类型：

硕士

导师：

陈炼;

摘要：

Web日志挖掘是Web数据挖掘中非常重要的一个研究领域和研究方向，通过分析和发现Web日志记录中的规律，可以挖掘出Web用户潜在的使用规律和模式，这可被广泛用于发现电子商务中的潜在客户、提高Web服务的质量和效率以及优化企业信息门户性能等领域。本文介绍了Internet的发展状况及Web数据挖掘的产生背景，系统地阐述了数据挖掘技术与Web数据挖掘的思想、理论、技术、方法和策略，对Web日志数据挖掘过程及其中各环节的关键技术进行了深入的探讨，重点研究了Web日志挖掘的数据预处理技术和关联规则及基于关联规则的算法，并将其用于指导实际系统的构建。在Web日志数据预处理方面，在分析比较前人已有的各种方法基础上，将统一建模语言(UML)引入到对Web日志预处理过程的建模上，使用UML对预处理的过程各步骤进行建模，设计出相关数据库表，并在此基础上给出了简明清晰的算法实现。在关联规则及基于关联规则算法研究方面，本文分析了经典的基于关联规则的挖掘算法Apriori的特点，找出算法存在的不足，并对其进行了改进和优化，使其具有更高的效率。在对Web日志挖掘理论和技术研究的基础上，结合当前的主流开发技术平台，设计和实现了Web日志挖掘实验系统WebLogMiner，并用其对Web服务器的日志记录进行挖掘实验，得到较为理想的结果。

引用

页数：94

共 21 条

[21]

Web日志挖掘中的数据预处理的研究 [J].

陆丽娜 ;

杨怡玲 ;

管旭东 ;

魏恒义 .

计算机工程, 2000, (04) :66-67+72

← 1 2 3 →