基于关联规则的Web日志挖掘研究与实现

被引:0
作者
孙金华
机构
[1] 南昌大学
关键词
Web日志; Web数据挖掘; 关联规则; Web日志预处理;
D O I
暂无
年度学位
2007
学位类型
硕士
导师
摘要
Web日志挖掘是Web数据挖掘中非常重要的一个研究领域和研究方向,通过分析和发现Web日志记录中的规律,可以挖掘出Web用户潜在的使用规律和模式,这可被广泛用于发现电子商务中的潜在客户、提高Web服务的质量和效率以及优化企业信息门户性能等领域。 本文介绍了Internet的发展状况及Web数据挖掘的产生背景,系统地阐述了数据挖掘技术与Web数据挖掘的思想、理论、技术、方法和策略,对Web日志数据挖掘过程及其中各环节的关键技术进行了深入的探讨,重点研究了Web日志挖掘的数据预处理技术和关联规则及基于关联规则的算法,并将其用于指导实际系统的构建。 在Web日志数据预处理方面,在分析比较前人已有的各种方法基础上,将统一建模语言(UML)引入到对Web日志预处理过程的建模上,使用UML对预处理的过程各步骤进行建模,设计出相关数据库表,并在此基础上给出了简明清晰的算法实现。 在关联规则及基于关联规则算法研究方面,本文分析了经典的基于关联规则的挖掘算法Apriori的特点,找出算法存在的不足,并对其进行了改进和优化,使其具有更高的效率。 在对Web日志挖掘理论和技术研究的基础上,结合当前的主流开发技术平台,设计和实现了Web日志挖掘实验系统WebLogMiner,并用其对Web服务器的日志记录进行挖掘实验,得到较为理想的结果。
引用
收藏
页数:94
共 21 条
[1]
基于改进Apriori算法的关联规则挖掘研究 [J].
朱其祥 ;
徐勇 ;
张林 .
计算机技术与发展, 2006, (07) :102-104
[2]
关联规则研究综述 [J].
秦亮曦 ;
史忠植 .
广西大学学报(自然科学版), 2005, (04) :310-317
[3]
一个基于数据仓库Web日志的数据挖掘实例 [J].
贾文举 ;
张颖 ;
孟祥岗 .
佳木斯大学学报(自然科学版), 2005, (04) :522-524
[4]
Web日志挖掘中的用户序列模式识别 [J].
李明星 ;
衡萍 ;
董沛武 ;
陈健 .
哈尔滨工业大学学报, 2005, (11) :1570-1572+1602
[5]
基于RFM和事务压缩的改进型Apriori算法研究 [J].
韩涛 ;
张春海 ;
李华 .
计算机工程与应用, 2005, (26) :184-187
[6]
Web使用挖掘技术研究综述 [J].
陈健 ;
印鉴 .
计算机工程, 2005, (09) :4-6
[7]
数据挖掘方法综述 [J].
郭秀娟 .
吉林建筑工程学院学报, 2004, (01) :49-53
[8]
网页分类技术 [J].
孙建涛 ;
沈抖 ;
陆玉昌 ;
石纯一 .
清华大学学报(自然科学版), 2004, (01) :65-68
[9]
Web数据挖掘原理及实现 [J].
范亚芹 ;
刘颖 ;
李兴男 .
吉林大学学报(信息科学版), 2003, (04) :370-373
[10]
基于数据库约简的关联规则挖掘算法 [J].
刘培奇 ;
李增智 ;
王云岚 ;
朱海萍 ;
赵银亮 .
西安交通大学学报, 2003, (08) :836-839