学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于关联规则的Web日志挖掘研究与实现
被引:0
作者
:
论文数:
引用数:
h-index:
机构:
孙金华
机构
:
[1]
南昌大学
关键词
:
Web日志;
Web数据挖掘;
关联规则;
Web日志预处理;
D O I
:
暂无
年度学位
:
2007
学位类型
:
硕士
导师
:
陈炼;
摘要
:
Web日志挖掘是Web数据挖掘中非常重要的一个研究领域和研究方向,通过分析和发现Web日志记录中的规律,可以挖掘出Web用户潜在的使用规律和模式,这可被广泛用于发现电子商务中的潜在客户、提高Web服务的质量和效率以及优化企业信息门户性能等领域。 本文介绍了Internet的发展状况及Web数据挖掘的产生背景,系统地阐述了数据挖掘技术与Web数据挖掘的思想、理论、技术、方法和策略,对Web日志数据挖掘过程及其中各环节的关键技术进行了深入的探讨,重点研究了Web日志挖掘的数据预处理技术和关联规则及基于关联规则的算法,并将其用于指导实际系统的构建。 在Web日志数据预处理方面,在分析比较前人已有的各种方法基础上,将统一建模语言(UML)引入到对Web日志预处理过程的建模上,使用UML对预处理的过程各步骤进行建模,设计出相关数据库表,并在此基础上给出了简明清晰的算法实现。 在关联规则及基于关联规则算法研究方面,本文分析了经典的基于关联规则的挖掘算法Apriori的特点,找出算法存在的不足,并对其进行了改进和优化,使其具有更高的效率。 在对Web日志挖掘理论和技术研究的基础上,结合当前的主流开发技术平台,设计和实现了Web日志挖掘实验系统WebLogMiner,并用其对Web服务器的日志记录进行挖掘实验,得到较为理想的结果。
引用
收藏
页数:94
共 21 条
[1]
基于改进Apriori算法的关联规则挖掘研究
[J].
论文数:
引用数:
h-index:
机构:
朱其祥
;
论文数:
引用数:
h-index:
机构:
徐勇
;
论文数:
引用数:
h-index:
机构:
张林
.
计算机技术与发展,
2006,
(07)
:102
-104
[2]
关联规则研究综述
[J].
秦亮曦
论文数:
0
引用数:
0
h-index:
0
机构:
广西大学计算机与电子信息学院
广西大学计算机与电子信息学院
秦亮曦
;
论文数:
引用数:
h-index:
机构:
史忠植
.
广西大学学报(自然科学版),
2005,
(04)
:310
-317
[3]
一个基于数据仓库Web日志的数据挖掘实例
[J].
贾文举
论文数:
0
引用数:
0
h-index:
0
机构:
大庆石油学院计算机科学与工程学院
贾文举
;
张颖
论文数:
0
引用数:
0
h-index:
0
机构:
大庆石油学院计算机科学与工程学院
张颖
;
孟祥岗
论文数:
0
引用数:
0
h-index:
0
机构:
大庆石油学院计算机科学与工程学院
孟祥岗
.
佳木斯大学学报(自然科学版),
2005,
(04)
:522
-524
[4]
Web日志挖掘中的用户序列模式识别
[J].
论文数:
引用数:
h-index:
机构:
李明星
;
衡萍
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学管理学院
衡萍
;
论文数:
引用数:
h-index:
机构:
董沛武
;
论文数:
引用数:
h-index:
机构:
陈健
.
哈尔滨工业大学学报,
2005,
(11)
:1570
-1572+1602
[5]
基于RFM和事务压缩的改进型Apriori算法研究
[J].
论文数:
引用数:
h-index:
机构:
韩涛
;
论文数:
引用数:
h-index:
机构:
张春海
;
论文数:
引用数:
h-index:
机构:
李华
.
计算机工程与应用,
2005,
(26)
:184
-187
[6]
Web使用挖掘技术研究综述
[J].
陈健
论文数:
0
引用数:
0
h-index:
0
机构:
中山大学计算机科学系,中山大学计算机科学系广州,广州
陈健
;
论文数:
引用数:
h-index:
机构:
印鉴
.
计算机工程,
2005,
(09)
:4
-6
[7]
数据挖掘方法综述
[J].
郭秀娟
论文数:
0
引用数:
0
h-index:
0
机构:
吉林建筑工程学院计算机科学与工程系长春
郭秀娟
.
吉林建筑工程学院学报,
2004,
(01)
:49
-53
[8]
网页分类技术
[J].
论文数:
引用数:
h-index:
机构:
孙建涛
;
论文数:
引用数:
h-index:
机构:
沈抖
;
论文数:
引用数:
h-index:
机构:
陆玉昌
;
论文数:
引用数:
h-index:
机构:
石纯一
.
清华大学学报(自然科学版),
2004,
(01)
:65
-68
[9]
Web数据挖掘原理及实现
[J].
论文数:
引用数:
h-index:
机构:
范亚芹
;
论文数:
引用数:
h-index:
机构:
刘颖
;
李兴男
论文数:
0
引用数:
0
h-index:
0
机构:
吉林大学通信工程学院,吉林大学通信工程学院,吉林大学通信工程学院吉林长春,吉林长春,吉林长春
李兴男
.
吉林大学学报(信息科学版),
2003,
(04)
:370
-373
[10]
基于数据库约简的关联规则挖掘算法
[J].
刘培奇
论文数:
0
引用数:
0
h-index:
0
机构:
西安交通大学电子与信息工程学院,西安交通大学电子与信息工程学院,西安交通大学电子与信息工程学院,西安交通大学电子与信息工程学院,西安交通大学电子与信息工程学院西安,西安,西安,西安,西安
刘培奇
;
论文数:
引用数:
h-index:
机构:
李增智
;
王云岚
论文数:
0
引用数:
0
h-index:
0
机构:
西安交通大学电子与信息工程学院,西安交通大学电子与信息工程学院,西安交通大学电子与信息工程学院,西安交通大学电子与信息工程学院,西安交通大学电子与信息工程学院西安,西安,西安,西安,西安
王云岚
;
论文数:
引用数:
h-index:
机构:
朱海萍
;
论文数:
引用数:
h-index:
机构:
赵银亮
.
西安交通大学学报,
2003,
(08)
:836
-839
←
1
2
3
→
共 21 条
[1]
基于改进Apriori算法的关联规则挖掘研究
[J].
论文数:
引用数:
h-index:
机构:
朱其祥
;
论文数:
引用数:
h-index:
机构:
徐勇
;
论文数:
引用数:
h-index:
机构:
张林
.
计算机技术与发展,
2006,
(07)
:102
-104
[2]
关联规则研究综述
[J].
秦亮曦
论文数:
0
引用数:
0
h-index:
0
机构:
广西大学计算机与电子信息学院
广西大学计算机与电子信息学院
秦亮曦
;
论文数:
引用数:
h-index:
机构:
史忠植
.
广西大学学报(自然科学版),
2005,
(04)
:310
-317
[3]
一个基于数据仓库Web日志的数据挖掘实例
[J].
贾文举
论文数:
0
引用数:
0
h-index:
0
机构:
大庆石油学院计算机科学与工程学院
贾文举
;
张颖
论文数:
0
引用数:
0
h-index:
0
机构:
大庆石油学院计算机科学与工程学院
张颖
;
孟祥岗
论文数:
0
引用数:
0
h-index:
0
机构:
大庆石油学院计算机科学与工程学院
孟祥岗
.
佳木斯大学学报(自然科学版),
2005,
(04)
:522
-524
[4]
Web日志挖掘中的用户序列模式识别
[J].
论文数:
引用数:
h-index:
机构:
李明星
;
衡萍
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学管理学院
衡萍
;
论文数:
引用数:
h-index:
机构:
董沛武
;
论文数:
引用数:
h-index:
机构:
陈健
.
哈尔滨工业大学学报,
2005,
(11)
:1570
-1572+1602
[5]
基于RFM和事务压缩的改进型Apriori算法研究
[J].
论文数:
引用数:
h-index:
机构:
韩涛
;
论文数:
引用数:
h-index:
机构:
张春海
;
论文数:
引用数:
h-index:
机构:
李华
.
计算机工程与应用,
2005,
(26)
:184
-187
[6]
Web使用挖掘技术研究综述
[J].
陈健
论文数:
0
引用数:
0
h-index:
0
机构:
中山大学计算机科学系,中山大学计算机科学系广州,广州
陈健
;
论文数:
引用数:
h-index:
机构:
印鉴
.
计算机工程,
2005,
(09)
:4
-6
[7]
数据挖掘方法综述
[J].
郭秀娟
论文数:
0
引用数:
0
h-index:
0
机构:
吉林建筑工程学院计算机科学与工程系长春
郭秀娟
.
吉林建筑工程学院学报,
2004,
(01)
:49
-53
[8]
网页分类技术
[J].
论文数:
引用数:
h-index:
机构:
孙建涛
;
论文数:
引用数:
h-index:
机构:
沈抖
;
论文数:
引用数:
h-index:
机构:
陆玉昌
;
论文数:
引用数:
h-index:
机构:
石纯一
.
清华大学学报(自然科学版),
2004,
(01)
:65
-68
[9]
Web数据挖掘原理及实现
[J].
论文数:
引用数:
h-index:
机构:
范亚芹
;
论文数:
引用数:
h-index:
机构:
刘颖
;
李兴男
论文数:
0
引用数:
0
h-index:
0
机构:
吉林大学通信工程学院,吉林大学通信工程学院,吉林大学通信工程学院吉林长春,吉林长春,吉林长春
李兴男
.
吉林大学学报(信息科学版),
2003,
(04)
:370
-373
[10]
基于数据库约简的关联规则挖掘算法
[J].
刘培奇
论文数:
0
引用数:
0
h-index:
0
机构:
西安交通大学电子与信息工程学院,西安交通大学电子与信息工程学院,西安交通大学电子与信息工程学院,西安交通大学电子与信息工程学院,西安交通大学电子与信息工程学院西安,西安,西安,西安,西安
刘培奇
;
论文数:
引用数:
h-index:
机构:
李增智
;
王云岚
论文数:
0
引用数:
0
h-index:
0
机构:
西安交通大学电子与信息工程学院,西安交通大学电子与信息工程学院,西安交通大学电子与信息工程学院,西安交通大学电子与信息工程学院,西安交通大学电子与信息工程学院西安,西安,西安,西安,西安
王云岚
;
论文数:
引用数:
h-index:
机构:
朱海萍
;
论文数:
引用数:
h-index:
机构:
赵银亮
.
西安交通大学学报,
2003,
(08)
:836
-839
←
1
2
3
→