基于Web日志的数据挖掘研究

被引:0
作者
付国瑜
机构
[1] 重庆大学
关键词
数据挖掘; Web日志; 预处理; 聚类; 自适应;
D O I
暂无
年度学位
2007
学位类型
硕士
摘要
随着Internet的不断发展,数据挖掘技术的研究和应用也越来越成为热点问题,在国际国内的学术界和信息产业界备受瞩目。如何把数据挖掘技术应用于Web,从Web服务器的日志中发掘有用的、重要的知识(包括模式、规则等),成为数据挖掘与知识发现的一个重要研究和应用领域,这就是基于Web日志的数据挖掘。 文章首先对数据挖掘作了概括性的阐述,诸如数据挖掘的定义、功能、分类等。接着对数据挖掘的一个重要分支—Web日志挖掘进行了系统的研究。作者围绕对Web挖掘的流程这一线索,尤其是对预处理和模式发现这两个阶段展开了详细深入的探讨。针对数据预处理阶段的几个步骤,如数据清洗、用户识别、会话识别、路径补充等进行了重点的探讨,并给出了其具体实现算法。最后,针对Web挖掘的应用领域之一,作者对自适应的Web站点展开了较为详细的讨论,并提出了自适应站点的架构策略等系列问题。提出了一种适用于Web日志挖掘的数据结构—用户/页面(URLUserID)关联矩阵,来表示用户对页面的访问信息,并且利用基于该关联矩阵的用户聚类、页面聚类和频繁访问路径等算法,从而实现用户和页面的聚类及用户的频繁访问路径。
引用
收藏
页数:63
共 22 条
[1]
基于Web数据挖掘技术构建自适应站点研究 [D]. 
张新生 .
西安建筑科技大学,
2004
[2]
基于Web挖掘的自适应网站研究 [D]. 
王书舟 .
哈尔滨理工大学,
2003
[3]
基于Web的日志挖掘技术的研究 [D]. 
刘建东 .
哈尔滨工程大学,
2003
[4]
知识发现.[M].史忠植著;.清华大学出版社.2002,
[5]
数据挖掘.[M].朱明编著;.中国科学技术大学出版社.2002,
[6]
数据挖掘技术.[M].陈文伟等著;.北京工业大学出版社.2002,
[7]
数据挖掘.[M].(加)JiaweiHan;(加)MichelineKamber著;范明;孟小峰等译;.机械工业出版社.2001,
[8]
Data Preparation for Mining World Wide Web Browsing Patterns.[J].Robert Cooley;Bamshad Mobasher;Jaideep Srivastava.Knowledge and Information Systems.1999, 1
[9]
基于Web挖掘的个性化服务研究 [J].
李广都 ;
李勇 ;
不详 .
情报理论与实践 , 2004, (01) :72-76+54
[10]
Web数据挖掘中的数据预处理 [J].
陈宝树 ;
党齐民 .
计算机工程, 2002, (07) :125-127