基于Web数据挖掘技术构建自适应站点研究

被引:0
作者
张新生
机构
[1] 西安建筑科技大学
关键词
自适应站点; 模式学习; 概念聚类; 页面综合;
D O I
暂无
年度学位
2004
学位类型
硕士
导师
摘要
随着互连网技术和电子商务的迅猛发展,Internet正在前所未有地改变着我们的生活。越来越多的商品交易和服务通过Web来进行,如何更好地适应市场的变化、更好地为顾客服务成为各个网站关注的热点。为了更好地解决经营者和顾客的关系,自适应站点成为当前网站设计研究的热点。越来越多的门户站点开始通过自适应网站应用系统向顾客提供有针对性的服务。 站点设计是一个复杂和困难的问题。传统的站点在把设计内容提交给网站服务器以后就不再改变它的设计。既使是数据库驱动的站点,它的设计也是预定义好,只是它的数据在动态改变。如何设计一个自适应站点成为网站设计的首要问题。 用户访问站点的日志文件为我们提供了一个观察用户与站点交互的机会。自适应站点通过观察用户的访问模式,自动改进站点的结构和表现形式以更加适合用户的需求。 本论文首先讨论了Web日志挖掘预处理中的各步骤:数据抽象、数据清洗、用户与会话识别、访问路径补全,给出了每一步骤的算法实现;并特别讨论了含有frame页的日志数据预处理过滤算法。其次讨论了构建自适应站点技术,包括日志数据聚类挖掘、用户访问模式学习、站点结构转化与呈现等;提出了单用户日志访问模型,给出了用户模型在线学习算法、索引页面综合算法、站点结构转化及呈现算法等。最后给出了自适应站点系统模型,包括:Web数据挖掘算法表示装配模块、Web日志数据挖掘处理模块、Web日志挖掘模块、站点结构转化及其呈现模块、系统管理配置模块等,并设计实现了基于该系统模型的实验原型系统AWSS2004。
引用
收藏
页数:77
共 13 条
[1]
数据挖掘原理与算法.[M].邵峰晶;于忠清编著;.中国水利水电出版社.2003,
[2]
数据仓库与数据挖掘技术.[M]..电子工业出版社.2002,
[3]
Knowledge acquisition via incremental conceptual clustering.[J].Douglas H. Fisher.Machine Learning.1987, 2
[4]
基于数据挖掘的个性化学习导航系统的设计与实现 [J].
曲红亭 ;
申瑞民 .
计算机工程, 2003, (08) :59-61
[5]
商务网站客户行为信息挖掘模型的设计 [J].
马辉民 ;
卢益清 .
计算机应用研究, 2002, (08) :140-142
[6]
渐进/分布式网页聚类算法PG+与PG++ [J].
王启新 ;
李毅 ;
董丽 ;
聂宇 ;
王克宏 .
软件学报, 2002, (08) :1500-1507
[7]
基于Web-Log Mining的Web文档聚类 [J].
苏中 ;
马少平 ;
杨强 ;
张宏江 .
软件学报, 2002, (01) :99-104
[8]
基于Web-Log Mining的N元预测模型 [J].
苏中 ;
马少平 ;
杨强 ;
张宏江 .
软件学报, 2002, (01) :136-141
[9]
Web日志挖掘中一种事务识别方法的改进 [J].
施建生 ;
伍卫国 ;
陆丽娜 .
小型微型计算机系统, 2002, (01) :116-118
[10]
Web日志中挖掘用户浏览模式的研究 [J].
施建生 ;
伍卫国 ;
陆丽娜 ;
杨怡玲 .
西安交通大学学报, 2001, (06) :621-624