基于Web使用挖掘的用户消费模式发现研究

被引:0
作者
曲义飞
机构
[1] 大连理工大学
关键词
Web使用挖掘; 用户消费模式; 页面聚类; 用户最大频繁访问路径; 用户聚类;
D O I
暂无
年度学位
2006
学位类型
硕士
导师
摘要
随着Web在信息共享、电子商务和提供在线服务方面的广泛应用,许多企业投入大量资金建立自己的网站用于发布信息,或在别人的网站上为自己的产品和服务作广告,或在网上开展电子商务活动,它们迫切需要了解这些投资产生的效益和作用,以便改进企业的策略,获取更多的商业机会,为用户提供更优质的服务。因此,理解用户的行为对这些企业来说至关重要。 本文以Web日志记录为基础对Web使用挖掘过程进行系统的分析和研究,在前人研究模型的基础上提了四个新的模型方法,并将这些模型引入到Web使用挖掘过程中,设计和实现了一个Web使用挖掘系统(WUMS),从而挖掘出用户的消费模式。 因此,本文的工作主要有以下几个方面: 1、对Web使用挖掘进行了可行性分析,指出了目前所存在的难点,详细介绍了数据预处理的各个步骤,并在路径补充方面提出了一个新的算法——觅父节点补充法。 2、在Web页面聚类方面,本文提出一个新的建立网页相似矩阵的模型,该模型在计算页面的引用相似性方面充分考虑了用户的浏览过程,从而使页面聚类更为合理。 3、在寻找用户最大频繁访问路径方面,传统的Web使用挖掘模型大多都只考虑网页的距离而忽视结构层次,致使数据挖掘精度不高,达不到满意的Web挖掘效果。本文提出一种新的Web用户频繁浏览路径挖掘模型,充分考虑了Web网站结构层次特征,克服传统的挖掘的模型存在的问题。 4、在基于马尔可夫的用户聚类方面,本文在传统的模型的基础上提出了一种新的建立用户马尔可夫转移矩阵模型,新的模型充分考虑了网站的拓扑结构,从而提高了Web使用挖掘的精度。并且成功的将用户聚类的结果与用户最大频繁访问路径相结合,发现用户组的兴趣、爱好,从而为商家做商业决策提供了有力的保障。 最后,将提出的新的模型引入到Web使用挖掘活动中,结合关系数据库的特点设计并实现了一个具有可视化功能的Web使用挖掘系统(WUMS)。本文针对本试验室的网站(http://202.118.69.137:8000)的日志记录,通过对本网站近一个月的日志数据进行挖掘测试,验证了本文提出的新的模型的可行性和有效性。
引用
收藏
页数:79
共 33 条
[1]
Web挖掘技术 [D]. 
李晓 .
河海大学,
2001
[2]
LEARNING BAYESIAN NETWORKS - THE COMBINATION OF KNOWLEDGE AND STATISTICAL-DATA [J].
HECKERMAN, D ;
GEIGER, D ;
CHICKERING, DM .
MACHINE LEARNING, 1995, 20 (03) :197-243
[3]
模糊聚类的最大树算法在Web页面分类中的应用 [J].
刘琦 ;
林怀忠 ;
陈纯 .
计算机应用研究, 2004, (11) :286-287
[4]
WEB页面的模糊聚类 [J].
钟茂生 .
华东交通大学学报, 2004, (05) :59-62
[5]
Web Usage Mining技术在远程教育中的应用 [J].
陆东梅 .
开放教育研究, 2003, (06) :50-52
[6]
Web使用挖掘系统研制中的主要问题和应对策略 [J].
张锋 ;
常会友 .
计算机科学, 2003, (06) :129-132+167
[7]
一种基于Markov链模型的动态聚类方法 [J].
邢永康 ;
马少平 .
计算机研究与发展, 2003, (02) :129-135
[8]
Web数据应用的利器——Web数据挖掘 [J].
张娥 ;
冯耕中 ;
战子玉 .
情报学报, 2002, (06) :686-690
[9]
从Web数据中挖掘频繁访问模式 [J].
潘登 ;
董小社 ;
杨麦顺 ;
冯锐 ;
张晓亮 ;
不详 .
西安交通大学学报 , 2002, (06) :631-634
[10]
Web访问挖掘预处理的用户识别算法 [J].
李煊 ;
庄镇泉 ;
不详 .
计算机工程与应用 , 2002, (07) :173-176