基于粗糙集和模糊聚类的WEB使用挖掘的研究

被引:0
作者
高晓琴
机构
[1] 西南交通大学
关键词
数据挖掘; Web使用挖掘; 粗糙集; 模糊聚类;
D O I
暂无
年度学位
2006
学位类型
硕士
导师
摘要
数据挖掘是近年来随着数据库技术和人工智能技术的发展而出现的一种新的信息技术,它融合了数据库、人工智能以及统计学等多种学科,试图从数据库中提取出先前未知、有效和实用的知识。Web数据挖掘是传统数据挖掘技术在Web环境下的应用,是从Web上的数据(如Web日志、页面内容等)中发现用户的浏览模式或寻找相关的Web页面等。Web使用挖掘主要是对于Web日志数据进行分析处理。而Web日志数据通常是大量的,冗余的,日志中的页面之间的关系也是模糊的,不确定的。粗糙集理论是有效处理不精确、不确定和含糊信息的软计算工具,模糊聚类分析是依据客观事务间的特征、亲疏程度和相似性,通过建立模糊相似关系对客观事务进行分类的方法。Web使用挖掘可以从网站的日志数据中抽取用户感兴趣的模式,理解用户的浏览兴趣行为,以便进一步改善网站结构,为用户提供个性化服务。所以本文提出的粗糙集理论和聚类算法在Web使用上的挖掘研究是具有一定的理论意义和现实意义的。 论文首先介绍了数据挖掘和Web数据挖掘的基本理论和方法;其次介绍了粗糙集理论和模糊聚类算法;再结合具体Web日志数据提出了Web使用挖掘的方法及Web日志数据模型,并建立了基于模糊聚类算法的页面用户聚类的一般模型。在第五章中进一步利用上述理论对Web日志数据进行预处理,并利用粗集理论对预处理结果中的教务网页面约简,得到在不影响问题分析基础上的有效页面。最后利用模糊等价关系矩阵和图的模糊聚类方法,在上述数据处理的基础上对其进行了进一步的分析研究。论文利用Java语言结合教务网数据源实现了算法编程。
引用
收藏
页数:80
共 24 条
[1]
基于粗糙集的Web用户模式挖掘研究 [D]. 
邓松林 .
重庆大学,
2003
[2]
Web使用挖掘技术研究综述 [J].
陈健 ;
印鉴 .
计算机工程, 2005, (09) :4-6
[3]
电子商务网站用户访问模式挖掘中的预处理技术 [J].
郭伟刚 .
计算机应用, 2005, (03) :691-694
[4]
结合粗糙集和模糊聚类方法的属性约简算法 [J].
刘靖 ;
陈福生 .
计算机应用与软件, 2004, (11) :72-74
[5]
基于粗集的模糊聚类方法和结果评估 [J].
孙惠琴 ;
熊璋 .
复旦学报(自然科学版), 2004, (05) :819-822
[6]
Web挖掘研究综述 [J].
朱丽红 ;
赵燕平 ;
不详 .
情报杂志 , 2004, (07) :2-5
[7]
数据挖掘中的模糊聚类分析及其应用 [J].
梁伍七 ;
江克勤 .
安庆师范学院学报(自然科学版), 2004, (02) :65-67
[8]
Web日志挖掘数据预处理研究 [J].
童恒庆 ;
梅清 .
现代计算机(专业版), 2004, (03) :6-9+13
[9]
数据挖掘研究现状及最新进展 [J].
章成志 .
南京工业职业技术学院学报, 2003, (02) :1-5
[10]
一种新的Web事务模糊聚类算法的研究 [J].
邢东山 ;
宋擒豹 ;
沈钧毅 .
西安交通大学学报, 2002, (08) :822-825+838