Web挖掘技术

被引:0
作者
李晓
机构
[1] 河海大学
关键词
数据挖掘; Web挖掘; 数据仓库; OLAP; 路径分析; 关联规则;
D O I
暂无
年度学位
2001
学位类型
硕士
导师
摘要
计算机应用的广泛深入发展,使得人类收集到的信息“爆炸性”的增长。 传统的数据库和OLTP技术提供了数据操作性的支持,却不支持对数据的深层次 的处理。数据仓库和OLAP技术的发展,在一定程度上缓解了这个矛盾。而如 何利用现有的计算能力和人类已有知识发现隐藏在信息“海洋”深处的知识,是 人类认知专家、计算机专家、心理学家等所面临的最大挑战。伴随计算能力的增 长,智能算法的成熟及大规模数据存储技术的成熟,作为自动发现知识的工具, 数据挖掘(Data Ming)逐渐走出实验室,进入生产领域并发挥了积极的作用。 20世纪90年代以来,Internet得到了的飞速发展,成为人们工作与学习的 平台。WWW作为最大的信息集散地,更是积聚了海量的信息。网络由此被认为 是人类史上的第四次工业革命。如何从数以亿计的页面中发现需要的内容,如何 从大量的访问中发现固有的模式和关联,成了人们迫切希望解决的问题。Web 挖掘,源于数据挖掘和Internet技术的结合,研究网上内容自动分类,智能Agent, 用户访问模式发现,成了计算机工作者研究的新热点。 本文首先介绍了数据挖掘的一些基本概念、方法和技术、工具。阐明了什么 是数据挖掘、为什么要数据挖掘、如何进行数据挖掘、数据挖掘的主要过程、分 类及数据挖掘与OLAP(在线分析过程)等的联系等,并介绍了有关数据挖掘发 展情况。 然后,本文着重论述了Web挖掘的内容,任务,它与数据挖掘的联系与区 别,并介绍了使用模式挖掘及其技术。在研究基础上,本文提出了一个数据仓库 和Web挖掘结合的模型,并就此进行了实验。 本文最后总结了工作尚存的不足,并指出了Web挖掘研究的方向、应用前 景和它所面临的挑战。
引用
收藏
页数:61
共 14 条
[1]
一种聚类型基于示例学习新方法 [J].
朱明 ;
林世隆 ;
王俊普 .
计算机研究与发展, 2000, (11) :1293-1297
[2]
文本自动分类中的词权重与分类算法 [J].
刁倩 ;
王永成 ;
张惠惠 ;
何骥 .
中文信息学报, 2000, (03) :25-29
[3]
中文搜索引擎概念检索初探 [J].
李蕾 ;
王楠 ;
张剑 ;
钟义信 ;
郭祥昊 ;
贾自燕 .
计算机工程与应用, 2000, (06) :1-3+11
[4]
兴趣度——关联规则的又一个阈值 [J].
周欣 ;
沙朝锋 ;
朱扬勇 ;
施伯乐 .
计算机研究与发展, 2000, (05) :627-633
[5]
经常性周期关联规则的研究 [J].
黄益民 .
计算机科学, 2000, (04) :50-53
[6]
数据挖掘中的数据预处理 [J].
刘明吉 ;
王秀峰 ;
黄亚楼 .
计算机科学, 2000, (04) :54-57
[7]
Web数据挖掘 [J].
王实 ;
高文 ;
李锦涛 .
计算机科学, 2000, (04) :28-31+41
[8]
一种新型的智能搜索引擎 [J].
邓伟 ;
张志伟 ;
谭庆平 ;
宁洪 .
计算机工程, 2000, (03) :8-10
[9]
知识发现方法的比较研究 [J].
陆伟 ;
吴朝晖 .
计算机科学, 2000, (03) :80-84+89
[10]
数据仓库及联机分析处理技术 [J].
杨光 ;
张雷 ;
艾波 .
计算机工程与科学, 2000, (01) :39-42