学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
Web挖掘技术
被引:0
作者
:
论文数:
引用数:
h-index:
机构:
李晓
机构
:
[1]
河海大学
关键词
:
数据挖掘;
Web挖掘;
数据仓库;
OLAP;
路径分析;
关联规则;
D O I
:
暂无
年度学位
:
2001
学位类型
:
硕士
导师
:
胡吉明;
摘要
:
计算机应用的广泛深入发展,使得人类收集到的信息“爆炸性”的增长。 传统的数据库和OLTP技术提供了数据操作性的支持,却不支持对数据的深层次 的处理。数据仓库和OLAP技术的发展,在一定程度上缓解了这个矛盾。而如 何利用现有的计算能力和人类已有知识发现隐藏在信息“海洋”深处的知识,是 人类认知专家、计算机专家、心理学家等所面临的最大挑战。伴随计算能力的增 长,智能算法的成熟及大规模数据存储技术的成熟,作为自动发现知识的工具, 数据挖掘(Data Ming)逐渐走出实验室,进入生产领域并发挥了积极的作用。 20世纪90年代以来,Internet得到了的飞速发展,成为人们工作与学习的 平台。WWW作为最大的信息集散地,更是积聚了海量的信息。网络由此被认为 是人类史上的第四次工业革命。如何从数以亿计的页面中发现需要的内容,如何 从大量的访问中发现固有的模式和关联,成了人们迫切希望解决的问题。Web 挖掘,源于数据挖掘和Internet技术的结合,研究网上内容自动分类,智能Agent, 用户访问模式发现,成了计算机工作者研究的新热点。 本文首先介绍了数据挖掘的一些基本概念、方法和技术、工具。阐明了什么 是数据挖掘、为什么要数据挖掘、如何进行数据挖掘、数据挖掘的主要过程、分 类及数据挖掘与OLAP(在线分析过程)等的联系等,并介绍了有关数据挖掘发 展情况。 然后,本文着重论述了Web挖掘的内容,任务,它与数据挖掘的联系与区 别,并介绍了使用模式挖掘及其技术。在研究基础上,本文提出了一个数据仓库 和Web挖掘结合的模型,并就此进行了实验。 本文最后总结了工作尚存的不足,并指出了Web挖掘研究的方向、应用前 景和它所面临的挑战。
引用
收藏
页数:61
共 14 条
[1]
一种聚类型基于示例学习新方法
[J].
论文数:
引用数:
h-index:
机构:
朱明
;
论文数:
引用数:
h-index:
机构:
林世隆
;
论文数:
引用数:
h-index:
机构:
王俊普
.
计算机研究与发展,
2000,
(11)
:1293
-1297
[2]
文本自动分类中的词权重与分类算法
[J].
刁倩
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学电脑应用技术研究所!上海
刁倩
;
王永成
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学电脑应用技术研究所!上海
王永成
;
论文数:
引用数:
h-index:
机构:
张惠惠
;
何骥
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学电脑应用技术研究所!上海
何骥
.
中文信息学报,
2000,
(03)
:25
-29
[3]
中文搜索引擎概念检索初探
[J].
李蕾
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,首都信息发展有限公司网络多媒体实验室!北京,北京工业大学计算机学院!北京
李蕾
;
王楠
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,首都信息发展有限公司网络多媒体实验室!北京,北京工业大学计算机学院!北京
王楠
;
张剑
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,首都信息发展有限公司网络多媒体实验室!北京,北京工业大学计算机学院!北京
张剑
;
钟义信
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,首都信息发展有限公司网络多媒体实验室!北京,北京工业大学计算机学院!北京
钟义信
;
郭祥昊
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,首都信息发展有限公司网络多媒体实验室!北京,北京工业大学计算机学院!北京
郭祥昊
;
贾自燕
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,首都信息发展有限公司网络多媒体实验室!北京,北京工业大学计算机学院!北京
贾自燕
.
计算机工程与应用,
2000,
(06)
:1
-3+11
[4]
兴趣度——关联规则的又一个阈值
[J].
论文数:
引用数:
h-index:
机构:
周欣
;
论文数:
引用数:
h-index:
机构:
沙朝锋
;
论文数:
引用数:
h-index:
机构:
朱扬勇
;
论文数:
引用数:
h-index:
机构:
施伯乐
.
计算机研究与发展,
2000,
(05)
:627
-633
[5]
经常性周期关联规则的研究
[J].
论文数:
引用数:
h-index:
机构:
黄益民
.
计算机科学,
2000,
(04)
:50
-53
[6]
数据挖掘中的数据预处理
[J].
论文数:
引用数:
h-index:
机构:
刘明吉
;
王秀峰
论文数:
0
引用数:
0
h-index:
0
机构:
南开大学计算机与系统科学系,南开大学计算机与系统科学系,南开大学计算机与系统科学系天津,天津,天津
王秀峰
;
论文数:
引用数:
h-index:
机构:
黄亚楼
.
计算机科学,
2000,
(04)
:54
-57
[7]
Web数据挖掘
[J].
论文数:
引用数:
h-index:
机构:
王实
;
论文数:
引用数:
h-index:
机构:
高文
;
论文数:
引用数:
h-index:
机构:
李锦涛
.
计算机科学,
2000,
(04)
:28
-31+41
[8]
一种新型的智能搜索引擎
[J].
论文数:
引用数:
h-index:
机构:
邓伟
;
张志伟
论文数:
0
引用数:
0
h-index:
0
机构:
国防科技大学计算机学院!长沙,国防科技大学计算机学院!长沙,国防科技大学计算机学院!长沙,国防科技大学计算机学院!长沙
张志伟
;
论文数:
引用数:
h-index:
机构:
谭庆平
;
论文数:
引用数:
h-index:
机构:
宁洪
.
计算机工程,
2000,
(03)
:8
-10
[9]
知识发现方法的比较研究
[J].
论文数:
引用数:
h-index:
机构:
陆伟
;
论文数:
引用数:
h-index:
机构:
吴朝晖
.
计算机科学,
2000,
(03)
:80
-84+89
[10]
数据仓库及联机分析处理技术
[J].
论文数:
引用数:
h-index:
机构:
杨光
;
论文数:
引用数:
h-index:
机构:
张雷
;
论文数:
引用数:
h-index:
机构:
艾波
.
计算机工程与科学,
2000,
(01)
:39
-42
←
1
2
→
共 14 条
[1]
一种聚类型基于示例学习新方法
[J].
论文数:
引用数:
h-index:
机构:
朱明
;
论文数:
引用数:
h-index:
机构:
林世隆
;
论文数:
引用数:
h-index:
机构:
王俊普
.
计算机研究与发展,
2000,
(11)
:1293
-1297
[2]
文本自动分类中的词权重与分类算法
[J].
刁倩
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学电脑应用技术研究所!上海
刁倩
;
王永成
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学电脑应用技术研究所!上海
王永成
;
论文数:
引用数:
h-index:
机构:
张惠惠
;
何骥
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学电脑应用技术研究所!上海
何骥
.
中文信息学报,
2000,
(03)
:25
-29
[3]
中文搜索引擎概念检索初探
[J].
李蕾
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,首都信息发展有限公司网络多媒体实验室!北京,北京工业大学计算机学院!北京
李蕾
;
王楠
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,首都信息发展有限公司网络多媒体实验室!北京,北京工业大学计算机学院!北京
王楠
;
张剑
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,首都信息发展有限公司网络多媒体实验室!北京,北京工业大学计算机学院!北京
张剑
;
钟义信
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,首都信息发展有限公司网络多媒体实验室!北京,北京工业大学计算机学院!北京
钟义信
;
郭祥昊
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,首都信息发展有限公司网络多媒体实验室!北京,北京工业大学计算机学院!北京
郭祥昊
;
贾自燕
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,北京邮电大学信息工程系!北京,首都信息发展有限公司网络多媒体实验室!北京,北京工业大学计算机学院!北京
贾自燕
.
计算机工程与应用,
2000,
(06)
:1
-3+11
[4]
兴趣度——关联规则的又一个阈值
[J].
论文数:
引用数:
h-index:
机构:
周欣
;
论文数:
引用数:
h-index:
机构:
沙朝锋
;
论文数:
引用数:
h-index:
机构:
朱扬勇
;
论文数:
引用数:
h-index:
机构:
施伯乐
.
计算机研究与发展,
2000,
(05)
:627
-633
[5]
经常性周期关联规则的研究
[J].
论文数:
引用数:
h-index:
机构:
黄益民
.
计算机科学,
2000,
(04)
:50
-53
[6]
数据挖掘中的数据预处理
[J].
论文数:
引用数:
h-index:
机构:
刘明吉
;
王秀峰
论文数:
0
引用数:
0
h-index:
0
机构:
南开大学计算机与系统科学系,南开大学计算机与系统科学系,南开大学计算机与系统科学系天津,天津,天津
王秀峰
;
论文数:
引用数:
h-index:
机构:
黄亚楼
.
计算机科学,
2000,
(04)
:54
-57
[7]
Web数据挖掘
[J].
论文数:
引用数:
h-index:
机构:
王实
;
论文数:
引用数:
h-index:
机构:
高文
;
论文数:
引用数:
h-index:
机构:
李锦涛
.
计算机科学,
2000,
(04)
:28
-31+41
[8]
一种新型的智能搜索引擎
[J].
论文数:
引用数:
h-index:
机构:
邓伟
;
张志伟
论文数:
0
引用数:
0
h-index:
0
机构:
国防科技大学计算机学院!长沙,国防科技大学计算机学院!长沙,国防科技大学计算机学院!长沙,国防科技大学计算机学院!长沙
张志伟
;
论文数:
引用数:
h-index:
机构:
谭庆平
;
论文数:
引用数:
h-index:
机构:
宁洪
.
计算机工程,
2000,
(03)
:8
-10
[9]
知识发现方法的比较研究
[J].
论文数:
引用数:
h-index:
机构:
陆伟
;
论文数:
引用数:
h-index:
机构:
吴朝晖
.
计算机科学,
2000,
(03)
:80
-84+89
[10]
数据仓库及联机分析处理技术
[J].
论文数:
引用数:
h-index:
机构:
杨光
;
论文数:
引用数:
h-index:
机构:
张雷
;
论文数:
引用数:
h-index:
机构:
艾波
.
计算机工程与科学,
2000,
(01)
:39
-42
←
1
2
→