Web数据挖掘系统的设计及实现研究

被引:16
作者
乔智勇
刘志镜
机构
[1] 西安电子科技大学计算机信息应用研究中心
[2] 西安电子科技大学计算机信息应用研究中心 西安
[3] 西安
关键词
WWW; web数据挖掘; VSM; HITS; HTML;
D O I
10.16208/j.issn1000-7024.2002.07.012
中图分类号
TP311.12 [];
学科分类号
081202 ; 0835 ;
摘要
在全球信息化进程中,信息超载已经成为一个大问题。Web上信息虽多,但想找到需要的信息却很困难。人们通过点击和搜索引擎与Web进行交互,但是都不能从中准确快捷地获取需要的信息,Web数据挖掘技术就是解决此问题的好方法。讲述了Web数据挖掘的基本理论,根据挖掘对象的不同将其划分为Web内容挖掘、Web链接结构挖掘和Web访问信息挖掘;利用HTML网页的特殊结构性质,提出了一种Web数据挖掘系统的通用框架,并讨论了一些实现的具体技术。
引用
收藏
页码:36 / 38+45 +45
页数:4
相关论文
共 4 条
[1]  
Searching the World Wide Web. Steve Lawrence,Lee Giles C. Science . 1998
[2]  
Accessibility of Information on the Web. Steve Lawrence,Lee GilesC. Nature . 1999
[3]  
Web Usage Mining: Discovery and Application of Interesting Patters from Web Data. Robert Walker Cooley. . 2000
[4]  
The World Wide Web: quagmire or gold mine?. Etzioni O. Communications of the ACM . 1996