基于用户访问事务文法的序列关联规则发现

被引:5
作者
王实
高文
李锦涛
机构
[1] 中国科学院计算技术研究所
[2] 中国科学院计算技术研究所 北京
关键词
Web数据挖掘; 文法; 序列关联规则;
D O I
10.13328/j.cnki.jos.2001.10.009
中图分类号
TP393.03 [];
学科分类号
081201 ; 1201 ;
摘要
在 Web挖掘中 ,应用关联规则发现方法可以发现 Web页面之间用户访问的关联度 .由于 Web站点内含丰富的页面结构信息 ,也由于用户的访问总是要遵循一定的访问顺序 ,因此提出一种新的可以发现用户访问序列之间关联度的方法——序列关联规则发现方法 .该方法首先得到用户访问事务 ;然后根据正则文法 ,定义了一种新的用户访问事务文法 ,用于从用户访问事务中得到用户序列访问事务 ;最后应用关联规则发现算法进而发现序列关联规则 .为了进一步评价所发现的序列关联规则 ,引入了互信息的概念 .发现的序列关联规则可以帮助 Web站点的设计者更好地理解用户的访问 ,以用于调整 Web站点的结构
引用
收藏
页码:1503 / 1509
页数:7
相关论文
共 1 条
[1]  
Data Preparation for Mining World Wide Web Browsing Patterns[J] . Robert Cooley,Bamshad Mobasher,Jaideep Srivastava.Knowledge and Information Systems . 1999 (1)