基于用户访问事务文法的序列关联规则发现

被引：5

作者：

王实

高文

李锦涛

机构：

[1] 中国科学院计算技术研究所

[2] 中国科学院计算技术研究所北京

来源：

软件学报 | 2001年 / 10期

关键词：

Web数据挖掘; 文法; 序列关联规则;

D O I：

10.13328/j.cnki.jos.2001.10.009

中图分类号：

TP393.03 [];

学科分类号：

081201 ; 1201 ;

摘要：

在 Web挖掘中 ,应用关联规则发现方法可以发现 Web页面之间用户访问的关联度 .由于 Web站点内含丰富的页面结构信息 ,也由于用户的访问总是要遵循一定的访问顺序 ,因此提出一种新的可以发现用户访问序列之间关联度的方法——序列关联规则发现方法 .该方法首先得到用户访问事务 ;然后根据正则文法 ,定义了一种新的用户访问事务文法 ,用于从用户访问事务中得到用户序列访问事务 ;最后应用关联规则发现算法进而发现序列关联规则 .为了进一步评价所发现的序列关联规则 ,引入了互信息的概念 .发现的序列关联规则可以帮助 Web站点的设计者更好地理解用户的访问 ,以用于调整 Web站点的结构

引用

页码：1503 / 1509

页数：7