一种基于有向树挖掘Web日志中最大频繁访问模式的方法

被引:8
作者
詹宇斌
殷建平
张玲
龙军
程杰仁
机构
[1] 国防科学技术大学计算机学院
关键词
Web使用挖掘; 最大频繁访问模式; 有向树; Web日志;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
080402 ;
摘要
提出了一种基于Apriori思想的挖掘最大频繁访问模式的s-Tree算法。该算法使用有向树表示用户会话,能挖掘出最大前向引用事务和用户的浏览偏爱路径;使用一种基于内容页面优先的支持度计算方法,能挖掘出传统算法不能发现的特定的用户访问模式;使用频繁模式树连接分层的频繁弧克服了图结构数据挖掘算法中直接连接两个频繁模式树要判断连接条件的缺点,同时采用预剪枝策略,降低了算法的开销。实验表明,s-Tree算法具有可扩展性,运行效率比直接采用图结构数据挖掘算法要高。
引用
收藏
页码:1662 / 1665
页数:4
相关论文
共 3 条
[1]   基于图论的频繁模式挖掘 [J].
汪卫 ;
周皓峰 ;
袁晴晴 ;
楼宇波 ;
施伯乐 .
计算机研究与发展, 2005, (02) :230-235
[2]   Web挖掘研究 [J].
韩家炜 ;
孟小峰 ;
王静 ;
李盛恩 ;
不详 .
计算机研究与发展 , 2001, (04) :405-414
[3]   Mining web log sequential patterns with position coded pre-order linked WAP-tree [J].
Ezeife, CI ;
Lu, Y .
DATA MINING AND KNOWLEDGE DISCOVERY, 2005, 10 (01) :5-38