一种改进的Web日志会话识别方法

被引:7
作者
方元康 [1 ,2 ]
胡学钢 [1 ]
夏启寿 [2 ]
机构
[1] 合肥工业大学计算机信息学院
[2] 池州学院计算机中心
基金
安徽省自然科学基金;
关键词
Web挖掘; 数据预处理; 阈值; Frame页面; 会话识别;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
080402 ;
摘要
会话识别是Web日志挖掘中的数据预处理中的一个重要步骤。文中提出了一种改进的会话识别方法。首先,在用户识别后,进行框架页面的过滤,从而大大地减少了实验产生的有效页面,然后为页面设置访问时间阈值,并根据页面内容及站点结构确定的页面重要程度对该阈值进行调整。通过实验证明,相对于传统的对所有页面使用单一的先验阈值进行会话识别的方法,该方法所得到的会话集更具有真实性。
引用
收藏
页码:214 / 216
页数:3
相关论文
共 3 条
[1]   Web访问挖掘的预处理技术的研究 [J].
熊忠阳 ;
周亚峰 .
计算机技术与发展, 2007, (08) :11-14+18
[2]   Frame页面过滤算法在Web日志挖掘预处理中的应用 [J].
金松河 ;
钱慎一 ;
张素智 .
云南民族大学学报(自然科学版), 2006, (01) :63-65
[3]  
Data Preparation for Mining World Wide Web Browsing Patterns[J] . Robert Cooley,Bamshad Mobasher,Jaideep Srivastava.Knowledge and Information Systems . 1999 (1)