一种改进的Web日志会话识别方法

被引：7

作者：

方元康 ^{[1
,2
]}

胡学钢 ^{[1
]}

夏启寿 ^{[2
]}

机构：

[1] 合肥工业大学计算机信息学院

[2] 池州学院计算机中心

来源：

计算机技术与发展 | 2008年 / 11期

基金：

安徽省自然科学基金;

关键词：

Web挖掘; 数据预处理; 阈值; Frame页面; 会话识别;

D O I：

暂无

中图分类号：

TP393.092 [];

学科分类号：

080402 ;

摘要：

会话识别是Web日志挖掘中的数据预处理中的一个重要步骤。文中提出了一种改进的会话识别方法。首先,在用户识别后,进行框架页面的过滤,从而大大地减少了实验产生的有效页面,然后为页面设置访问时间阈值,并根据页面内容及站点结构确定的页面重要程度对该阈值进行调整。通过实验证明,相对于传统的对所有页面使用单一的先验阈值进行会话识别的方法,该方法所得到的会话集更具有真实性。

引用

页码：214 / 216

页数：3