Web使用挖掘中的一种改进的会话识别方法

被引:27
作者
殷贤亮
张为
机构
[1] 华中科技大学计算机科学与技术学院
关键词
Web挖掘; 会话; 预处理; 阈值;
D O I
10.13245/j.hust.2006.07.011
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
针对Web日志挖掘中的会话识别问题,提出了一种改进的基于时间间隔的识别方法.该方法通过使用访问时间间隔超出某个阈值来识别会话.统计结果表明页面的访问时间呈正态分布,改进的方法在此基础之上为页面设置访问时间阈值,并根据页面内容及站点结构确定的页面重要程度对该阈值进行调整.实验结果表明,相对于传统的对所有用户页面使用单一的先验阈值进行会话识别的方法,该方法能更准确地确定页面访问时间阈值,更为合理有效.
引用
收藏
页码:33 / 35
页数:3
相关论文
共 1 条
  • [1] Web挖掘研究
    韩家炜
    孟小峰
    王静
    李盛恩
    不详
    [J]. 计算机研究与发展 , 2001, (04) : 405 - 414