一种基于会话聚类算法的Web使用挖掘方法

被引:5
作者
陈富赞
刘青
李敏强
寇纪淞
机构
[1] 天津大学管理与经济学部
关键词
Web使用挖掘; Web日志; 用户会话; 聚类;
D O I
暂无
中图分类号
TP18 [人工智能理论]; TP311.13 [];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ; 1201 ;
摘要
Web使用挖掘作为数据挖掘的一个重要任务,有助于了解用户群体的特征,从而为其提供个性化服务.提出了一种基于用户会话聚类的Web使用挖掘算法.首先,对Web日志预处理采用基于时间窗的用户会话识别方法,提出了一种基于三元组的用户会话表示方法,并在此基础上给出了基于网页语义相似性的会话处理方法,该方法能够在保持用户兴趣不变的情况下有效降低会话维度;其次,提出了一种基于时间及频次的用户会话相似性度量方法;最后,设计了一种两阶段PS-KM会话聚类算法,先用PSO方法进行全局搜索再转入基于K-means方法的局部聚类过程.仿真表明了算法的有效性.
引用
收藏
页码:129 / 136
页数:8
相关论文
共 4 条
[1]   基于模糊粗糙近似的web浏览模式的聚类 [J].
吴瑞 ;
宁玉富 ;
郭长友 .
系统工程学报, 2010, (01) :132-136+144
[2]   Particle swarm optimizationAn overview [J].
Riccardo Poli ;
James Kennedy ;
Tim Blackwell .
Swarm Intelligence, 2007, 1 (1) :33-57
[3]   A framework for the evaluation of session reconstruction heuristics in web-usage analysis [J].
Spiliopoulou, M ;
Mobasher, B ;
Berendt, B ;
Nakagawa, M .
INFORMS JOURNAL ON COMPUTING, 2003, 15 (02) :171-190
[4]  
From user access patterns to dynamic hypertext linking[J] . Tak Woon Yan,Matthew Jacobsen,Hector Garcia-Molina,Umeshwar Dayal. Computer Networks and ISDN Systems . 1996 (7)