基于归纳化会话的网络用户的聚类

被引:6
作者
黄松
刘晓明
宋自林
机构
[1] 通信工程学院计算机科学系
[2] 通信工程学院计算机科学系 南京
[3] 南京
关键词
Web挖掘; 面向属性的归纳; 会话; 会话距离; 归纳化的会话;
D O I
暂无
中图分类号
TP393.01 [];
学科分类号
081201 ; 1201 ;
摘要
为了发掘具有相似的访问兴趣的网络用户 ,探讨了网络用户聚类的问题 .网络用户的访问信息从服务器的日志文件中抽取出来 ,组织成会话向量的形式 ,会话描述为一段时间内用户向服务器发出的一系列访问请求 .为了减少会话向量的维度 ,根据网页的层次性 ,采用面向属性的推理方法 ,对这些会话进行了归纳 .并且定义了一个新的距离测度来描述两个会话之间的相似度 ,最后采用某种非欧几里德的关系聚类算法聚类这些归纳化的会话 .实验表明 ,这种方法对在大型的日志文件集中挖掘出有意义的网络用户的分类是高效可行的 .
引用
收藏
页码:1224 / 1228
页数:5
相关论文
共 4 条
[1]  
Mining Web access logs using a relational clustering algorithm based on a robust estimator.In: Proc of the 8th Int’ l World Wide Web Conference. Nasraoui O,Krishnapuram R,Joshi A. Toronto . 1999
[2]  
Mining Web access logs using relational competitive fuzzy clustering.In: Proc of the 8th Int’ l Fuzzy Systems Association Congress. Nasraoui O,Frigui H,Joshi A et al. Taiwan . 1999
[3]  
Knowledge Discovery in Database:An Attribute -Oriented Approach. Han Jiawei,et al. Proc.18th Intl.Conf.on VLDB . 1992
[4]  
Pattern recognition.[P]. DIEP THANH A;AVI-ITZHAK HADAR I;GARLAND HARRY T.EP0622750A2,1994-11-02