基于用户浏览行为聚类Web用户

被引:14
作者
陈敏
苗夺谦
段其国
机构
[1] 同济大学电子与信息工程学院
[2] 教育部嵌入式系统和服务计算重点实验室
关键词
Web日志挖掘; 聚类; 相似度; 粗糙度;
D O I
暂无
中图分类号
TP393.01 [];
学科分类号
摘要
本文结合Web用户浏览行为的特点,提出了一种新的路径相似度的计算方法,在计算相似度时不仅把用户的浏览模式仅作为一种序列模式来考虑,还充分考虑了用户在网上浏览的时间因素。然后,把粗糙度的概念引入Leader聚类算法中,提出粗糙Leader聚类算法。最后,使用标准数据集进行了试验,证明基于此种相似度计算方法,应用粗糙Leader算法聚类Web用户的有效性。
引用
收藏
页码:186 / 187+255 +255
页数:3
相关论文
共 6 条
[1]  
From data mining to Knowledge discovery:an overview. Fayyad M,,Piatetsky-Shapiro G,Smyth P. Advances in knowledge Discovery and Data Mining . 1996
[2]  
Special issue on Web Intelligence(WI). Zhong N,,Liu J,Yao Y Y. . 2003
[3]  
http://maya.cs.depaul.edu/~classes/ect584/resource.ht ml .
[4]  
Some refinement of K-means clustering. Peters G. Pattern Recognition . 2006
[5]  
Lecture Notes in Computer Science[C]. The First International Conference on Web-Age Information Management,1600
[6]  
A Non-Parametric Approach to Web Log Analysis. Foss A,,Wang W,Za ane O R. Proceedings of Workshop on Web Mining in First International SI AMConference on Data Mining . 2001