基于用户特性的Web会话模式聚类算法

被引:2
作者
郑富兰
吴瑞
机构
[1] 山西师范大学数学与计算机科学学院
关键词
Web挖掘; Web用户聚类; 聚类算法; 模式聚类; k-means;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
Web用户聚类是通过分析用户会话,将具有相同或相似访问特征的用户聚为一类。在会话相似性度量方面综合考虑了网页浏览时间和访问频次两个因素,并考虑到用户个人习惯、能力等因素对浏览时间的影响,将浏览时间处理为RDP(Reduce the Differences in Personality)浏览时间,以降低其个性特征。为此,提出一种基于用户特性的RDPk-means聚类算法。实验表明,该算法可以有效实现用户会话的聚类,聚类结果客观合理。
引用
收藏
页码:283 / 286
页数:4
相关论文
共 14 条
[1]  
Knowledge discovery from users Web-page navigation. Shahabi C,Zarkesh A M,Adibi J,et al. 7th International Workshop on Research Issues of Data Mining Engineering High Performance Database Management for Large-Scale Applications . 1997
[2]  
不确定理论与Web挖掘[M]. 电子工业出版社 , 吴瑞, 2011
[3]  
Measuring similarity ofinterests for clustering web-users. Xiao Jitian,Zhang Yanchun,Jia Xiaohua, et al. Proceedings of the12th Australian DatabaseConference . 2001
[4]  
Agglomerative clustering of a search engine query log. Doug Beeferman,Adam Berger. Proc of the 6th ACM SIGKDD In-ternational Conference on Knowledge Discovery and Data Mining . 2000
[5]  
Web page clustering using a self-organizing map of user navigation patterns[J] . Kate A. Smith,Alan Ng. &nbspDecision Support Systems . 2002 (2)
[6]   基于概念格的序列模式挖掘 [J].
聂成林 ;
王浩 ;
胡学钢 .
计算机工程, 2003, (20) :60-62+79
[7]  
A cluster separation measure. Davies D L,Bouldin D W. IEEE Transactions on Pattern Analysis and Machine Intelligence . 1979
[8]  
Sequence-based clustering for Web usage mining: A new experimental framework and ANN-enhanced K-means algorithm[J] . Sungjune Park,Nallan C. Suresh,Bong-Keun Jeong. &nbspData & Knowledge Engineering . 2008 (3)
[9]  
Pattern recognition principles. Tou JT,Gonzalez RC. . 1974
[10]   基于用户浏览时间的模式聚类算法 [J].
管涛 ;
罗建军 ;
冯博琴 ;
不详 .
计算机工程与应用 , 2003, (15) :104-105+202