基于Web日志的高精度聚类算法

被引:4
作者
金松河
钱慎一
张素智
机构
[1] 郑州轻工业学院计算机与通信工程学院
关键词
网络; Web日志挖掘; 会话聚类; 结构层次;
D O I
10.15926/j.cnki.issn1672-6871.2006.02.015
中图分类号
TP393.092 [];
学科分类号
摘要
提出一种Web日志挖掘算法,该算法首先以Web站点的URL为行、以用户的UserID为列,建立URL- UserID关联矩阵,元素值为用户的访问次数;然后,对行向量进行相似性度量获得用户会话粗聚类,最后,利用层次结构对比聚类算法,对用户会话粗聚类进行进一步地处理得到更高精度的聚类,实验表明该算法在提高聚类精度方面卓有成效。
引用
收藏
页码:49 / 51+7 +7
页数:4
相关论文
共 8 条
[1]   结合网站内容和结构进行的Web日志挖掘 [J].
江宝林 ;
申展 ;
张川 ;
葛家翔 ;
胡运发 .
计算机工程, 2004, (16) :30-32
[2]   一种从Web日志中挖掘访问模式的新算法 [J].
肖国强 ;
肖轶 .
华中科技大学学报(自然科学版), 2004, (05) :70-72
[3]   基于Web的工业设计信息系统设计与实现 [J].
许占民 ;
陆长德 ;
李桂琴 .
河南科技大学学报(自然科学版), 2004, (01) :34-37
[4]   从Web日志中挖掘用户浏览偏爱路径 [J].
邢东山 ;
沈钧毅 ;
宋擒豹 .
计算机学报, 2003, (11) :1518-1523
[5]   基于Web三层结构的统计管理系统 [J].
刘俊强 ;
霍华 ;
普杰信 .
河南科技大学学报(自然科学版), 2003, (03) :72-75
[6]   Web日志文件的异常数据挖掘算法及其应用 [J].
赵泽茂 ;
何坤金 ;
陈鹏 ;
景雪琴 ;
蒋霞东 .
计算机工程, 2003, (17) :195-197
[7]   信息系统数据清洗、规则提取的矩阵算法 [J].
谭天乐 ;
宋执环 ;
李平 .
信息与控制, 2003, (04) :289-294
[8]  
基于Web日志和缓存数据挖掘的个性化推荐系统[J]. 王勋,凌云,费玉莲.情报学报. 2005 (03)