一种用于Web搜索的高效聚类算法

被引:3
作者
李新叶
苑津莎
机构
[1] 华北电力大学电子与通信工程系
关键词
聚类; Hamming距离; 搜索引擎;
D O I
暂无
中图分类号
TP393.02 [];
学科分类号
081201 ; 1201 ;
摘要
根据搜索引擎的用户查询日志库信息对用户访问模式聚类算法进行了研究,说明了用雅可比系数及加权相似性度量公式实现用户访问模式聚类的不足,提出了一种改进的Hamming距离公式,运用距离测度法实现用户访问模式聚类,给出了聚类算法。对算法的分析表明,基于偶图和改进Hamming距离公式的算法是准确和高效的。
引用
收藏
页码:38 / 39+74 +74
页数:3
相关论文
共 6 条
[1]   结合网站内容和结构进行的Web日志挖掘 [J].
江宝林 ;
申展 ;
张川 ;
葛家翔 ;
胡运发 .
计算机工程, 2004, (16) :30-32
[2]   一种Web用户行为聚类算法 [J].
业宁 ;
李威 ;
梁作鹏 ;
董逸生 .
小型微型计算机系统, 2004, (07) :1364-1367
[3]   对聚类算法普遍存在问题的解决办法 [J].
姜园 ;
张朝阳 ;
仇佩亮 ;
戚玉鹏 .
电路与系统学报, 2004, (03) :92-99
[4]   搜索引擎结果聚类算法研究 [J].
张健沛 ;
刘洋 ;
杨静 ;
代坤 .
计算机工程, 2004, (05) :95-97
[5]   加权Web访问模式聚类算法 [J].
金阳 ;
左万利 .
吉林大学自然科学学报, 2001, (03) :45-47
[6]   Web日志的高效多能挖掘算法 [J].
宋擒豹 ;
沈钧毅 .
计算机研究与发展, 2001, (03) :328-333