基于相对Hamming距离的Web聚类算法

被引:7
作者
李彬 [1 ]
汪天飞 [2 ]
刘才铭 [1 ]
张建东 [1 ]
机构
[1] 乐山师范学院智能信息处理及应用实验室
[2] 乐山师范学院数学与信息科学学院
关键词
聚类算法; 相对Hamming距离; 不一致度; Web使用挖掘; 网络安全;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
针对Web使用挖掘中聚类结果准确性不高的问题,提出了一种改进的基于相对Hamming距离和类不一致度的聚类算法。该算法首先以Web站点的URL为行、以UserID为列建立关联矩阵,元素值为用户的访问次数;然后,对所建立关联矩阵的列向量或行向量进行相似性度量,获得相似客户群体或相关页面。实验表明,该算法具有较高的准确性。
引用
收藏
页码:1387 / 1390
页数:4
相关论文
共 6 条
[1]   Web使用挖掘技术的分析与研究 [J].
朱志国 ;
邓贵仕 .
计算机应用研究, 2008, (01) :29-32+36
[2]   聚类算法研究 [J].
孙吉贵 ;
刘杰 ;
赵连宇 .
软件学报, 2008, (01) :48-61
[3]   一种用于Web搜索的高效聚类算法 [J].
李新叶 ;
苑津莎 .
计算机工程, 2006, (20) :38-39+74
[4]   基于页面内容和站点结构的页面聚类挖掘算法 [J].
杨怡玲 ;
管旭东 ;
尤晋元 .
软件学报, 2002, (03) :467-469
[5]   Web日志的高效多能挖掘算法 [J].
宋擒豹 ;
沈钧毅 .
计算机研究与发展, 2001, (03) :328-333
[6]   Rough clustering of sequential data [J].
Kumar, Pradeep ;
Krishna, P. Radha ;
Bapi, Raju. S. ;
De, Supriya Kumar .
DATA & KNOWLEDGE ENGINEERING, 2007, 63 (02) :183-199