基于有向带权图的页面聚类算法研究

被引:3
作者
方杰
张结魁
周军
机构
[1] 合肥工业大学
基金
国家自然科学基金重点项目;
关键词
有向带权图; 聚类算法; 页面聚类; K-means算法; DBSCAN算法; COBWEB算法;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
聚类算法是数据挖掘中的一个重要的分析工具。Web使用挖掘中的聚类分析一般分为用户聚类和页面聚类。其中页面聚类是指导网站结构离线优化的重要方法。利用有向带权图表示用户的访问会话记录,对建立的有向带权图模型运用聚类算法实现页面聚类。选取真实数据对典型的聚类算法K-means算法、DBSCAN算法和COBWEB算法进行实验。实验结果表明,在选取的数据集范围内,COBWEB算法准确率要高于K-means算法和DBSCAN算法,时间性能与用户访问频率矩阵大小有密切关系。
引用
收藏
页码:49 / 53
页数:5
相关论文
共 9 条
[1]   基于有向带权图的Web用户浏览行为模型 [J].
周军 ;
姜元春 ;
林文龙 .
情报理论与实践, 2008, (05) :795-798
[2]   聚类算法研究 [J].
孙吉贵 ;
刘杰 ;
赵连宇 .
软件学报, 2008, (01) :48-61
[3]   用户兴趣空间的Web页面聚类 [J].
郭岩 .
微电子学与计算机, 2003, (08) :10-14+68
[4]   XML文档及其函数依赖到关系的映射(英文) [J].
王庆 ;
周俊梅 ;
吴红伟 ;
萧建昌 ;
周傲英 .
软件学报, 2003, (07) :1275-1281
[5]   基于页面内容和站点结构的页面聚类挖掘算法 [J].
杨怡玲 ;
管旭东 ;
尤晋元 .
软件学报, 2002, (03) :467-469
[6]   基于Web-Log Mining的Web文档聚类 [J].
苏中 ;
马少平 ;
杨强 ;
张宏江 .
软件学报, 2002, (01) :99-104
[7]   基于归纳化会话的网络用户的聚类 [J].
黄松 ;
刘晓明 ;
宋自林 .
计算机研究与发展, 2001, (10) :1224-1228
[8]   Web日志的高效多能挖掘算法 [J].
宋擒豹 ;
沈钧毅 .
计算机研究与发展, 2001, (03) :328-333
[9]   Web页面和客户群体的模糊聚类算法 [J].
宋擒豹 ;
沈钧毅 .
小型微型计算机系统, 2001, (02) :229-231