学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
用户兴趣空间的Web页面聚类
被引:8
作者
:
郭岩
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所北京
郭岩
机构
:
[1]
中国科学院计算技术研究所北京
来源
:
微电子学与计算机
|
2003年
/ 08期
关键词
:
日志挖掘;
聚类;
用户兴趣空间;
对偶性;
D O I
:
10.19304/j.cnki.issn1000-7180.2003.08.003
中图分类号
:
TP393.092 [];
学科分类号
:
080402 ;
摘要
:
文章基于日志挖掘,提出一种在用户兴趣空间中进行Web页面聚类的算法。算法的基础是用户访问频率矩阵A。A的行对应页面向量,列对应用户向量,A中元素是用户对页面的访问频率。对A中的行做聚类可以对页面进行相关聚类,对A中的列做聚类可以对兴趣相似的用户进行聚类。文章认为A中的这两种聚类是一对对偶问题。文章基于A和A中这两种聚类在权重之间的对偶关系,提出了用户兴趣空间的概念。用户兴趣空间突出了用户的共同兴趣,是一个正交空间。实验结果表明,与在A中直接做页面聚类相比较,用户兴趣空间中的页面聚类取得了较好的效果。
引用
收藏
页码:10 / 14+68 +68
页数:6
相关论文
共 5 条
[1]
文本聚类中权重计算的对偶性策略
[J].
卜东波
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
卜东波
;
白硕
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
白硕
;
李国杰
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
李国杰
.
软件学报,
2002,
(11)
:2083
-2089
[2]
基于Web-Log Mining的Web文档聚类
[J].
苏中
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
苏中
;
马少平
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
马少平
;
论文数:
引用数:
h-index:
机构:
杨强
;
张宏江
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
张宏江
.
软件学报,
2002,
(01)
:99
-104
[3]
基于归纳化会话的网络用户的聚类
[J].
黄松
论文数:
0
引用数:
0
h-index:
0
机构:
通信工程学院计算机科学系
黄松
;
刘晓明
论文数:
0
引用数:
0
h-index:
0
机构:
通信工程学院计算机科学系
刘晓明
;
宋自林
论文数:
0
引用数:
0
h-index:
0
机构:
通信工程学院计算机科学系
宋自林
.
计算机研究与发展,
2001,
(10)
:1224
-1228
[4]
Web日志的高效多能挖掘算法
[J].
宋擒豹
论文数:
0
引用数:
0
h-index:
0
机构:
西安交通大学计算机科学与技术系!西安,西安交通大学计算机科学与技术系!西安
宋擒豹
;
论文数:
引用数:
h-index:
机构:
沈钧毅
.
计算机研究与发展,
2001,
(03)
:328
-333
[5]
线性代数及其应用.[M].[美]C·Strang 著;侯自新等 译.南开大学出版社.1990,
←
1
→
共 5 条
[1]
文本聚类中权重计算的对偶性策略
[J].
卜东波
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
卜东波
;
白硕
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
白硕
;
李国杰
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
李国杰
.
软件学报,
2002,
(11)
:2083
-2089
[2]
基于Web-Log Mining的Web文档聚类
[J].
苏中
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
苏中
;
马少平
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
马少平
;
论文数:
引用数:
h-index:
机构:
杨强
;
张宏江
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
张宏江
.
软件学报,
2002,
(01)
:99
-104
[3]
基于归纳化会话的网络用户的聚类
[J].
黄松
论文数:
0
引用数:
0
h-index:
0
机构:
通信工程学院计算机科学系
黄松
;
刘晓明
论文数:
0
引用数:
0
h-index:
0
机构:
通信工程学院计算机科学系
刘晓明
;
宋自林
论文数:
0
引用数:
0
h-index:
0
机构:
通信工程学院计算机科学系
宋自林
.
计算机研究与发展,
2001,
(10)
:1224
-1228
[4]
Web日志的高效多能挖掘算法
[J].
宋擒豹
论文数:
0
引用数:
0
h-index:
0
机构:
西安交通大学计算机科学与技术系!西安,西安交通大学计算机科学与技术系!西安
宋擒豹
;
论文数:
引用数:
h-index:
机构:
沈钧毅
.
计算机研究与发展,
2001,
(03)
:328
-333
[5]
线性代数及其应用.[M].[美]C·Strang 著;侯自新等 译.南开大学出版社.1990,
←
1
→