Web超链挖掘:中国境内Web图结构研究

被引:6
作者
丁国栋
王斌
白硕
机构
[1] 中国科学院计算技术研究所
[2] 中国科学院计算技术研究所 北京
[3] 北京
关键词
Web图; 网站; 链接关系; 宽度优先搜索; 强连通分量;
D O I
暂无
中图分类号
TP393.02 [];
学科分类号
081201 ; 1201 ;
摘要
以网站作为Web图的顶点,以网站之间链接为有向边,研究了中国境内Web图的拓扑特点和宏观结构。试验表明:网站的入度和出度分布同样服从幂级数定律(PowerLaw);境内Web图的连通性明显高于全球的Web图,其最大的强连通分量中的网站数超过50%;在境内Web中,如果两个网站之间存在一条有向路径,则从一个网站漫游到另外一个网站,平均只需点击7.1次,最多只需点击29次。
引用
收藏
页码:24 / 26
页数:3
相关论文
共 1 条
[1]   关于中国Web的大小、形状和结构 [J].
闫宏飞 ;
李晓明 .
计算机研究与发展, 2002, (08) :958-967