基于Web元数据的定题信息采集

被引:2
作者
宗校军
沈轶
廖晓昕
机构
[1] 华中科技大学系统工程研究所
关键词
数据处理; 网络信息; 信息采集; 采集策略;
D O I
暂无
中图分类号
TP311.10 [];
学科分类号
081202 ; 0835 ;
摘要
针对定题Web检索技术,研究了元数据在定题Web信息采集中的重要作用。设计了基于Web元数据的主题扩展系统及定题信息采集系统,并给出了系统实现的具体步骤。同时提出了基于Web元数据的多种定题信息采集策略。实验证明经主题扩展的Web元数据可作为网页主题相关性的重要判别依据,带增益的元数据平均权值启发式采集策略算法具有较好的性能。
引用
收藏
页码:281 / 284
页数:4
相关论文
共 2 条
[1]   中文分词对中文信息检索系统性能的影响 [J].
曹桂宏 ;
何丕廉 ;
吴光远 ;
聂颂 ;
不详 .
计算机工程与应用 , 2003, (19) :78-80+90
[2]  
Enhanced hypertext categoriza-tion using hyperlinks. Chakrabarti S,Dom B,Indyk P. Procof ACM SIG-MOD Conference . 1998