学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于Web元数据的定题信息采集
被引:2
作者
:
宗校军
论文数:
0
引用数:
0
h-index:
0
机构:
华中科技大学系统工程研究所
宗校军
沈轶
论文数:
0
引用数:
0
h-index:
0
机构:
华中科技大学系统工程研究所
沈轶
廖晓昕
论文数:
0
引用数:
0
h-index:
0
机构:
华中科技大学系统工程研究所
廖晓昕
机构
:
[1]
华中科技大学系统工程研究所
来源
:
系统工程与电子技术
|
2007年
/ 02期
关键词
:
数据处理;
网络信息;
信息采集;
采集策略;
D O I
:
暂无
中图分类号
:
TP311.10 [];
学科分类号
:
081202 ;
0835 ;
摘要
:
针对定题Web检索技术,研究了元数据在定题Web信息采集中的重要作用。设计了基于Web元数据的主题扩展系统及定题信息采集系统,并给出了系统实现的具体步骤。同时提出了基于Web元数据的多种定题信息采集策略。实验证明经主题扩展的Web元数据可作为网页主题相关性的重要判别依据,带增益的元数据平均权值启发式采集策略算法具有较好的性能。
引用
收藏
页码:281 / 284
页数:4
相关论文
共 2 条
[1]
中文分词对中文信息检索系统性能的影响
[J].
曹桂宏
论文数:
0
引用数:
0
h-index:
0
机构:
天津大学计算机科学与技术系
曹桂宏
;
何丕廉
论文数:
0
引用数:
0
h-index:
0
机构:
天津大学计算机科学与技术系
何丕廉
;
吴光远
论文数:
0
引用数:
0
h-index:
0
机构:
天津大学计算机科学与技术系
吴光远
;
聂颂
论文数:
0
引用数:
0
h-index:
0
机构:
天津大学计算机科学与技术系
聂颂
;
不详
论文数:
0
引用数:
0
h-index:
0
机构:
天津大学计算机科学与技术系
不详
.
计算机工程与应用 ,
2003,
(19)
:78
-80+90
[2]
Enhanced hypertext categoriza-tion using hyperlinks. Chakrabarti S,Dom B,Indyk P. Procof ACM SIG-MOD Conference . 1998
←
1
→
共 2 条
[1]
中文分词对中文信息检索系统性能的影响
[J].
曹桂宏
论文数:
0
引用数:
0
h-index:
0
机构:
天津大学计算机科学与技术系
曹桂宏
;
何丕廉
论文数:
0
引用数:
0
h-index:
0
机构:
天津大学计算机科学与技术系
何丕廉
;
吴光远
论文数:
0
引用数:
0
h-index:
0
机构:
天津大学计算机科学与技术系
吴光远
;
聂颂
论文数:
0
引用数:
0
h-index:
0
机构:
天津大学计算机科学与技术系
聂颂
;
不详
论文数:
0
引用数:
0
h-index:
0
机构:
天津大学计算机科学与技术系
不详
.
计算机工程与应用 ,
2003,
(19)
:78
-80+90
[2]
Enhanced hypertext categoriza-tion using hyperlinks. Chakrabarti S,Dom B,Indyk P. Procof ACM SIG-MOD Conference . 1998
←
1
→