Web信息抽取

被引：14

作者：

李晶

陈恩红

机构：

[1] 中国科学技术大学计算机系

[2] 中国科学技术大学计算机系合肥

[3] 合肥

来源：

计算机科学 | 2003年 / 06期

基金：

安徽省自然科学基金;

关键词：

Information extraction; Information retrieval; Semi-structured text; Extraction pattern; XML;

D O I：

暂无

中图分类号：

TP393.092 [];

学科分类号：

摘要：

<正> 1 引言自九十年代初互联网开始迅速发展至今,互联网已成为经济、社会、文化、教育以及娱乐等各个方面的重要组成部分,并正在成为我们工作和生活中不可或缺的一员。随着互联网的迅速发展,互联网上流通的信息也在爆炸性地增长。为帮助互联网用户有效地发布与接受信息,众多的互联网搜索引擎如Yahoo、Excite和Alta Vista等不断涌现,向广大互联网用

引用

页码：78 / 81

页数：4