Web信息抽取

被引:14
作者
李晶
陈恩红
机构
[1] 中国科学技术大学计算机系
[2] 中国科学技术大学计算机系 合肥
[3] 合肥
基金
安徽省自然科学基金;
关键词
Information extraction; Information retrieval; Semi-structured text; Extraction pattern; XML;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
摘要
<正> 1 引言自九十年代初互联网开始迅速发展至今,互联网已成为经济、社会、文化、教育以及娱乐等各个方面的重要组成部分,并正在成为我们工作和生活中不可或缺的一员。随着互联网的迅速发展,互联网上流通的信息也在爆炸性地增长。为帮助互联网用户有效地发布与接受信息,众多的互联网搜索引擎如Yahoo、Excite和Alta Vista等不断涌现,向广大互联网用
引用
收藏
页码:78 / 81
页数:4
相关论文
共 1 条
[1]   Learning Information Extraction Rules for Semi-Structured and Free Text [J].
Stephen Soderland .
Machine Learning, 1999, 34 :233-272