Web表格信息抽取研究综述

被引:11
作者
赵洪
肖洪
薛德军
师庆辉
机构
[1] 中国学术期刊(光盘版)电子杂志社
关键词
Web表格; 信息抽取; 表格定位; 表格结构识别; 表格内容整合;
D O I
暂无
中图分类号
TP393.09 [];
学科分类号
080402 ;
摘要
介绍Web表格的特点与结构、Web表格信息抽取及其过程,分析Web表格信息抽取的4个关键技术:Web表格定位、Web表格结构识别、Web表格内容整合和抽取结果表示,以及Web表格信息抽取的应用。最后指出目前国内外该项研究的不足之处及未来发展方向。
引用
收藏
页码:24 / 31
页数:8
相关论文
共 10 条
[1]   信息抽取研究综述 [J].
李保利 ;
陈玉忠 ;
俞士汶 .
计算机工程与应用, 2003, (10) :1-5+66
[2]   识别和抽取Web列表中的关系信息 [J].
吴扬扬 ;
陈锻生 .
计算机科学, 2004, (06) :86-88+122
[3]   基于本体的WEB表格信息抽取 [J].
王放 ;
顾宁 ;
吴国文 .
小型微型计算机系统, 2003, (12) :2142-2146
[4]  
基于ontology的Web表格内容抽取的研究与实现[D]. 林琳.电子科技大学 2006
[5]  
Web页中表格结构识别的研究与实现[D]. 林科锵.电子科技大学 2006
[6]   Towards ontology generation from tables [J].
Tijerino, YA ;
Embley, DW ;
Lonsdale, DW ;
Ding, YH ;
Nagy, G .
WORLD WIDE WEB-INTERNET AND WEB INFORMATION SYSTEMS, 2005, 8 (03) :261-285
[7]   Table structure understanding and its performance evaluation [J].
Wang, YL ;
Phillips, IT ;
Haralick, RM .
PATTERN RECOGNITION, 2004, 37 (07) :1479-1497
[8]   Evaluating the performance of table processing algorithms [J].
Hu J. ;
Kashi R.S. ;
Lopresti D. ;
Wilfong G.T. .
International Journal on Document Analysis and Recognition, 2002, 4 (03) :140-153
[9]  
CNKI数字搜索. http://number.cnki.net . 2007
[10]  
Schema Matching and Data Extraction over HTML Tables. Cui Tao. Brigham Young University USA . 2003