基于元数据和XML的信息抽取与集成技术研究

被引:10
作者
亓祥波
南琳
张福顺
机构
[1] 中国科学院沈阳自动化研究所
关键词
元数据; 模板; 信息抽取; XML;
D O I
10.13976/j.cnki.xk.2008.01.004
中图分类号
TP312.2 [];
学科分类号
081202 ; 0835 ;
摘要
为了得到统一的数据形式以利于数据操作和处理,提出了采用基于元数据的模板定制技术以实现信息抽取的方法.该方法有效地实现对非结构化文本的信息提取,将抽取信息转换为统一的XML格式,然后将XML格式的信息集成到关系数据库中.本方法在某造船厂的企业信息化中得到成功应用,为解决企业的信息集成问题提供了一种面向W ord文档的新方案.
引用
收藏
页码:52 / 57
页数:6
相关论文
共 6 条
[1]  
基于包装器模型的文本信息抽取算法研究.[D].王敬普.湖南大学.2006, 11
[2]   “元数据模型”在数据提取中的实现 [J].
杨文安 ;
陈行益 .
吉林大学学报(信息科学版), 2005, (01) :32-36
[3]   基于信息结构模型的企业文档信息集成与重用技术研究 [J].
王克明 ;
熊光楞 ;
谢金崇 ;
范文慧 .
中国机械工程, 2003, (04) :38-41+4
[4]   基于元数据的Office文档表示方法的研究 [J].
郑家恒 ;
武琼 .
计算机工程, 2003, (03) :86-88
[5]   基于XML的虚拟企业信息集成架构 [J].
陈良贵 ;
智明 ;
李旸 .
计算机应用与软件, 2003, (01) :65-67
[6]   基于Ontology的信息抽取 [J].
廖乐健 ;
曹元大 ;
李新颖 .
计算机工程与应用, 2002, (23) :110-113