基于结果模式的Deep Web数据抽取

被引:45
作者
马安香
张斌
高克宁
齐鹏
张引
机构
[1] 东北大学信息科学与工程学院
关键词
Deep Web数据集成; Deep Web数据抽取; 结果模式; 语义标注; 网页数据特征矩阵;
D O I
暂无
中图分类号
TP393.09 [];
学科分类号
摘要
高效、准确地获取Deep Web数据是实现Deep Web数据集成系统的关键问题,然而重复语义标注、嵌套属性的存在是Deep Web数据抽取效率和准确率难以提升的瓶颈问题.因此提出基于结果模式的Deep Web数据抽取机制,将数据抽取工作分为结果模式生成和数据抽取两个阶段,属性语义标注放在结果模式生成阶段来完成,有效解决了重复语义标注问题;同时针对嵌套属性问题,提出一种有效的解决方法.与同类成果相比,基于结果模式的数据抽取方法提高了数据抽取的准确率及效率,并且为Deep Web数据集成奠定了良好的基础.
引用
收藏
页码:280 / 288
页数:9
相关论文
共 1 条
[1]
Deep Web数据集成研究综述 [J].
刘伟 ;
孟小峰 ;
孟卫一 .
计算机学报, 2007, (09) :1475-1489