基于路径学习的信息自动抽取方法

被引:7
作者
于琨
蔡智
糜仲春
蔡庆生
机构
[1] 中国科学技术大学计算机科学技术系
[2] 中国科学技术大学信息管理与决策科学系
关键词
信息自动抽取; 路径学习; 互联网;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
摘要
针对用户需求的网页信息自动抽取是解决互联网信息爆炸问题的一个有效途径 ,然而现有的信息自动抽取方法均难以同时满足网页信息自动抽取中查全率与查准率高、抽取速度快、抽取信息量大和用户负担轻的要求 .本文提出了一种基于路径学习的信息自动抽取方法 ,并采用该方法编制了一个商品价格信息自动抽取系统 .实验结果表明 ,该方法具有用户负担较轻 (只需用户提供 2~ 4个学习实例 )、查全率 (97.0 4~ 10 0 % )与查准率 (99~ 10 0 % )高、可实现大样本量信息抽取和时间资源耗费少 (抽取时间 <1秒 )等特点 ,能基本满足网页信息自动抽取的要求 .
引用
收藏
页码:2147 / 2149
页数:3
相关论文
empty
未找到相关数据