共 6 条
一种自适应的Web信息抽取规则自动生成方法
被引:5
作者:
黄锋
[1
,2
]
吴华瑞
[1
,2
]
机构:
[1] 国家农业信息化工程技术研究中心
[2] 农业部农业信息技术重点开放实验室
关键词:
信息抽取;
语义分析;
自适应方法;
D O I:
10.16088/j.issn.1001-6600.2010.01.024
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
081203 ;
0835 ;
摘要:
提出一种自适应的Web信息抽取规则自动生成方法,通过多样本页面对比模式和单样本重复模式提取Web上复合类型的数据并进行迭代修正,基于语义分析的规则方法进行动态抽取。实验结果表明,该方法具有较好的精确性和鲁棒性。
引用
收藏
页码:127 / 130
页数:4
相关论文