共 1 条
基于本体论的Web信息抽取
被引:31
作者:
周明建
高济
李飞
机构:
[1] 浙江大学人工智能研究所
来源:
关键词:
本体论;
Web;
归纳学习;
HTML;
D O I:
暂无
中图分类号:
TP393.09 [];
学科分类号:
080402 ;
摘要:
以本体论为基础 ,以所要提取的信息的层次结构作为信息提取的路径 ,定义了Web页面的信息项本体 ,并自动解析生成Web页面的结构本体 通过对这两个本体进行对比 ,构造了一种归纳学习算法来半自动地生成信息提取规则 ,对Web页面的信息提取具有较高的效率
引用
收藏
页码:535 / 541
页数:7
相关论文