基于本体论的Web信息抽取

被引:31
作者
周明建
高济
李飞
机构
[1] 浙江大学人工智能研究所
关键词
本体论; Web; 归纳学习; HTML;
D O I
暂无
中图分类号
TP393.09 [];
学科分类号
080402 ;
摘要
以本体论为基础 ,以所要提取的信息的层次结构作为信息提取的路径 ,定义了Web页面的信息项本体 ,并自动解析生成Web页面的结构本体 通过对这两个本体进行对比 ,构造了一种归纳学习算法来半自动地生成信息提取规则 ,对Web页面的信息提取具有较高的效率
引用
收藏
页码:535 / 541
页数:7
相关论文
共 1 条
[1]   论文元数据信息的自动抽取 [J].
李朝光 ;
张铭 ;
邓志鸿 ;
杨冬青 ;
唐世渭 ;
不详 .
计算机工程与应用 , 2002, (21) :189-191+235