基于规则的高校实验室Web信息抽取的系统设计与实现

被引:2
作者
化柏林 [1 ]
郭江 [2 ]
机构
[1] 中国科学技术信息研究所
[2] 北京市旧机动车交易市场有限公司
关键词
实验室Web信息; 信息抽取; 规则; 特征谓词; Web页面结构;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
在充分调研高校实验室信息的基础上,针对总结的实验室信息的规律与特征,制定适合信息抽取的实验室信息描述规则,利用规则进行实验室信息的抽取。设计一个针对高校实验室信息的信息抽取系统labIE,并详细论述labIE的体系结构与技术架构,着重论述网页表格判断规则的设计与特征谓词的构造方法。
引用
收藏
页码:62 / 66
页数:5
相关论文
共 5 条
  • [1] 实体关系自动抽取
    车万翔
    刘挺
    李生
    [J]. 中文信息学报, 2005, (02) : 1 - 6
  • [2] 面向信息抽取的文本预处理和规则自动学习技术研究[D]. 叶娜.东北大学 2005
  • [3] 信息检索实验教材[M]. 武汉大学出版社 , 陆伟, 2008
  • [4] Inverse entailment and progol[J] . Stephen Muggleton.New Generation Computing . 1995 (3)
  • [5] HTMLParser的两种使用. http://jansener.javaeye.com/blog/205883 . 2008