基于本体的旅游信息抽取

被引:16
作者
陈立娜
张红
马莉
蒋运承
机构
[1] 广西师范大学计算机科学与信息工程学院
关键词
本体; 信息抽取; DOM树; 旅游信息;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
基于本体的信息抽取技术是一种把本体和信息处理技术结合起来实现信息抽取的一种方法。提出一种基于本体的旅游领域信息抽取方法。该方法依据旅游本体的关键词定位页面信息区域,从网页中抽取正文信息,对其进行分词处理及过滤,再根据Java标注模式引擎JAPE(Java Annotation Patterns Engine)编写的规则进行本体匹配,形成结构化的内容,存入数据库。最后,通过实验证明了所提出的方法的准确性。
引用
收藏
页码:146 / 148+161 +161
页数:4
相关论文
共 3 条
[1]
一种新的基于Ontology的信息抽取方法 [J].
陈兰 ;
左志宏 ;
熊毅 ;
孟令谦 .
计算机应用研究, 2004, (08) :155-157+170
[2]
基于ontology的信息抽取系统的研究与实现 [D]. 
马腾 .
电子科技大学,
2006
[3]
Information extraction from documents for automating software testing [J].
Lutsky, P .
ARTIFICIAL INTELLIGENCE IN ENGINEERING, 2000, 14 (01) :63-69