基于本体的文档引文元数据信息抽取

被引:18
作者
郭志鑫
机构
[1] 华中科技大学计算机科学与技术学院集群与网格计算实验室
关键词
信息抽取; 语义网; 本体; 模式匹配;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
结合本体技术,提出了一种新的从文档中抽取引文元数据信息的方法。该方法采用模式匹配方式,可以从文档中提取作者、标题、日期等信息,并使用OWL本体描述语言进行形式化,为进一步的语义搜索和语义存储奠定基础。实验数据证明了该方法的有效性。
引用
收藏
页码:304 / 306
页数:3
相关论文
共 3 条
[1]   基于“本体”的异构数据源的集成方法研究 [J].
娄雅斌 ;
陶凤梅 ;
马垣 .
微计算机信息, 2005, (20) :117-118+141
[2]   论文元数据信息的自动抽取 [J].
李朝光 ;
张铭 ;
邓志鸿 ;
杨冬青 ;
唐世渭 .
计算机工程与应用, 2002, (21) :189-191+235
[3]   一个基于规则的图书逻辑结构提取算法 [J].
陈国光 ;
丁晓青 ;
彭良瑞 ;
不详 .
计算机工程与应用 , 2002, (19) :53-57+143