学术定义抽取系统实现及实验分析

被引:8
作者
刘一宁
郑彦宁
化柏林
机构
[1] 中国科学技术信息研究所
关键词
学术定义; 知识抽取; 自然语言处理; 分析;
D O I
10.16353/j.cnki.1000-7490.2011.12.008
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
设计了一种定义抽取系统,通过混合使用模式规则、语法规则和词频统计以达到定义抽取的目的。详细介绍了系统中的各项关键技术,包括分词技术、抽取规则导入技术、句子抽取技术和加权词处理技术。并选取《情报学报》2007—2008年的235篇论文全文作为实验数据,通过与人工抽取结果进行对比分析,测试了抽取系统的抽全率与抽准率。
引用
收藏
页码:15 / 19
页数:5
相关论文
共 3 条