汉语定义语句的抽取方法

被引:1
作者
张寅生
机构
[1] 中国科学技术信息研究所
关键词
知识抽取; 信息抽取; 汉语句子识别; 定义语句; Boyer-Moore算法; 自然语言理解;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
该文介绍了在汉语文本中抽取定义语句的方法。方法的主要特点是:给定被定义的词汇(字符串),应用Bo-yer-Moore算法查找该串在文本中的位置,继而在该句子中查找符合定义特征的谓词。在这个工作基础上,根据谓词字符串的特征排除谓词歧义,并按照句法分析的结果对定义语句修饰谓词的不同语法单元进行识别,从而实现了基于字符串和语法特征的识别的定义语句抽取。
引用
收藏
页码:45 / 47+112 +112
页数:4
相关论文
共 4 条
[1]   一种基于演化算法进行句子抽取的多文档自动摘要系统SBGA [J].
刘德喜 ;
何炎祥 ;
姬东鸿 ;
杨华 .
中文信息学报, 2006, (06) :46-53
[2]   基于双语模型的汉语句法分析知识自动获取 [J].
吕雅娟 ;
李生 ;
赵铁军 .
计算机学报, 2003, (01) :32-38
[3]   Boyer-Moore串查找JAVA算法 [J].
秦殿英 ;
焦庆争 .
安徽工业大学学报, 2001, (01) :89-92
[4]  
北京大学语言知识库概况 .2 俞士汶. 汉语语言与计算学报 .