汉语术语定义的结构分析和提取

被引:23
作者
张艳
宗成庆
徐波
机构
[1] 中国科学院自动化所模式识别国家重点实验室
[2] 中国科学院自动化所模式识别国家重点实验室 北京
[3] 北京
关键词
计算机应用; 中文信息处理; 句法分析; 知识发现; 术语定义;
D O I
暂无
中图分类号
TP391.12 [];
学科分类号
081203 ; 0835 ;
摘要
本文介绍的工作是在汉语句法分析研究基础上的一种应用研究 ,对术语如何下定义问题进行了理论上的探讨。术语的定义形式在汉语语法结构方面提供了模板结构和构成方式 ,可以作为知识发现研究的数据基础 ,也可以作为特定领域的语法知识系统。本文针对电子学和计算机领域的语料进行了分词和词性标注处理 ,然后应用句法分析工具分析出句子中的短语成分 ,并根据汉语句子的句型结构 ,总结出术语定义的结构特点 ,自动提取定义的模板。最后根据已建立的数据和概念描述 ,给出了术语发现的算法
引用
收藏
页码:9 / 16
页数:8
相关论文
共 3 条
[1]  
知识发现.[M].史忠植著;.清华大学出版社.2002,
[2]  
机器翻译原理.[M].赵铁军等编著;.哈尔滨工业大学出版社.2000,
[3]  
自然语言的计算机处理.[M].冯志伟著;.上海外语教育出版社.1996,