短语树到依存树的自动转换研究

被引:10
作者
党政法
周强
机构
[1] 清华大学智能技术与系统国家重点实验室计算机科学与技术系
[2] 清华大学智能技术与系统国家重点实验室计算机科学与技术系 北京
[3] 北京
关键词
人工智能; 自然语言处理; 树库; 短语树; 依存树; 自动转换;
D O I
暂无
中图分类号
H085 [机器翻译];
学科分类号
050211 ;
摘要
不同标注体系的树库之间的相互转换是计算语言学研究的重要内容之一。本文在总结国内外几种树库标注体系及相互转换实践的基础上,结合清华汉语树库(TsinghuaChineseTreebank ,简称TCT)标注体系的特点,提出了一种将TCT从短语结构转换成依存结构(DependencyStructure)的算法。这种算法充分利用了TCT具有的功能、结构的双重标记,转换得到的依存树不仅包含了各个节点之间相互依存的层次关系,更包含了相互依存的两个节点的具体的依存关系类型。我们对转换的效果进行了抽样评估,准确率可以达到97 37%。
引用
收藏
页码:21 / 27
页数:7
相关论文
共 2 条
[1]   汉语句法树库标注体系 [J].
周强 .
中文信息学报 , 2004, (04) :1-8
[2]   汉语树库的构建 [J].
周强 ;
张伟 ;
俞士汶 .
中文信息学报, 1997, (04) :43-52