分层次的汉语功能块描述库构建分析

被引:8
作者
陈亿
周强
宇航
机构
[1] 语音与语言技术中心,清华大学信息科学与技术国家实验室(筹),清华大学计算机科学与技术系
关键词
计算机应用; 中文信息处理; 部分分析; 功能块; 分层次描述;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
现有功能块分析器对于不同长度和不同结构功能块的分析性能研究表明,长的结构复杂的功能块正是功能块自动分析的难点所在。由此,我们设计了新的分层次的功能块体系,并从清华句法树库TCT中自动生成了新的功能块语料库。通过对新的功能块语料库长度分布、内部结构分布分析,以及与单层次功能块语料库的相互关系的研究,我们证实了新的分层次功能块描述体系具有结构简单、长度短且分布均匀的优良特点。这些性质对功能块分析器的性能提高将会有很大的帮助。
引用
收藏
页码:24 / 31+43 +43
页数:9
相关论文
共 2 条