汉语基本块标注系统的内部关系分析

被引:4
作者
宇航
周强
机构
[1] 清华大学信息技术研究院语音和语言技术中心,清华信息科学与技术国家实验室技术创新与开发部语音和语言技术中心
关键词
中文信息处理; 基本块; 内部关系分析; 统计模型;
D O I
10.16511/j.cnki.qhdxxb.2009.10.032
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
针对目前基本块分析主要侧重外部边界和句法标记识别的处理缺陷,提出了一种可以同时获得基本块的外部句法标记和内部关系描述的汉语基本块分析方法。首先通过设计关系标记集来描述基本块内部词与词之间的句法依存关系,然后利用统计建模对句子中的每个词进行序列关系标注,最后通过有限自动机规则自动获取句子的完整基本块标注结果。实验结果表明,与使用经典的边界标记(IOB)模型进行基本块句法标注分析的方法相比,该方法在句法标记识别性能略有下降的情况下获得了很好的内部关系分析结果。
引用
收藏
页码:1708 / 1711+1716 +1716
页数:5
相关论文
共 3 条
[1]   汉语基本块描述体系 [J].
周强 .
中文信息学报, 2007, (03) :21-27
[2]   汉语句法树库标注体系 [J].
周强 .
中文信息学报 , 2004, (04) :1-8
[3]   北京大学现代汉语语料库基本加工规范 [J].
俞士汶 ;
段慧明 ;
朱学锋 ;
孙斌 .
中文信息学报, 2002, (05) :49-64