中文词法分析与句法分析融合策略研究

被引:38
作者
米海涛
熊德意
刘群
机构
[1] 中国科学院智能信息处理重点实验室
关键词
计算机应用; 中文信息处理; 中文句法分析; 中文词法分析; 融合策略; 基于转换的错误驱动学习; 条件随机场;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
利用外部资源是提升句法分析性能的一种有效方法。本文利用中文词法分析器这一外部资源,提出了一种通用转换方法将中文词法分析器与句法分析器有机地融合在一起。通过基于转换的错误驱动学习和条件随机场解决不同切词、词性标注标准间的转换问题。在句法分析方面,本文提出了多子模型句法分析器,将中心词驱动模型和结构上下文模型有效结合在一起。融合后的中文句法分析性能在宾州中文树库1.0版①测试集上F1值达到了82.5%的最好水平。
引用
收藏
页码:10 / 17
页数:8
相关论文
共 4 条
[1]
单纯形算法在统计机器翻译Re-ranking中的应用 [J].
付雷 ;
刘群 .
中文信息学报, 2007, (03) :28-33
[2]
基于层叠隐马模型的汉语词法分析 [J].
刘群 ;
张华平 ;
俞鸿魁 ;
程学旗 .
计算机研究与发展, 2004, (08) :1421-1429
[3]
A maximum-entropy chinese parser augmented by transformation-based learning[J] Pascale Fung;Grace Ngai;Yongsheng Yang;Benfeng Chen ACM Transactions on Asian Language Information Processing (TALIP) 2004,
[4]
计算所汉语词性标记集Version3.0 刘群;张华平;张浩; 2004,