四种基本统计句法分析模型在汉语句法分析中的性能比较

被引:9
作者
孟遥
李生
赵铁军
曹海龙
机构
[1] 哈尔滨工业大学计算机科学与技术学院
[2] 哈尔滨工业大学计算机科学与技术学院 黑龙江哈尔滨
[3] 黑龙江哈尔滨
关键词
计算机应用; 中文信息处理; 统计句法分析; 基本模型; 汉语分析;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
统计模型的选择是统计句法分析的关键。目前句法分析常用的有四种经典统计模型—PCFG模型 ,基于历史模型、分层渐近式模型和头驱动模型。本文通过实验 ,在已有的 10 0 0 0句汉语树库基础上 ,测试了这四种经典模型在现有数据规模下各自的性能 ,并论述了这四种经典模型的各自特点。本文旨在通过对四种基本模型的比较研究 ,为具体应用中句法分析模型的选择提供参考和依据。
引用
收藏
页码:1 / 8
页数:8
相关论文
共 3 条
[1]  
自底向上的汉语句法标注体系设计与实践[A]. 杨沐昀,赵铁军,于浩.自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C]. 2001
[2]   Learning to Parse Natural Language with Maximum Entropy Models [J].
Adwait Ratnaparkhi .
Machine Learning, 1999, 34 :151-175
[3]  
Applying Probability Measures to Abstract Languages .2 T. L. Booth and R. A. Thompson. IEEE Transactions on Computers . 1973