基于词汇支配度的汉语依存分析模型

被引:66
作者
刘挺
马金山
李生
机构
[1] 哈尔滨工业大学信息检索研究室
[2] 哈尔滨工业大学信息检索研究室 黑龙江哈尔滨
基金
国家自然科学基金重点项目;
关键词
依存语法; 句法分析; 支配度; 动态规划;
D O I
暂无
中图分类号
H136 [现代词汇];
学科分类号
050103 [汉语言文字学];
摘要
如何应用句法结构和词汇化是句法分析建模所面临的两个主要问题,汉语依存分析对这两方面做了初步的探索.首先通过对大规模依存树库的统计学习,获取其中的词汇依存信息,建立了一个词汇化的概率分析模型.然后引入词汇支配度的概念,以充分利用了句子中的结构信息.词汇化方法有效地弥补了以前工作中词性信息的粒度过粗问题.同时,词汇支配度增强了对句法结构的识别,有效地避免了非法结构的生成.在4000句的测试集上,依存分析获得了约74%的正确率.
引用
收藏
页码:1876 / 1883
页数:8
相关论文
共 2 条
[1]
基于局部优先的汉语句法分析方法 [J].
周强 ;
黄昌宁 .
软件学报, 1999, (01)
[2]
建立现代汉语依存关系的层次体系[J] 刘伟权,王明会,钟义信 中文信息学报 1996, 02