基于最大熵的依存句法分析

被引:11
作者
辛霄
范士喜
王轩
王晓龙
机构
[1] 哈尔滨工业大学深圳研究生院智能计算研究中心
关键词
计算机应用; 中文信息处理; 句法分析; 最大生成树; 最大熵;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
该文提出并比较了三种基于最大熵模型的依存句法分析算法,其中最大生成树(MST)算法取得了最好的效果。MST算法的目标是在一个带有权重的有向图中寻找一棵最大的生成树。有向图的每条边都对应于一个句法依存关系,边的权重通过最大熵模型获得。训练和测试数据来源于CoNLL2008 Share Task的公用语料。预测的F1值在WSJ和Brown两个测试集上分别达到87.42%和80.8%,在参加评测单位中排名第6。
引用
收藏
页码:18 / 22
页数:5
相关论文
共 3 条
[1]   基于大规模语料库的句法模式匹配研究 [J].
张亮 ;
陈家骏 .
中文信息学报, 2007, (05) :31-35
[2]   基于动作建模的中文依存句法分析 [J].
段湘煜 ;
赵军 ;
徐波 .
中文信息学报, 2007, (05) :25-30
[3]  
汉语句法分析器的鲁棒性研究 .2 周明. 清华大学博士后出站报告 . 1993