基于框架的词语搭配自动抽取方法

被引:19
作者
曲维光
陈小荷
吉根林
机构
[1] 南京师范大学文学院南京师范大学计算机系
[2] 南京师范大学文学院
[3] 南京师范大学计算机系 南京
[4] 南京
关键词
词语搭配; 搭配框架; 互信息; 相对词序比;
D O I
暂无
中图分类号
H085 [机器翻译];
学科分类号
050211 ;
摘要
提出了一种基于框架的词语搭配抽取方法,可以同时获取词语搭配以及搭配结构信息。引入相对词序比(RRWR)的方法对候选搭配词语进行筛选,应用语言学中词语搭配组合规律对候选搭配的词性进行限定,利用互信息等统计学模型在大规模语料中进行词语搭配的自动抽取,抽取的搭配平均准确率为84.73%,较Xtract系统高4.7%,较国内同类工作结果高50.79%。并且在获得搭配的同时得到了词语搭配的结构信息。
引用
收藏
页码:22 / 24+195 +195
页数:4
相关论文
empty
未找到相关数据