基于深层特征抽取的日文词义消歧系统

被引:1
作者
雷雪梅 [1 ]
王大亮 [2 ]
田中贵秋 [3 ]
曾广平 [1 ]
机构
[1] 北京科技大学信息工程学院
[2] 中国电信集团系统集成公司
[3] NTT通信科学研究所自然语言研究组
关键词
自然语言处理; 词义消歧; 最大熵模型; 特征抽取;
D O I
10.13374/j.issn1001-053x.2010.02.024
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
词义消歧的特征来源于上下文.日文兼有中英文的语言特性,特征抽取更为复杂.针对日文特点,在词义消歧逻辑模型基础上,利用最大熵模型优良的信息融合性能,采用深层特征抽取方法,引入语义、句法类特征用于消解歧义.同时,为避免偏斜指派,采用BeamSearch算法进行词义序列标注.实验结果表明,与仅使用表层词法类特征方法相比,本文构造的日文词义消歧系统的消歧精度提高2%~3%,动词消歧精度获得5%的改善.
引用
收藏
页码:263 / 269
页数:7
相关论文
共 5 条
[1]   基于相对条件熵的搭配抽取方法 [J].
王大亮 ;
张德政 ;
涂序彦 ;
郑雪峰 ;
佟子健 .
北京邮电大学学报, 2007, (06) :40-45
[2]   统计词义消歧的研究进展 [J].
卢志茂 ;
刘挺 ;
李生 .
电子学报, 2006, (02) :333-343
[3]   基于对数模型的词义自动消歧 [J].
朱靖波 ;
李珩 ;
张跃 ;
姚天顺 .
软件学报, 2001, (09) :1405-1412
[4]   Word reordering and a dynamic programming beam search algorithm for statistical machine translation [J].
Tillmann, C ;
Ney, H .
COMPUTATIONAL LINGUISTICS, 2003, 29 (01) :97-133
[5]  
Goi-taikei-a Japanese lexicon .2 Satoru Ikehara,Masahiro Miyazaki,Satoshi Shirai,Akio Yokoo,Hiromi Nakaiwa,Kenntaro Kokura. . 1997