基于深层特征抽取的日文词义消歧系统

被引：1

作者：

雷雪梅 ^{[1
]}

王大亮 ^{[2
]}

田中贵秋 ^{[3
]}

曾广平 ^{[1
]}

机构：

[1] 北京科技大学信息工程学院

[2] 中国电信集团系统集成公司

[3] NTT通信科学研究所自然语言研究组

来源：

北京科技大学学报 | 2010年 / 32卷 / 02期

关键词：

自然语言处理; 词义消歧; 最大熵模型; 特征抽取;

D O I：

10.13374/j.issn1001-053x.2010.02.024

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

摘要：

词义消歧的特征来源于上下文.日文兼有中英文的语言特性,特征抽取更为复杂.针对日文特点,在词义消歧逻辑模型基础上,利用最大熵模型优良的信息融合性能,采用深层特征抽取方法,引入语义、句法类特征用于消解歧义.同时,为避免偏斜指派,采用BeamSearch算法进行词义序列标注.实验结果表明,与仅使用表层词法类特征方法相比,本文构造的日文词义消歧系统的消歧精度提高2%～3%,动词消歧精度获得5%的改善.

引用

页码：263 / 269

页数：7

共 5 条

[1] 基于相对条件熵的搭配抽取方法 [J].