学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于深层特征抽取的日文词义消歧系统
被引:1
作者
:
雷雪梅
论文数:
0
引用数:
0
h-index:
0
机构:
北京科技大学信息工程学院
北京科技大学信息工程学院
雷雪梅
[
1
]
王大亮
论文数:
0
引用数:
0
h-index:
0
机构:
中国电信集团系统集成公司
北京科技大学信息工程学院
王大亮
[
2
]
田中贵秋
论文数:
0
引用数:
0
h-index:
0
机构:
NTT通信科学研究所自然语言研究组
北京科技大学信息工程学院
田中贵秋
[
3
]
曾广平
论文数:
0
引用数:
0
h-index:
0
机构:
北京科技大学信息工程学院
北京科技大学信息工程学院
曾广平
[
1
]
机构
:
[1]
北京科技大学信息工程学院
[2]
中国电信集团系统集成公司
[3]
NTT通信科学研究所自然语言研究组
来源
:
北京科技大学学报
|
2010年
/ 32卷
/ 02期
关键词
:
自然语言处理;
词义消歧;
最大熵模型;
特征抽取;
D O I
:
10.13374/j.issn1001-053x.2010.02.024
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
摘要
:
词义消歧的特征来源于上下文.日文兼有中英文的语言特性,特征抽取更为复杂.针对日文特点,在词义消歧逻辑模型基础上,利用最大熵模型优良的信息融合性能,采用深层特征抽取方法,引入语义、句法类特征用于消解歧义.同时,为避免偏斜指派,采用BeamSearch算法进行词义序列标注.实验结果表明,与仅使用表层词法类特征方法相比,本文构造的日文词义消歧系统的消歧精度提高2%~3%,动词消歧精度获得5%的改善.
引用
收藏
页码:263 / 269
页数:7
相关论文
共 5 条
[1]
基于相对条件熵的搭配抽取方法
[J].
王大亮
论文数:
0
引用数:
0
h-index:
0
机构:
北京科技大学信息工程学院
北京科技大学信息工程学院
王大亮
;
张德政
论文数:
0
引用数:
0
h-index:
0
机构:
北京科技大学信息工程学院
北京科技大学信息工程学院
张德政
;
涂序彦
论文数:
0
引用数:
0
h-index:
0
机构:
北京科技大学信息工程学院
北京科技大学信息工程学院
涂序彦
;
郑雪峰
论文数:
0
引用数:
0
h-index:
0
机构:
北京科技大学信息工程学院
北京科技大学信息工程学院
郑雪峰
;
佟子健
论文数:
0
引用数:
0
h-index:
0
机构:
搜狐公司研发中心
北京科技大学信息工程学院
佟子健
.
北京邮电大学学报,
2007,
(06)
:40
-45
[2]
统计词义消歧的研究进展
[J].
卢志茂
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机学院信息检索研究室
卢志茂
;
刘挺
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机学院信息检索研究室
刘挺
;
李生
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机学院信息检索研究室
李生
.
电子学报,
2006,
(02)
:333
-343
[3]
基于对数模型的词义自动消歧
[J].
论文数:
引用数:
h-index:
机构:
朱靖波
;
李珩
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学计算机科学研究所
李珩
;
张跃
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学计算机科学研究所
张跃
;
姚天顺
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学计算机科学研究所
姚天顺
.
软件学报,
2001,
(09)
:1405
-1412
[4]
Word reordering and a dynamic programming beam search algorithm for statistical machine translation
[J].
Tillmann, C
论文数:
0
引用数:
0
h-index:
0
机构:
IBM Corp, Thomas J Watson Res Ctr, Yorktown Hts, NY 10598 USA
IBM Corp, Thomas J Watson Res Ctr, Yorktown Hts, NY 10598 USA
Tillmann, C
;
Ney, H
论文数:
0
引用数:
0
h-index:
0
机构:
IBM Corp, Thomas J Watson Res Ctr, Yorktown Hts, NY 10598 USA
Ney, H
.
COMPUTATIONAL LINGUISTICS,
2003,
29
(01)
:97
-133
[5]
Goi-taikei-a Japanese lexicon .2 Satoru Ikehara,Masahiro Miyazaki,Satoshi Shirai,Akio Yokoo,Hiromi Nakaiwa,Kenntaro Kokura. . 1997
←
1
→
共 5 条
[1]
基于相对条件熵的搭配抽取方法
[J].
王大亮
论文数:
0
引用数:
0
h-index:
0
机构:
北京科技大学信息工程学院
北京科技大学信息工程学院
王大亮
;
张德政
论文数:
0
引用数:
0
h-index:
0
机构:
北京科技大学信息工程学院
北京科技大学信息工程学院
张德政
;
涂序彦
论文数:
0
引用数:
0
h-index:
0
机构:
北京科技大学信息工程学院
北京科技大学信息工程学院
涂序彦
;
郑雪峰
论文数:
0
引用数:
0
h-index:
0
机构:
北京科技大学信息工程学院
北京科技大学信息工程学院
郑雪峰
;
佟子健
论文数:
0
引用数:
0
h-index:
0
机构:
搜狐公司研发中心
北京科技大学信息工程学院
佟子健
.
北京邮电大学学报,
2007,
(06)
:40
-45
[2]
统计词义消歧的研究进展
[J].
卢志茂
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机学院信息检索研究室
卢志茂
;
刘挺
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机学院信息检索研究室
刘挺
;
李生
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机学院信息检索研究室
李生
.
电子学报,
2006,
(02)
:333
-343
[3]
基于对数模型的词义自动消歧
[J].
论文数:
引用数:
h-index:
机构:
朱靖波
;
李珩
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学计算机科学研究所
李珩
;
张跃
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学计算机科学研究所
张跃
;
姚天顺
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学计算机科学研究所
姚天顺
.
软件学报,
2001,
(09)
:1405
-1412
[4]
Word reordering and a dynamic programming beam search algorithm for statistical machine translation
[J].
Tillmann, C
论文数:
0
引用数:
0
h-index:
0
机构:
IBM Corp, Thomas J Watson Res Ctr, Yorktown Hts, NY 10598 USA
IBM Corp, Thomas J Watson Res Ctr, Yorktown Hts, NY 10598 USA
Tillmann, C
;
Ney, H
论文数:
0
引用数:
0
h-index:
0
机构:
IBM Corp, Thomas J Watson Res Ctr, Yorktown Hts, NY 10598 USA
Ney, H
.
COMPUTATIONAL LINGUISTICS,
2003,
29
(01)
:97
-133
[5]
Goi-taikei-a Japanese lexicon .2 Satoru Ikehara,Masahiro Miyazaki,Satoshi Shirai,Akio Yokoo,Hiromi Nakaiwa,Kenntaro Kokura. . 1997
←
1
→