WNCT:一种WordNet概念自动翻译方法

被引:7
作者
王石 [1 ,2 ]
曹存根 [1 ]
机构
[1] 中国科学院计算技术研究所智能信息处理重点实验室
[2] 中国科学院研究生院
关键词
人工智能; 机器翻译; WordNet翻译; 词汇翻译; 翻译消歧; 中文词汇知识库; 中文信息处理;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
WordNet是在自然语言处理领域有重要作用的英语词汇知识库,该文提出了一种将WordNet中词汇概念自动翻译为中文的方法。首先,利用电子词典和术语翻译工具将英语词汇在义项的粒度上翻译为中文;其次,将特定概念中词汇的正确义项选择看作分类问题,归纳出基于翻译唯一性、概念内和概念间翻译交集、中文短语结构规则,以及基于PMI的翻译相关性共12个特征,训练分类模型实现正确义项的选择。实验结果表明,该方法对WordNet 3.0中概念翻译的覆盖率为85.21%,准确率为81.37%。
引用
收藏
页码:63 / 70+94 +94
页数:9
相关论文
共 7 条
[1]   知网的理论发现 [J].
董振东 ;
董强 ;
郝长伶 .
中文信息学报, 2007, (04) :3-9
[2]   中文WordNet的研究及实现 [J].
张俐 ;
李晶皎 ;
胡明涵 ;
姚天顺 .
东北大学学报, 2003, (04) :327-329
[3]   中文概念词典的结构 [J].
于江生 ;
俞士汶 .
中文信息学报, 2002, (04) :12-20+44
[4]  
面向中文信息处理的现代汉语短语结构规则研究[D]. 詹卫东.北京大学 1999
[5]  
同义词词林[M]. 上海辞书出版社 , 梅家驹, 1983
[6]  
Building a Chinese-English wordnet for translingual applications[J] . Hsin-Hsi Chen,Chi-Ching Lin,Wen-Cheng Lin.ACM Transactions on Asian Language Information Processing (TALIP) . 2002 (2)
[7]  
Elements of Information Theory. Thomas M Cover,Joy. A. Thomas. John Wiley & Sons . 2006