学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
平行语料库中双语术语词典的自动抽取
被引:31
作者
:
孙乐
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院软件研究所中文信息处理中心!北京
孙乐
论文数:
引用数:
h-index:
机构:
金友兵
杜林
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院软件研究所中文信息处理中心!北京
杜林
孙玉芳
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院软件研究所中文信息处理中心!北京
孙玉芳
机构
:
[1]
中国科学院软件研究所中文信息处理中心!北京
来源
:
中文信息学报
|
2000年
/ 06期
关键词
:
术语抽取;
平行语料;
句子对齐;
翻译概率;
D O I
:
暂无
中图分类号
:
TP391 [信息处理(信息加工)];
学科分类号
:
081203 ;
0835 ;
摘要
:
本文提出了一种从英汉平行语料库中自动抽取术语词典的算法。首先采用基于字符长度的改进的统计方法对平行语料进行句子级的对齐 ,并对英文语料和中文语料分别进行词性标注和切分与词性标注。统计已对齐和标注的双语语料中的名词和名词短语生成候选术语集。然后对每个英文候选术语计算与其相关的中文翻译之间的翻译概率。最后通过设定随词频变化的阈值来选取中文翻译。在对真实语料的术语抽取实验中取得了较好的结果
引用
收藏
页码:33 / 39
页数:7
相关论文
共 1 条
[1]
Large-scale automatic extraction of an English-Chinese translation lexicon[J] . Dekai Wu,Xuanyin Xia.Machine Translation . 1995 (3)
←
1
→
共 1 条
[1]
Large-scale automatic extraction of an English-Chinese translation lexicon[J] . Dekai Wu,Xuanyin Xia.Machine Translation . 1995 (3)
←
1
→