基于Hash方法的机器翻译词典的组织与构造

被引:12
作者
王秀坤
李政
简幼良
刘剑
机构
[1] 大连理工大学计算机技术研究所
关键词
人工智能;信息处理/机器翻译;标准词典;分词;
D O I
暂无
中图分类号
TP391.2 [翻译机];
学科分类号
081203 ; 0835 ;
摘要
给出了一种机器翻译词典的二级Hash方法,并用此方法组织与构造了中日机器翻译标准词典.该方法可通过统计以各种字集开头的词的数目来规划数据块的分配,同时又将统计结果作为Hash方法的参数来调节数据块的分配;这种调节作用非常有利于控制分布的均匀性,减少冲突,提高空间利用率.该方法不仅免去了常规的以索引方式组织词典模式中对各级索引的繁琐的维护工作,而且也提高了分词效率
引用
收藏
页码:108 / 111
页数:4
相关论文
共 3 条
[1]   中日英兼容汉字操作系统NiHao-FP的设计与实现 [J].
简幼良 ;
黄德根 .
大连理工大学学报, 1992, (05) :600-607
[2]   基于规则的汉语自动分词系统 [J].
姚天顺 ;
张桂平 ;
吴映明 ;
不详 .
中文信息学报 , 1990, (01) :37-43
[3]  
计算机程序设计技巧.[M].(美)克努特(Kunth;D.E.)著;管纪文;苏运霖译;.国防工业出版社.1992,