汉语词典的快速查询算法研究

被引:24
作者
李江波
周强
陈祖舜
机构
[1] 清华大学计算机系智能技术与系统国家重点实验室
关键词
计算计应用; 中文信息处理; 汉语词典查询; 双数组TRIE; 双编码算法;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
摘要
汉语词典查询是中文信息处理系统的重要基础部分,对系统效率有重要的影响。本文对汉语词典查询算法研究作了简要回顾,设计实现了基于双数组TR IE机制的汉语词典查询算法,并提出了基于双编码机制的词典查询算法。最后以逐字二分法查询性能为基准,使用这两种词典询机制进行了词语直接查询和分词查询两种应用的性能测试。经过实验分析,双数组TR IE机制的词典查询算法在查询速度上提高明显,查询速度约是逐字二分法的5倍。双编码机制的的词典查询算法查询速度有一定提高,而且调整机制更加灵活。
引用
收藏
页码:31 / 39
页数:9
相关论文
共 5 条
[1]  
数据结构.[M].严蔚敏;吴伟民编著;.清华大学出版社.1992,
[2]   一种中文分词词典新机制——双字哈希机制 [J].
李庆虎 ;
陈玉健 ;
孙家广 .
中文信息学报, 2003, (04) :13-18
[3]   基于PATRICIA tree的汉语自动分词词典机制 [J].
杨文峰 ;
陈光英 ;
李星 .
中文信息学报, 2001, (03) :44-49
[4]   汉语自动分词词典机制的实验研究 [J].
孙茂松 ;
左正平 ;
黄昌宁 .
中文信息学报, 2000, (01) :1-6
[5]   基于Hash方法的机器翻译词典的组织与构造 [J].
王秀坤 ;
李政 ;
简幼良 ;
刘剑 .
大连理工大学学报, 1996, (03) :108-111