基于遗传算法和舍伍德思想的双数组Trie树改进

被引:3
作者
王世昆
李绍滋
柯逍
机构
[1] 厦门大学智能科学与技术系
关键词
双数组索引; 舍伍德随机思想; 遗传算法; 变异;
D O I
暂无
中图分类号
TP18 [人工智能理论]; TP391.1 [文字信息处理];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ; 081203 ;
摘要
对汉语信息处理中常常要涉及汉语词典查询,当所涉及的词典规模较为庞大时如何快速访问词典以获取词语知识便成为了一个需重点解决的问题。将阐述一种简单快捷的基于双数组Trie(Double-Array Trie)原理的词典查询机制。该算法的查询时间为O(n)的线性时间(n为查询词条的长度),由此可见双数组算法在时间上存在着明显优势,但在空间耗费上却存在着浪费现象。前人提出了一些解决方案,其中主要的有:在构造双数组时采用一种启发式排序策略,即每一次都先处理当前分支节点最多的活动节点。考虑到这种启发式思想为确定性算法,容易陷入局部最优陷阱之中,因此在这种思想的基础上引入了舍伍德随机思想和遗传算法中常常运用到的变异思想,在改进算法空间利用率的同时也使得算法跳出了局部最优解的陷阱。
引用
收藏
页码:128 / 130+152 +152
页数:4
相关论文
共 4 条
[1]   汉语词典的快速查询算法研究 [J].
李江波 ;
周强 ;
陈祖舜 .
中文信息学报, 2006, (05) :31-39
[2]   双数组Trie树算法优化及其应用研究 [J].
王思力 ;
张华平 ;
王斌 .
中文信息学报, 2006, (05) :24-30
[3]   汉语自动分词词典机制的实验研究 [J].
孙茂松 ;
左正平 ;
黄昌宁 .
中文信息学报, 2000, (01) :1-6
[4]  
数据结构.[M].严蔚敏;吴伟民编著;.清华大学出版社.1992,