一种改进的基于PATRICIA树的汉语自动分词词典机制

被引:4
作者
马哲
姚敏
机构
[1] 浙江大学计算机系 浙江 杭州 310027
[2] 浙江大学计算机系
关键词
PATRICIA树; 汉语; 自动分词; 分词词典机制;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
分词词典机制是影响自动分词的重要因素,而查找速度是衡量一个词典好坏的重要标准.文中分析比较了现有的几种典型的词典机制,并在此基础上提出了一种新的词典机制,即在PATRICIAtree的基础上加入Hash机制,从而在明显提高查找速度的同时,降低了构造和维护词典的复杂度.
引用
收藏
页码:28 / 31 +41
页数:5
相关论文
共 5 条
[1]   一种中文分词词典新机制——双字哈希机制 [J].
李庆虎 ;
陈玉健 ;
孙家广 .
中文信息学报, 2003, (04) :13-18
[2]   一种基于语词的分词方法 [J].
赵曾贻 ;
陈天娥 ;
朱兰 .
苏州大学学报(自然科学), 2002, (03) :44-48
[3]   基于PATRICIA tree的汉语自动分词词典机制 [J].
杨文峰 ;
陈光英 ;
李星 .
中文信息学报, 2001, (03) :44-49
[4]   汉语自动分词词典机制的实验研究 [J].
孙茂松 ;
左正平 ;
黄昌宁 .
中文信息学报, 2000, (01) :1-6
[5]  
数据结构[M]. 清华大学出版社 , 严蔚敏, 1997