基于Hash算法的中文分词研究

被引:5
作者
姚兴山
机构
[1] 南京大学信息管理系
关键词
中文分词; 中文信息处理; 数据结构; 哈希算法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
通过对已有算法的分析,提出一种新的词典结构,并根据词典给出分词算法。理论和实验证明,算法在速度和效率上有很大的提高。
引用
收藏
页码:78 / 81
页数:4
相关论文
共 9 条
[1]   基于词频统计的中文分词的研究 [J].
费洪晓 ;
康松林 ;
朱小娟 ;
谢文彪 ;
不详 .
计算机工程与应用 , 2005, (07) :67-68+100
[2]   一种中文分词词典新机制——双字哈希机制 [J].
李庆虎 ;
陈玉健 ;
孙家广 .
中文信息学报, 2003, (04) :13-18
[3]   藏文自动分词系统的设计与实现 [J].
陈玉忠 ;
李保利 ;
俞士汶 .
中文信息学报, 2003, (03) :15-20+65
[4]   一种基于语词的分词方法 [J].
赵曾贻 ;
陈天娥 ;
朱兰 .
苏州大学学报(自然科学), 2002, (03) :44-48
[5]   全二分最大匹配快速分词算法 [J].
李振星 ;
徐泽平 ;
唐卫清 ;
唐荣锡 .
计算机工程与应用, 2002, (11) :106-109
[6]   一种改进的快速分词算法 [J].
陈桂林 ;
王永成 ;
韩客松 ;
王刚 .
计算机研究与发展, 2000, (04) :418-424
[7]   汉语自动分词词典机制的实验研究 [J].
孙茂松 ;
左正平 ;
黄昌宁 .
中文信息学报, 2000, (01) :1-6
[8]   汉语自动分词实用系统CASS的设计和实现 [J].
揭春雨 ;
刘源 ;
梁南元 .
中文信息学报, 1991, (04) :27-34
[9]  
软件工程.[M].张海藩编著;.人民邮电出版社.2002,