全二分最大匹配快速分词算法

被引:40
作者
李振星
徐泽平
唐卫清
唐荣锡
机构
[1] 北京航空航天大学机械工程及自动化学院
[2] 中国科学院计算技术研究所
[3] 北京航空航天大学机械工程及自动化学院 北京
[4] 北京
关键词
自动分词; 中文信息处理; 数据结构;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
分词对于中文信息处理的诸多领域都是一个非常重要的基本组成部分,对于诸如搜索引擎等海量信息处理的应用,分词的速度是至关重要的。该文在对中文编码体系和中文分词的算法进行研究的基础上,提出一种新的分词词典,基于这种分词设计了一种快速的分词算法,给出了算法的实现过程。
引用
收藏
页码:106 / 109
页数:4
相关论文
共 6 条
[1]   一种改进的快速分词算法 [J].
陈桂林 ;
王永成 ;
韩客松 ;
王刚 .
计算机研究与发展, 2000, (04) :418-424
[2]   汉语自动分词词典机制的实验研究 [J].
孙茂松 ;
左正平 ;
黄昌宁 .
中文信息学报, 2000, (01) :1-6
[3]   一种汉语分词方法 [J].
吴胜远 .
计算机研究与发展 , 1996, (04) :306-311
[4]   书面汉语自动分词专家系统设计原理 [J].
何克抗 ;
徐辉 ;
孙波 .
中文信息学报, 1991, (02) :1-14+28
[5]   论汉语自动分词方法 [J].
揭春雨 ;
刘源 ;
梁南元 .
中文信息学报, 1989, (01) :1-9
[6]  
现代汉语词表[M]. 中国标准出版社 , 刘源 主编, 1984