一种Hash高速分词算法

被引:9
作者
李向阳
张亚非
机构
[1] 解放军理工大学通信工程学院
[2] 解放军理工大学训练部
关键词
自动分词; 数据结构; Hash;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
对于基于词的搜索引擎等中文处理系统 ,分词速度要求较高。设计了一种高效的中文电子词表的数据结构 ,它支持首字和词的 Hash查找。提出了一种 Hash高速分词算法 ,理论分析表明 ,其平均匹配次数低于 1 .0 8,优于目前的同类算法。
引用
收藏
页码:40 / 44
页数:5
相关论文
共 5 条
  • [1] 全二分最大匹配快速分词算法
    李振星
    徐泽平
    唐卫清
    唐荣锡
    [J]. 计算机工程与应用, 2002, (11) : 106 - 109
  • [2] 一种改进的快速分词算法
    陈桂林
    王永成
    韩客松
    王刚
    [J]. 计算机研究与发展, 2000, (04) : 418 - 424
  • [3] 一种高效的中文电子词表数据结构
    陈桂林
    王永成
    韩客松
    王刚
    [J]. 计算机研究与发展, 2000, (01) : 109 - 116
  • [4] 论汉语自动分词方法
    揭春雨
    刘源
    梁南元
    [J]. 中文信息学报, 1989, (01) : 1 - 9
  • [5] 数据结构及应用算法教程[M]. 清华大学出版社 , 严蔚敏, 2001