一种快速Web中文分词算法的研究

被引:3
作者
韩利凯
机构
[1] 西安文理学院计算机科学系
关键词
Web分词; 中文分词; 分簇存储; 近邻匹配;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
提出了一种快速Web分词算法,该算法采用首字哈希存储和词条等长分簇存储的思想,采用近邻匹配和二分查找相结合的查找算法,可以方便实现邻近匹配,提高了效率。
引用
收藏
页码:68 / 69
页数:2
相关论文
共 1 条
[1]   Web中文文本分词技术研究 [J].
马玉春 ;
宋瀚涛 .
计算机应用, 2004, (04) :134-135+155