中文农业专业分词器设计与实现

被引:5
作者
方逵
罗武
王玉娟
卜伟琼
机构
[1] 湖南农业大学信息科学技术学院
关键词
农村信息化; 知识库; 中文分词器; 分词词典; 算法评估;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
利用Hash表在查找效率上的优势,提出了基于Hash机制的词典查找、更新、删除和添加等操作算法。该算法根据汉字GB码的特点,将保存首字GB码,提高了存储空间利用率;在词典中建立农业专业词汇和方言词汇一对多的对应关系,在满足系统需求的同时,提高了分词的准确性。
引用
收藏
页码:18 / 20
页数:3
相关论文
共 6 条
[1]
汉语自动分词和词性标注评测 [J].
杨尔弘 ;
方莹 ;
刘冬明 ;
乔羽 .
中文信息学报, 2006, (01) :44-49+97
[2]
一种中文分词词典新机制——双字哈希机制 [J].
李庆虎 ;
陈玉健 ;
孙家广 .
中文信息学报, 2003, (04) :13-18
[3]
《现代汉语语义词典》管理系统的设计与实现 [J].
郑泽芝 ;
张永奎 .
计算机工程, 2001, (06) :11-13
[4]
汉语自动分词研究评述 [J].
孙茂松 ;
邹嘉彦 .
当代语言学, 2001, (01) :22-32+77
[5]
一种高效的中文电子词表数据结构 [J].
陈桂林 ;
王永成 ;
韩客松 ;
王刚 .
计算机研究与发展, 2000, (01) :109-116
[6]
基于两字词簇的汉语快速自动分词算法 [J].
郭祥昊 ;
钟义信 ;
杨丽 .
情报学报, 1998, (05)