学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
中文农业专业分词器设计与实现
被引:5
作者
:
论文数:
引用数:
h-index:
机构:
方逵
论文数:
引用数:
h-index:
机构:
罗武
论文数:
引用数:
h-index:
机构:
王玉娟
论文数:
引用数:
h-index:
机构:
卜伟琼
机构
:
[1]
湖南农业大学信息科学技术学院
来源
:
农业工程
|
2012年
/ 2卷
/ 03期
关键词
:
农村信息化;
知识库;
中文分词器;
分词词典;
算法评估;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
120506
[数字人文]
;
摘要
:
利用Hash表在查找效率上的优势,提出了基于Hash机制的词典查找、更新、删除和添加等操作算法。该算法根据汉字GB码的特点,将保存首字GB码,提高了存储空间利用率;在词典中建立农业专业词汇和方言词汇一对多的对应关系,在满足系统需求的同时,提高了分词的准确性。
引用
收藏
页码:18 / 20
页数:3
相关论文
共 6 条
[1]
汉语自动分词和词性标注评测
[J].
杨尔弘
论文数:
0
引用数:
0
h-index:
0
机构:
山西大学计算机与信息技术学院
杨尔弘
;
论文数:
引用数:
h-index:
机构:
方莹
;
刘冬明
论文数:
0
引用数:
0
h-index:
0
机构:
山西大学计算机与信息技术学院
刘冬明
;
乔羽
论文数:
0
引用数:
0
h-index:
0
机构:
山西大学计算机与信息技术学院
乔羽
.
中文信息学报,
2006,
(01)
:44
-49+97
[2]
一种中文分词词典新机制——双字哈希机制
[J].
李庆虎
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机系
李庆虎
;
陈玉健
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机系
陈玉健
;
孙家广
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机系
孙家广
.
中文信息学报,
2003,
(04)
:13
-18
[3]
《现代汉语语义词典》管理系统的设计与实现
[J].
论文数:
引用数:
h-index:
机构:
郑泽芝
;
张永奎
论文数:
0
引用数:
0
h-index:
0
机构:
太原师范学院数学系!太原,山西大学计算机科学系!太原
张永奎
.
计算机工程,
2001,
(06)
:11
-13
[4]
汉语自动分词研究评述
[J].
论文数:
引用数:
h-index:
机构:
孙茂松
;
邹嘉彦
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学,香港城市大学
邹嘉彦
.
当代语言学,
2001,
(01)
:22
-32+77
[5]
一种高效的中文电子词表数据结构
[J].
陈桂林
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海
陈桂林
;
王永成
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海
王永成
;
论文数:
引用数:
h-index:
机构:
韩客松
;
论文数:
引用数:
h-index:
机构:
王刚
.
计算机研究与发展,
2000,
(01)
:109
-116
[6]
基于两字词簇的汉语快速自动分词算法
[J].
郭祥昊
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学人工智能实验室,北方交通大学
郭祥昊
;
钟义信
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学人工智能实验室,北方交通大学
钟义信
;
杨丽
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学人工智能实验室,北方交通大学
杨丽
.
情报学报,
1998,
(05)
←
1
→
共 6 条
[1]
汉语自动分词和词性标注评测
[J].
杨尔弘
论文数:
0
引用数:
0
h-index:
0
机构:
山西大学计算机与信息技术学院
杨尔弘
;
论文数:
引用数:
h-index:
机构:
方莹
;
刘冬明
论文数:
0
引用数:
0
h-index:
0
机构:
山西大学计算机与信息技术学院
刘冬明
;
乔羽
论文数:
0
引用数:
0
h-index:
0
机构:
山西大学计算机与信息技术学院
乔羽
.
中文信息学报,
2006,
(01)
:44
-49+97
[2]
一种中文分词词典新机制——双字哈希机制
[J].
李庆虎
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机系
李庆虎
;
陈玉健
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机系
陈玉健
;
孙家广
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机系
孙家广
.
中文信息学报,
2003,
(04)
:13
-18
[3]
《现代汉语语义词典》管理系统的设计与实现
[J].
论文数:
引用数:
h-index:
机构:
郑泽芝
;
张永奎
论文数:
0
引用数:
0
h-index:
0
机构:
太原师范学院数学系!太原,山西大学计算机科学系!太原
张永奎
.
计算机工程,
2001,
(06)
:11
-13
[4]
汉语自动分词研究评述
[J].
论文数:
引用数:
h-index:
机构:
孙茂松
;
邹嘉彦
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学,香港城市大学
邹嘉彦
.
当代语言学,
2001,
(01)
:22
-32+77
[5]
一种高效的中文电子词表数据结构
[J].
陈桂林
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海
陈桂林
;
王永成
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海,上海交通大学网络信息中心!上海
王永成
;
论文数:
引用数:
h-index:
机构:
韩客松
;
论文数:
引用数:
h-index:
机构:
王刚
.
计算机研究与发展,
2000,
(01)
:109
-116
[6]
基于两字词簇的汉语快速自动分词算法
[J].
郭祥昊
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学人工智能实验室,北方交通大学
郭祥昊
;
钟义信
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学人工智能实验室,北方交通大学
钟义信
;
杨丽
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学人工智能实验室,北方交通大学
杨丽
.
情报学报,
1998,
(05)
←
1
→