学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于双层哈希表的中文分词算法优化
被引:3
作者
:
论文数:
引用数:
h-index:
机构:
习明
[
1
]
王增辉
论文数:
0
引用数:
0
h-index:
0
机构:
吉林农业大学信息技术学院
吉林农业大学信息技术学院
王增辉
[
1
]
庄怡
论文数:
0
引用数:
0
h-index:
0
机构:
武汉纺织大学计算机科学学院
吉林农业大学信息技术学院
庄怡
[
2
]
机构
:
[1]
吉林农业大学信息技术学院
[2]
武汉纺织大学计算机科学学院
来源
:
软件导刊
|
2010年
/ 9卷
/ 10期
关键词
:
自然语言处理;
中文分词;
最大匹配算法;
双哈希表;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
081203 ;
0835 ;
摘要
:
采用基于词典的正向增字最大匹配算法,分词词典采用改进的双层哈希表加动态数组的数据结构。在不提升已有典型词典机制空间复杂度与维护复杂度的情况下,一定程度上提高了中文分词的速度和效率。
引用
收藏
页码:54 / 55
页数:2
相关论文
共 5 条
[1]
一种高效的中文电子词表数据结构
[J].
陈桂林
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学网络信息中心!上海
陈桂林
;
王永成
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学网络信息中心!上海
王永成
;
论文数:
引用数:
h-index:
机构:
韩客松
;
论文数:
引用数:
h-index:
机构:
王刚
.
计算机研究与发展,
2000,
(01)
:109
-116
[2]
一种中文分词词典新机制——双字哈希机制
[J].
李庆虎
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机系
李庆虎
;
陈玉健
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机系
陈玉健
;
孙家广
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机系
孙家广
.
中文信息学报,
2003,
(04)
:13
-18
[3]
基于Lucene的中文字典分词模块的设计与实现
[J].
论文数:
引用数:
h-index:
机构:
向晖
;
论文数:
引用数:
h-index:
机构:
郭一平
;
论文数:
引用数:
h-index:
机构:
王亮
.
现代图书情报技术,
2006,
(08)
:46
-50
[4]
基于素数序列的Java哈希表性能优化
[J].
论文数:
引用数:
h-index:
机构:
廖名学
;
论文数:
引用数:
h-index:
机构:
范植华
.
计算机工程与应用,
2008,
(03)
:108
-109+142
[5]
数据结构[M]. - 清华大学出版社 , 严蔚敏, 1992
←
1
→
共 5 条
[1]
一种高效的中文电子词表数据结构
[J].
陈桂林
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学网络信息中心!上海
陈桂林
;
王永成
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学网络信息中心!上海
王永成
;
论文数:
引用数:
h-index:
机构:
韩客松
;
论文数:
引用数:
h-index:
机构:
王刚
.
计算机研究与发展,
2000,
(01)
:109
-116
[2]
一种中文分词词典新机制——双字哈希机制
[J].
李庆虎
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机系
李庆虎
;
陈玉健
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机系
陈玉健
;
孙家广
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机系
孙家广
.
中文信息学报,
2003,
(04)
:13
-18
[3]
基于Lucene的中文字典分词模块的设计与实现
[J].
论文数:
引用数:
h-index:
机构:
向晖
;
论文数:
引用数:
h-index:
机构:
郭一平
;
论文数:
引用数:
h-index:
机构:
王亮
.
现代图书情报技术,
2006,
(08)
:46
-50
[4]
基于素数序列的Java哈希表性能优化
[J].
论文数:
引用数:
h-index:
机构:
廖名学
;
论文数:
引用数:
h-index:
机构:
范植华
.
计算机工程与应用,
2008,
(03)
:108
-109+142
[5]
数据结构[M]. - 清华大学出版社 , 严蔚敏, 1992
←
1
→