学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于双字词的动态最大匹配分词算法的研究
被引:6
作者
:
论文数:
引用数:
h-index:
机构:
宋国柱
[
1
]
论文数:
引用数:
h-index:
机构:
陈俊杰
[
2
]
机构
:
[1]
山西农业大学现代教育技术学院
[2]
太原理工大学计算机与软件学院
来源
:
太原科技大学学报
|
2009年
/ 30卷
/ 03期
关键词
:
中文分词;
动态;
最大匹配;
词库;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
120506
[数字人文]
;
摘要
:
通过研究和分析现有最大匹配分词算法,词库结构的设计和分词算法直接关系着分词的速度和效率,提出了一种改进的最大匹配分词算法——基于双字词的动态最大匹配分词算法,设计并实现了汉语分词词库和算法。实验结果表明,此算法相对于现有最大匹配分词算法有显著提高。
引用
收藏
页码:199 / 202
页数:4
相关论文
共 5 条
[1]
中文信息处理技术教程.[M].朱巧明[等]编著;.清华大学出版社.2005,
[2]
信息检索理论与技术.[M].苏新宁主编;.科学技术文献出版社.2004,
[3]
中文分词算法研究
[J].
论文数:
引用数:
h-index:
机构:
刘件
;
论文数:
引用数:
h-index:
机构:
魏程
.
微计算机应用,
2008,
(08)
:11
-16
[4]
一种改进的高效分词词典机制
[J].
王东
论文数:
0
引用数:
0
h-index:
0
机构:
贵州大学计算机科学与技术学院
王东
;
论文数:
引用数:
h-index:
机构:
陈笑蓉
.
贵州大学学报(自然科学版),
2007,
(04)
:380
-384+389
[5]
汉语自动分词研究中的苦干理论问题
[J].
论文数:
引用数:
h-index:
机构:
孙茂松
;
邹嘉彦
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系,香港城市大学
邹嘉彦
.
语言文字应用,
1995,
(04)
←
1
→
共 5 条
[1]
中文信息处理技术教程.[M].朱巧明[等]编著;.清华大学出版社.2005,
[2]
信息检索理论与技术.[M].苏新宁主编;.科学技术文献出版社.2004,
[3]
中文分词算法研究
[J].
论文数:
引用数:
h-index:
机构:
刘件
;
论文数:
引用数:
h-index:
机构:
魏程
.
微计算机应用,
2008,
(08)
:11
-16
[4]
一种改进的高效分词词典机制
[J].
王东
论文数:
0
引用数:
0
h-index:
0
机构:
贵州大学计算机科学与技术学院
王东
;
论文数:
引用数:
h-index:
机构:
陈笑蓉
.
贵州大学学报(自然科学版),
2007,
(04)
:380
-384+389
[5]
汉语自动分词研究中的苦干理论问题
[J].
论文数:
引用数:
h-index:
机构:
孙茂松
;
邹嘉彦
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系,香港城市大学
邹嘉彦
.
语言文字应用,
1995,
(04)
←
1
→