学术探索
学术期刊
文章热点
数据分析
智能智评
立即登录
基于N-gram模型的中文分词前k优算法
被引:5
作者
:
论文数:
引用数:
h-index:
机构:
李书豪
论文数:
引用数:
h-index:
机构:
陈宇
论文数:
引用数:
h-index:
机构:
吕淑宝
论文数:
引用数:
h-index:
机构:
张猛治
机构
:
[1]
东北林业大学信息与计算机工程学院
来源
:
智能计算机与应用
|
2016年
/ 6卷
/ 06期
基金
:
黑龙江省自然科学基金;
关键词
:
中文输入法;
N-gram模型;
k优路径;
A*算法;
D O I
:
暂无
中图分类号
:
TP391.14 [];
学科分类号
:
摘要
:
本文首先从中文输入法应用的角度出发,在阐述了N-gram模型的基础上对中文输入法的分词进行了详细的剖析,进一步根据训练数据的稀疏问题,使用Back-off模型进行数据的平滑处理。针对系统词库数量受限的问题,在构建词图的前提下,使用基于A*的算法求解前k优路径。最后实验结果表明,本文所使用的基于A*的算法与改进Dijkstra算法、基于DP的算法等常用的求前k优路径的算法相比,具有较高的效率和准确率,为中文分词及求取k-best算法的研究开拓了新的思路。
引用
收藏
页码:31 / 35
页数:5
相关论文
共 10 条
[1]
最大正向匹配分词算法的VC++实现
王希杰
论文数:
0
引用数:
0
h-index:
0
机构:
安阳师范学院
王希杰
[J].
福建电脑,
2011,
27
(04)
: 72+71
-
72
[2]
从语言处理的复杂性与高效性看联结主义
论文数:
引用数:
h-index:
机构:
崔刚
[J].
外语与外语教学,
2007,
(05)
: 1
-
4+41
[3]
多知识综合判决的字符切分算法
刘刚
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系智能技术与系统国家重点实验室
刘刚
丁晓青
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系智能技术与系统国家重点实验室
丁晓青
彭良瑞
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系智能技术与系统国家重点实验室
彭良瑞
刘长松
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系智能技术与系统国家重点实验室
刘长松
[J].
计算机工程与应用,
2002,
(17)
: 59
-
61+72
[4]
一种语句级汉字输入技术的研究
论文数:
引用数:
h-index:
机构:
徐志明
王晓龙
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机系!哈尔滨
王晓龙
论文数:
引用数:
h-index:
机构:
姜守旭
[J].
高技术通讯,
2000,
(01)
: 52
-
56
[5]
大词汇量连续语音识别系统中统计语言模型的研究[D]. 邹荣.北京邮电大学. 2006
[6]
基于神经网络的拼音汉字转换[D]. 张俊.南京理工大学. 2004
[7]
数学之美[M]. 人民邮电出版社 , 吴军, 2012
[8]
统计自然语言处理[M]. 清华大学出版社 , 宗成庆, 2007
[9]
统计自然语言处理基础[M]. 电子工业出版社 , (美)ChristopherD.Manning, 2005
[10]
CONTEXTUAL LANGUAGE MODELS FOR RANKING ANSWERS TO NATURAL LANGUAGE DEFINITION QUESTIONS
Figueroa, Alejandro
论文数:
0
引用数:
0
h-index:
0
机构:
Yahoo Res Latin Amer, Santiago, Chile
Univ Concepcion, Dept Comp Sci, Concepcion, Chile
Figueroa, Alejandro
Atkinson, John
论文数:
0
引用数:
0
h-index:
0
机构:
Univ Concepcion, Dept Comp Sci, Concepcion, Chile
Univ Concepcion, Dept Comp Sci, Concepcion, Chile
Atkinson, John
[J].
COMPUTATIONAL INTELLIGENCE,
2012,
28
(04)
: 528
-
548
←
1
→
共 10 条
[1]
最大正向匹配分词算法的VC++实现
王希杰
论文数:
0
引用数:
0
h-index:
0
机构:
安阳师范学院
王希杰
[J].
福建电脑,
2011,
27
(04)
: 72+71
-
72
[2]
从语言处理的复杂性与高效性看联结主义
论文数:
引用数:
h-index:
机构:
崔刚
[J].
外语与外语教学,
2007,
(05)
: 1
-
4+41
[3]
多知识综合判决的字符切分算法
刘刚
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系智能技术与系统国家重点实验室
刘刚
丁晓青
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系智能技术与系统国家重点实验室
丁晓青
彭良瑞
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系智能技术与系统国家重点实验室
彭良瑞
刘长松
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系智能技术与系统国家重点实验室
刘长松
[J].
计算机工程与应用,
2002,
(17)
: 59
-
61+72
[4]
一种语句级汉字输入技术的研究
论文数:
引用数:
h-index:
机构:
徐志明
王晓龙
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机系!哈尔滨
王晓龙
论文数:
引用数:
h-index:
机构:
姜守旭
[J].
高技术通讯,
2000,
(01)
: 52
-
56
[5]
大词汇量连续语音识别系统中统计语言模型的研究[D]. 邹荣.北京邮电大学. 2006
[6]
基于神经网络的拼音汉字转换[D]. 张俊.南京理工大学. 2004
[7]
数学之美[M]. 人民邮电出版社 , 吴军, 2012
[8]
统计自然语言处理[M]. 清华大学出版社 , 宗成庆, 2007
[9]
统计自然语言处理基础[M]. 电子工业出版社 , (美)ChristopherD.Manning, 2005
[10]
CONTEXTUAL LANGUAGE MODELS FOR RANKING ANSWERS TO NATURAL LANGUAGE DEFINITION QUESTIONS
Figueroa, Alejandro
论文数:
0
引用数:
0
h-index:
0
机构:
Yahoo Res Latin Amer, Santiago, Chile
Univ Concepcion, Dept Comp Sci, Concepcion, Chile
Figueroa, Alejandro
Atkinson, John
论文数:
0
引用数:
0
h-index:
0
机构:
Univ Concepcion, Dept Comp Sci, Concepcion, Chile
Univ Concepcion, Dept Comp Sci, Concepcion, Chile
Atkinson, John
[J].
COMPUTATIONAL INTELLIGENCE,
2012,
28
(04)
: 528
-
548
←
1
→