学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于隐马尔科夫模型的中文分词研究
被引:14
作者
:
魏晓宁
论文数:
0
引用数:
0
h-index:
0
机构:
南通大学计算机科学与技术学院
魏晓宁
机构
:
[1]
南通大学计算机科学与技术学院
来源
:
电脑知识与技术(学术交流)
|
2007年
/ 21期
关键词
:
自动分词;
隐马尔科夫模型(HMM);
N-最短路径粗切分;
统计模型;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
摘要
:
一直以来,汉语自动分词是公认的汉语信息处理瓶颈。反思现有汉语自动分词技术,发现均有隐含两大假设:语言是规律的、词具有确定边界。这与语言的复杂性、组合性、动态性、模糊性特征不符。本文采用一种基于隐马尔科夫模型(HMM)的算法,通过CHMM(层叠形马尔科夫模型)进行分词,再做分层,既增加了分词的准确性,又保证了分词的效率。
引用
收藏
页码:885 / 886
页数:2
相关论文
共 3 条
[1]
基于N-最短路径方法的中文词语粗分模型
张华平
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所软件实验室
张华平
论文数:
引用数:
h-index:
机构:
刘群
[J].
中文信息学报,
2002,
(05)
: 1
-
7
[2]
一种改进的快速分词算法
陈桂林
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学网络信息中心!上海
陈桂林
王永成
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学网络信息中心!上海
王永成
论文数:
引用数:
h-index:
机构:
韩客松
论文数:
引用数:
h-index:
机构:
王刚
[J].
计算机研究与发展,
2000,
(04)
: 418
-
424
[3]
隐Markov模型及其在自然语言处理中的应用 .2 于江生. .
←
1
→
共 3 条
[1]
基于N-最短路径方法的中文词语粗分模型
张华平
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所软件实验室
张华平
论文数:
引用数:
h-index:
机构:
刘群
[J].
中文信息学报,
2002,
(05)
: 1
-
7
[2]
一种改进的快速分词算法
陈桂林
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学网络信息中心!上海
陈桂林
王永成
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学网络信息中心!上海
王永成
论文数:
引用数:
h-index:
机构:
韩客松
论文数:
引用数:
h-index:
机构:
王刚
[J].
计算机研究与发展,
2000,
(04)
: 418
-
424
[3]
隐Markov模型及其在自然语言处理中的应用 .2 于江生. .
←
1
→