基于隐马尔科夫模型的中文分词研究

被引:14
作者
魏晓宁
机构
[1] 南通大学计算机科学与技术学院
关键词
自动分词; 隐马尔科夫模型(HMM); N-最短路径粗切分; 统计模型;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
一直以来,汉语自动分词是公认的汉语信息处理瓶颈。反思现有汉语自动分词技术,发现均有隐含两大假设:语言是规律的、词具有确定边界。这与语言的复杂性、组合性、动态性、模糊性特征不符。本文采用一种基于隐马尔科夫模型(HMM)的算法,通过CHMM(层叠形马尔科夫模型)进行分词,再做分层,既增加了分词的准确性,又保证了分词的效率。
引用
收藏
页码:885 / 886
页数:2
相关论文
共 3 条