基于EM算法的汉语自动分词方法

被引：19

作者：

李家福

张亚非

机构：

[1] 解放军理工大学通信工程学院

[2] 解放军理工大学理学院

来源：

情报学报 | 2002年 / 03期

基金：

国家自然科学基金重点项目;

关键词：

分词; 汉语; EM算法; 语料库; HMM;

D O I：

暂无

中图分类号：

G254.1 [分类法];

学科分类号：

摘要：

汉语自动分词是中文信息处理中的基础课题。本文首先对汉语分词的基本概念与应用 ,以及汉语分词的基本方法进行了概述。接着引出一种根据词的出现概率、基于极大似然原则构建的汉语自动分词的零阶马尔可夫模型 ,并重点剖析了EM(Expectation Maximization)算法 ,对实验结果进行了分析。最后对算法进行了总结与讨论。

引用

页码：269 / 272

页数：4