学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于EM算法的汉语自动分词方法
被引:19
作者
:
李家福
论文数:
0
引用数:
0
h-index:
0
机构:
解放军理工大学通信工程学院
李家福
张亚非
论文数:
0
引用数:
0
h-index:
0
机构:
解放军理工大学通信工程学院
张亚非
机构
:
[1]
解放军理工大学通信工程学院
[2]
解放军理工大学理学院
来源
:
情报学报
|
2002年
/ 03期
基金
:
国家自然科学基金重点项目;
关键词
:
分词;
汉语;
EM算法;
语料库;
HMM;
D O I
:
暂无
中图分类号
:
G254.1 [分类法];
学科分类号
:
摘要
:
汉语自动分词是中文信息处理中的基础课题。本文首先对汉语分词的基本概念与应用 ,以及汉语分词的基本方法进行了概述。接着引出一种根据词的出现概率、基于极大似然原则构建的汉语自动分词的零阶马尔可夫模型 ,并重点剖析了EM(Expectation Maximization)算法 ,对实验结果进行了分析。最后对算法进行了总结与讨论。
引用
收藏
页码:269 / 272
页数:4
相关论文
共 1 条
[1]
Segmenting Chinese in Unicode. Thomas EMERSON. . 2000
←
1
→
共 1 条
[1]
Segmenting Chinese in Unicode. Thomas EMERSON. . 2000
←
1
→