中文分词算法解析

被引：13

作者：

张磊

张代远

机构：

[1] 南京邮电大学计算机学院

来源：

电脑知识与技术 | 2009年 / 5卷 / 01期

关键词：

中文分词; 最大匹配算法; 最大概率算法; 算法; 系统;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

摘要：

中文分词是计算机中文信息处理中的难题,而中文分词算法是其中的核心,但由于中英文环境中语素的不同特点,使得中文必须要解决分词的问题。这篇文章较为深刻的阐述了中分分词的算法,基于对分词算法的理解和对匹配法分词的分析,对最大匹配分词方法进行了较深入的研究探讨,提出了什么算法是解决分词效率的最佳方法以及各种方法的比较优劣等问题,及可能产生的歧义,对不同的算法给予了充分的解释,通过对各种算法的比较,总结出了比较常用和效率较高的算法。

引用

页码：192 / 193

页数：2

共 7 条

[1]

中文词性标注的研究与实现.[D].张卫.南京师范大学.2007, 04

[2]

中文自动分词系统的研究.[D].朱珣.华中师范大学.2004, 04

[3] 基于改进BP网络的中文歧义字段分词方法研究 [J].