中文分词技术综述

被引:61
作者
周宏宇
张政
机构
[1] 安阳师范学院
关键词
分词; 中文信息处理; 分词方法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
中文分词是中文信息处理的基础,分词系统也是中文信息处理中的一个主要组成部分,对中文文本的分词处理目前已经应用到了中文自然语言理解、文献检索、搜索引擎以及文本挖掘系统等领域。本文对现有的中文分词技术进行了综述,分析了现有分词方法的技术特点,指出了部分分词方法存在的优缺点。
引用
收藏
页码:54 / 56
页数:3
相关论文
共 4 条
[1]
基于优化最大匹配与统计结合的汉语分词方法 [J].
刘春辉 ;
金顺福 ;
刘国华 ;
李颖 .
燕山大学学报, 2009, 33 (02) :124-129
[2]
利用覆盖歧义检测法和统计语言模型进行汉语自动分词 [J].
王显芳 ;
杜利民 .
电子与信息学报, 2003, (09) :1168-1173
[3]
基于自然语言处理和机器学习的文本分类及其应用研究 [D]. 
王懿 .
中国科学院研究生院(成都计算机应用研究所),
2006
[4]
统计与字典相结合的中文分词 [D]. 
翟凤文 .
吉林大学,
2005