浅析中文分词方法

被引：13

作者：

沈静

机构：

[1] 漳州职业技术学院计算机工程系

来源：

漳州职业技术学院学报 | 2016年 / 18卷 / 03期

关键词：

中文分词; 文本挖掘; 歧义切分;

D O I：

10.13908/j.cnki.issn1673-1417.2016.03.0009

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

120506 [数字人文];

摘要：

中文分词是中文文本挖掘和信息处理的基础环节,而中文文本挖掘首先面临的是中文的分词问题。中文分词的方法主要有基于字符串匹配的分词方法、基于统计的分词方法和基于理解的分词方法三种,第一种分词方法简单、快捷,但对词典的完备性要求很高;第二种充分利用文本信息,但完备性较差;第三种还处于理论研究阶段。本文对现有的三种中文分词方法进行了研究和对比。

引用

页码：45 / 48

页数：4

共 5 条

[1]

基于统计的云搜索中文分词算法 [J].