一种规则与统计相结合的汉语分词方法

被引：32

作者：

赵伟

戴新宇

尹存燕

陈家骏

机构：

[1] 南京大学计算机科学与技术系软件新技术国家重点实验室

来源：

计算机应用研究 | 2004年 / 03期

关键词：

中文信息处理; 分词; 语料库; 交集型歧义;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

摘要：

汉语自动分词是中文信息处理领域的一项基础性课题,对现有的汉语分词方法作了简单的概述和分析,然后提出了一种新的分词方法,该方法基于一个标注好了的语料库,并且结合了规则和语料库统计两种分词方法。

引用

收藏

页码：23 / 25

页数：3

相关论文

共 8 条

[1] 基于SVM和k-NN结合的汉语交集型歧义切分方法
李蓉
刘少辉
叶世伟
史忠植
[J]. 中文信息学报, 2001, (06) : 13 - 18
[2] 一种基于EM非监督训练的自组织分词歧义解决方案
王伟
钟义信
孙建
杨力
[J]. 中文信息学报, 2001, (02) : 38 - 44
[3] 基于最长次长匹配的汉语自动分词
黄德根
朱和合
王昆仑
杨元生
钟万勰
[J]. 大连理工大学学报, 1999, (06) : 831 - 835
[4] 汉语分词系统中的信息集成和最佳路径搜索方法
沈达阳
孙茂松
黄昌宁
[J]. 中文信息学报, 1997, (02) : 34 - 47
[5] 基于邻接知识的汉语自动分词系统
王锡江
王启祥
陈家骏
[J]. 计算机研究与发展, 1992, (11) : 54 - 58
[6] 基于规则的汉语自动分词系统
姚天顺
张桂平
吴映明
[J]. 中文信息学报, 1990, (01) : 37 - 43
[7] 利用汉字二元语法关系解决汉语自动分词中的交集型歧义
孙茂松
黄昌宁
邹嘉彦
陆方
沈达阳
[J]. 计算机研究与发展 , 1997, (05) : 14 - 21
[8] 中文文本自动分词和标注.[M].刘开瑛著;.商务印书馆.2000,