一种规则与统计相结合的汉语分词方法

被引:32
作者
赵伟
戴新宇
尹存燕
陈家骏
机构
[1] 南京大学计算机科学与技术系软件新技术国家重点实验室
关键词
中文信息处理; 分词; 语料库; 交集型歧义;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
汉语自动分词是中文信息处理领域的一项基础性课题,对现有的汉语分词方法作了简单的概述和分析,然后提出了一种新的分词方法,该方法基于一个标注好了的语料库,并且结合了规则和语料库统计两种分词方法。
引用
收藏
页码:23 / 25
页数:3
相关论文
共 8 条
  • [1] 基于SVM和k-NN结合的汉语交集型歧义切分方法
    李蓉
    刘少辉
    叶世伟
    史忠植
    [J]. 中文信息学报, 2001, (06) : 13 - 18
  • [2] 一种基于EM非监督训练的自组织分词歧义解决方案
    王伟
    钟义信
    孙建
    杨力
    [J]. 中文信息学报, 2001, (02) : 38 - 44
  • [3] 基于最长次长匹配的汉语自动分词
    黄德根
    朱和合
    王昆仑
    杨元生
    钟万勰
    [J]. 大连理工大学学报, 1999, (06) : 831 - 835
  • [4] 汉语分词系统中的信息集成和最佳路径搜索方法
    沈达阳
    孙茂松
    黄昌宁
    [J]. 中文信息学报, 1997, (02) : 34 - 47
  • [5] 基于邻接知识的汉语自动分词系统
    王锡江
    王启祥
    陈家骏
    [J]. 计算机研究与发展, 1992, (11) : 54 - 58
  • [6] 基于规则的汉语自动分词系统
    姚天顺
    张桂平
    吴映明
    [J]. 中文信息学报, 1990, (01) : 37 - 43
  • [7] 利用汉字二元语法关系解决汉语自动分词中的交集型歧义
    孙茂松
    黄昌宁
    邹嘉彦
    陆方
    沈达阳
    [J]. 计算机研究与发展 , 1997, (05) : 14 - 21
  • [8] 中文文本自动分词和标注.[M].刘开瑛著;.商务印书馆.2000,