基于标记的分词算法

被引:4
作者
亢临生,张永奎
机构
[1] 山西大学计算中心
关键词
分词,标记,最大匹配法;
D O I
暂无
中图分类号
TP391 [信息处理(信息加工)];
学科分类号
081203 ; 0835 ;
摘要
目前,自动分词的算法很多,但都有不能满足实用的要求。文中介绍一种在最大匹配法基础上,根据大量的真实语料中出现的语言现象,把汉语中的词按其在分词意义下的特性进行分类,并用不同的标记标识,对每一类词确定一组规则进行处理,使分词算法更接近于实用的目的。
引用
收藏
页码:283 / 286
页数:4
相关论文
共 2 条
[1]   基于规则的汉语自动分词系统 [J].
姚天顺 ;
张桂平 ;
吴映明 ;
不详 .
中文信息学报 , 1990, (01) :37-43
[2]   汉语自动分词及歧义组合结构的处理 [J].
李国臣 ;
刘开瑛 ;
张永奎 .
中文信息学报, 1988, (03) :27-33