共 2 条
基于标记的分词算法
被引:4
作者:
亢临生,张永奎
机构:
[1] 山西大学计算中心
来源:
关键词:
分词,标记,最大匹配法;
D O I:
暂无
中图分类号:
TP391 [信息处理(信息加工)];
学科分类号:
081203 ;
0835 ;
摘要:
目前,自动分词的算法很多,但都有不能满足实用的要求。文中介绍一种在最大匹配法基础上,根据大量的真实语料中出现的语言现象,把汉语中的词按其在分词意义下的特性进行分类,并用不同的标记标识,对每一类词确定一组规则进行处理,使分词算法更接近于实用的目的。
引用
收藏
页码:283 / 286
页数:4
相关论文