一种改进的MM分词算法

被引:38
作者
郭辉
苏中义
王文
崔骏
机构
[1] 上海交通大学信息与控制工程系
[2] 上海交通大学信息与控制工程系 硕士研究生
[3] 上海
[4] 副教授
[5] 硕士生导师
关键词
分词; 自然语言处理; 最大匹配法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
本文首先提出一种对中文句子进行分词预处理的方法 ,在预处理过程中就能完成分词过程中所有的数据库访问操作 ,这种方法可以不加修改地应用于所有机械分词算法以及消除歧义 ;然后在预处理的基础上实现一种改进的MM法 ,更加完全地遵照“长词优先”的原则 ,使分词系统在机械分词阶段能有比 MM法更好的效果
引用
收藏
页码:13 / 15+2 +2
页数:4
相关论文
共 5 条
[1]   基于两字词簇的汉语快速自动分词算法 [J].
郭祥昊 ;
钟义信 ;
杨丽 .
情报学报, 1998, (05) :34-39
[2]   中文信息处理中的分词问题 [J].
黄昌宁 .
语言文字应用, 1997, (01)
[3]   一种改进的MM分词方法的算法设计 [J].
骆正清 ;
陈增武 ;
胡上序 .
中文信息学报, 1996, (03) :30-36
[4]   基于规则的汉语自动分词系统 [J].
姚天顺 ;
张桂平 ;
吴映明 ;
不详 .
中文信息学报 , 1990, (01) :37-43
[5]   论汉语自动分词方法 [J].
揭春雨 ;
刘源 ;
梁南元 .
中文信息学报, 1989, (01) :1-9