共 5 条
一种改进的MM分词算法
被引:38
作者:
郭辉
苏中义
王文
崔骏
机构:
[1] 上海交通大学信息与控制工程系
[2] 上海交通大学信息与控制工程系 硕士研究生
[3] 上海
[4] 副教授
[5] 硕士生导师
来源:
关键词:
分词;
自然语言处理;
最大匹配法;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
081203 ;
0835 ;
摘要:
本文首先提出一种对中文句子进行分词预处理的方法 ,在预处理过程中就能完成分词过程中所有的数据库访问操作 ,这种方法可以不加修改地应用于所有机械分词算法以及消除歧义 ;然后在预处理的基础上实现一种改进的MM法 ,更加完全地遵照“长词优先”的原则 ,使分词系统在机械分词阶段能有比 MM法更好的效果
引用
收藏
页码:13 / 15+2
+2
页数:4
相关论文