共 7 条
文语转换系统中基于语料的汉语自动分词研究
被引:10
作者:
应志伟
柴佩琪
陈其晖
机构:
[1] 同济大学计算机系!上海
来源:
关键词:
文语转换;
汉语分词;
最大匹配法;
多交集歧义;
多音词;
姓名识别;
D O I:
暂无
中图分类号:
TP317.2 [文字处理软件];
学科分类号:
1403 ;
摘要:
基于一个实际的文语转换系统,介绍了它的一些处理方法,采用了一种改进的最大匹配法,可以切分出所有的交集歧义,提出了一种基于统计模型的算法来处理其中的多交集歧义字段,并用穷举法和一些简单的规则相组合的方法从实用角度解决多音字的异读问题以及中文姓名的自动识别方法,解决了汉语切分歧义、多音词处理、中文姓名的自动识别问题,达到实现文语转换的目的。
引用
收藏
页码:8 / 11
页数:4
相关论文