基于规则和统计的汉语多输出切分系统

被引:3
作者
张辉 [1 ]
武亚红 [2 ]
黄润才 [1 ]
机构
[1] 上海工程技术大学计算机系
[2] 郑州市艺术工程学校
关键词
切分; 统计方法; 自然语言处理;
D O I
10.19304/j.cnki.issn1000-7180.2007.07.016
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
介绍了一个对汉语语料进行切分加工的系统,该系统结合了规则和统计两类方法,可以按多种方法输出切分结果,并根据概率信息在分词阶段就对歧义进行适当处理,并可保留少数在分词阶段无法确定的歧义留待后继层面上的分析加工。
引用
收藏
页码:56 / 58
页数:3
相关论文
共 2 条
[1]
基于信息网格的分词服务的研究 [J].
郭翠珍 ;
朱巧明 ;
李培峰 ;
钱培德 .
微电子学与计算机, 2006, (05) :121-123+127
[2]
一种新颖的词性标注模型 [J].
袁里驰 ;
钟义信 .
微电子学与计算机, 2005, (09) :1-2+6