中文分词中歧义切分处理策略

被引:46
作者
郑家恒
张剑锋
谭红叶
机构
[1] 山西大学计算机与信息技术学院计算智能与中文信息处理省部共建教育部重点实验室
关键词
自动分词; 伪歧义; 真歧义; 概率模型;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
文章试图从歧义字段本身的特点,即从伪歧义与真歧义这两个角度,以规则库为辅助手段,构建相应概率统计模型来解决歧义字段切分的问题.概率模型中特征的选取考虑了相邻词语和相邻词语的语义信息.实验表明该模型在解决歧义切分问题上是有效的.
引用
收藏
页码:163 / 167
页数:5
相关论文
共 4 条
[1]
现代汉语通用分词系统中歧义切分的实用技术 [J].
罗智勇 ;
宋柔 .
计算机研究与发展, 2006, (06) :1122-1128
[2]
基于汉语二字应成词的歧义字段切分方法 [J].
郑德权 ;
于凤 ;
王开涛 ;
赵铁军 .
计算机工程与应用, 2003, (01) :17-18+26
[3]
利用上下文信息解决汉语自动分词中的组合型歧义 [J].
肖云 ;
孙茂松 ;
邹嘉彦 .
计算机工程与应用, 2001, (19) :87-89+106
[4]
高频最大交集型歧义切分字段在汉语自动分词中的作用 [J].
孙茂松 ;
左正平 ;
邹嘉彦 .
中文信息学报, 1999, (01)