HENU汉语自动分词系统中歧义字段消除算法

被引:5
作者
郑逢斌
付征叶
乔保军
毋琳
机构
[1] 河南大学计算机与信息工程学院
[2] 河南大学生命科学学院
[3] 河南大学计算机与信息工程学院 河南开封 西南交通大学智能控制开发中心
[4] 四川成都
关键词
自然语言处理; 自动分词; 歧义字段;
D O I
10.15991/j.cnki.411100.2004.04.013
中图分类号
TP391.12 [];
学科分类号
摘要
先用基于词典的最大匹配法匹配出最长词和次长词,再用检测跨越的方法发现切分歧义,判断出切分歧义是交集型切分歧义还是组合型切分歧义,根据切分歧义类型的不同分别进行切分歧义的消除.交集型切分歧义的消除方法主要是混合使用基于规则的方法和基于统计的方法,组合型歧义的消除方法主要是使用基于规则的方法,找到正确的切分位置.
引用
收藏
页码:49 / 52
页数:4
相关论文
共 5 条
[1]  
汉语自动分析中的若干问题与对策.[A].侯敏;.全国第六届计算语言学联合学术会议.2001,
[2]  
自然语言理解.[M].姚天顺等编著;.清华大学出版社.2002,
[3]  
中文文本自动分词和标注.[M].刘开瑛著;.商务印书馆.2000,
[4]  
现代汉语语法信息词典详解.[M].俞士汶等著;.清华大学出版社.1998,
[5]   自然语言处理中的歧义消解方法 [J].
冯志伟 .
语言文字应用, 1996, (01) :55-60+113