一种面向网络答疑的汉语切分歧义消除算法

被引:4
作者
张素娟
郑庆华
胡云华
孙霞
不详
机构
[1] 西安交通大学计算机系
[2] 西安交通大学计算机系 西安
[3] 西安
关键词
网络答疑; 切分歧义; 回溯机制; 评优算法;
D O I
暂无
中图分类号
TP391.12 [];
学科分类号
081203 ; 0835 ;
摘要
针对网络答疑的特点,该文提出了一种汉语歧义消除算法,采用回溯机制及歧义消除评优算法相结合的方法消除汉语切分歧义。首先利用回溯机制发现句子的切分歧义字段,产生含有多种可能切分结果的候选集;然后针对网络答疑特点提出了评优算法,利用该算法计算候选结果的评价值,对其进行排序,选取分词最佳结果,从而消除歧义,提高分词的准确率。该算法已经在基于Web的自然语言答疑系统WebAnswerSystem中实现并得到了实际应用。实验结果表明,算法具有较高的准确率和召回率,对自然语言网络答疑中进行切分歧义消除是行之有效的。
引用
收藏
页码:55 / 58
页数:4
相关论文
共 7 条
[1]   基于N-最短路径方法的中文词语粗分模型 [J].
张华平 ;
刘群 .
中文信息学报, 2002, (05) :1-7
[2]   利用上下文信息解决汉语自动分词中的组合型歧义 [J].
肖云 ;
孙茂松 ;
邹嘉彦 ;
不详 .
计算机工程与应用 , 2001, (19) :87-89+106
[3]   提高汉语自动分词精度的多步处理策略 [J].
赵铁军 ;
吕雅娟 ;
于浩 ;
杨沐昀 ;
刘芳 .
中文信息学报, 2001, (01) :13-18
[4]   关于歧义字段切分的思考与实验 [J].
刘挺 ;
王开铸 .
中文信息学报, 1998, (02) :64-65
[5]   利用汉字二元语法关系解决汉语自动分词中的交集型歧义 [J].
孙茂松 ;
黄昌宁 ;
邹嘉彦 ;
陆方 ;
沈达阳 .
计算机研究与发展 , 1997, (05) :14-21
[6]   汉语自动分词研究中的苦干理论问题 [J].
孙茂松,邹嘉彦 .
语言文字应用, 1995, (04) :40-46
[7]  
计算语言学[M]. 清华大学出版社 , 刘颖编著, 2002