基于句法结构特征分析及分类技术的答案提取算法

被引:23
作者
胡宝顺 [1 ]
王大玲 [2 ]
于戈 [2 ]
马婷 [2 ]
机构
[1] 东北大学软件学院计算机科学与技术系
[2] 东北大学信息科学与工程学院计算机软件与理论研究所
关键词
句法依存分析; 分类; 答案提取; 中文问答系统; 事实性问题;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
由于中文自然语言处理的特点和困难以及相应的语言处理基础资源的相对缺乏,使得国外一些成熟技术和研究成果不能直接应用到中文问答系统中.为此,针对中文事实型问答系统,提出一种新的基于句法结构特征分析及分类技术的答案提取算法,该方法将答案提取问题看成是候选答案的分类问题,即将候选答案分类为正确和错误两类.首先,该方法根据与问题类型所对应的候选答案的类型信息,从文本片断中提取出候选答案及其在句子中的简单特征和句法结构特征;然后利用这些特征训练分类器;最后用训练得到的分类器判别候选答案是否为正确答案.针对中文事实性问题,该方法与目前典型的基于模式匹配的中文答案提取算法相比,准确率提升6.2%,MRR提升9.7%.
引用
收藏
页码:662 / 676
页数:15
相关论文
共 3 条
[1]   基于无监督学习的问答模式抽取技术 [J].
吴友政 ;
赵军 ;
徐波 .
中文信息学报, 2007, (02) :69-76
[2]  
Dan Moldovan,Marius Paşca,Sanda Harabagiu,Mihai Surdeanu.Performance issues and error analysis in an open-domain question answering system[J].ACM Transactions on Information Systems (TOIS),2003
[3]  
(美)TomM.Mitchell著,曾华军,张银奎等译.机器学习[M].北京:机械工业出版社,2003