基于无监督学习的问答模式抽取技术

被引:9
作者
吴友政
赵军
徐波
机构
[1] 中国科学院自动化研究所模式识别国家重点实验室
基金
北京市自然科学基金;
关键词
人工智能; 自然语言处理; 汉语问答系统; 问答模式; 机器学习;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
本文提出了一种基于无监督学习算法的问答模式抽取技术从互联网上抽取应用于汉语问答系统的答案模式。该算法可以避免有监督学习算法的不足,它无需用户提供<提问,答案>对作为训练集,只需用户提供每种提问类型两个或以上的提问实例,算法即可通过Web检索、主题划分、模式提取、垂直聚类和水平聚类等步骤完成该类型提问的答案模式的学习。实验结果表明,论文提出的无监督问答模式学习方法是有效的,基于模式匹配的答案抽取技术能够较大幅度地提高汉语问答系统的性能。
引用
收藏
页码:69 / 76
页数:8
相关论文
共 1 条
[1]  
Chinese NamedEntity Recognition Model Based on Multiple Features .2 Youzheng Wu,Jun Zhao,Bo Xu. Proceedings of HLT/EMNLP . 2005