一种新的层次化结构问题分类器

被引:5
作者
李方涛
张显
孙建树
朱小燕
机构
[1] 清华大学计算机科学技术系智能技术与系统国家重点实验室
关键词
计算机应用; 中文信息处理; 问题分类; 自动问答系统; 问题词; 中心词;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
问题分类是自动问答系统中关键技术之一,而问题中的关键词语是问题分类的重要依据。本文主要探讨问题词和中心词在问题分类中所起的作用,提出一种基于问题词和中心词的层次化结构问题分类器。分类器首先利用问题词将句子集分为三类,然后对于每个类别分别建立相应的分类器,对于what型问题,本文构造了基于关联规则的中心词分类器。本文实现的层次化结构分类器在TREC 2007 QA问题集和UIUC数据集上精度分别达到了90.6%和84.0%,充分显示了问题词和中心词在问题分类中至关重要的作用。
引用
收藏
页码:93 / 98
页数:6
相关论文
共 2 条
[1]   Analysis of statistical question classification for fact-based questions [J].
Metzler, D ;
Croft, WB .
INFORMATION RETRIEVAL, 2005, 8 (03) :481-504
[2]  
The use of predictive annotation for questionanswering in TREC .2 Prager,J,D Radev,E Brown,A Coden,and V.Samn. Proceedings of the 8thText Retrieval Conference(TREC-8) . 1999