融合基本特征和词袋绑定特征的问句特征模型

被引:7
作者
杨思春 [1 ,2 ]
高超 [3 ]
秦锋 [2 ]
戴新宇 [1 ]
陈家骏 [1 ]
机构
[1] 南京大学计算机软件新技术国家重点实验室
[2] 安徽工业大学计算机学院
[3] 滁州学院计算机与信息工程学院
关键词
问答系统; 问句分类; 特征模型; 词袋绑定;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
针对当前问句分类研究中特征提取的处理开销较大,提出一种融合基本特征和词袋绑定特征的问句特征模型。在分别提取问句中的词袋、词性、词义等基本特征及其对应的词袋绑定特征的基础上,通过将基本特征与词袋绑定特征进行融合,以获取更加高效的问句特征集合。在哈尔滨工业大学中文问句集上的实验结果表明,这种新的问句特征模型不仅具有实现简单、处理开销小的优点,而且有效弥补了单纯基本特征或词袋绑定特征在句法语义表达方面的不足,进一步提高了问句分类的准确率。
引用
收藏
页码:46 / 52
页数:7
相关论文
共 10 条
[1]   基于词袋绑定的问句新特征自动生成 [J].
杨思春 ;
高超 ;
戴新宇 ;
陈家骏 ;
杨思国 .
北京理工大学学报, 2012, 32 (06) :590-595
[2]   开放域问答技术研究进展 [J].
张志昌 ;
张宇 ;
刘挺 ;
李生 .
电子学报, 2009, 37 (05) :1058-1069
[3]   基于线索词识别和训练集扩展的中文问题分类 [J].
张志昌 ;
张宇 ;
刘挺 ;
李生 .
高技术通讯, 2009, 19 (02) :111-118
[4]   基于错误驱动算法组合分类器及其在问题分类中的应用 [J].
李鑫 ;
黄萱菁 ;
吴立德 .
计算机研究与发展, 2008, (03) :535-541
[5]   基于知网的中文问题自动分类 [J].
孙景广 ;
蔡东风 ;
吕德新 ;
董燕举 .
中文信息学报, 2007, (01) :90-95
[6]   基于句法结构分析的中文问题分类 [J].
文勖 ;
张宇 ;
刘挺 ;
马金山 .
中文信息学报, 2006, (02) :33-39
[7]   基于支持向量机的汉语问句分类 [J].
余正涛 ;
樊孝忠 ;
郭剑毅 .
华南理工大学学报(自然科学版), 2005, (09) :25-29+34
[8]   基于改进贝叶斯模型的问题分类 [J].
张宇 ;
刘挺 ;
文勖 .
中文信息学报, 2005, (02) :100-105
[9]   Question classification based on co-training style semi-supervised learning [J].
Yu, Zhengtao ;
Su, Lei ;
Li, Lina ;
Zhao, Quan ;
Mao, Cunli ;
Guo, Jianyi .
PATTERN RECOGNITION LETTERS, 2010, 31 (13) :1975-1980
[10]  
Questionclassification using head words and their hypernyms. Huang Zhi-heng,Thint M,Qin Zeng-chang. Proceedings of the 2008Conference on EmpiricalMethods in Natural Language Processing (EMNLP2008) . 2008