中文问句分类特征的研究

被引:25
作者
牛彦清
陈俊杰
段利国
张巍
机构
[1] 太原理工大学计算机科学与技术学院
关键词
问题分类; 主要义原; 词义消岐; 支持向量机;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
针对"不同的问句分类特征对问句分类的影响不相同,提取和处理这些特征的时间复杂度也不相同"的问题,提取问题疑问词、核心关键词(疑问词的一二级依存词和问句中心语)的主要义原、核心关键词的首义原、问句主谓宾的主要义原、命名实体、名词单(复)数等六种分类特征,采用支持向量机分类算法,对事实疑问句进行不同特征组合的分类对比实验,发现采用词义消岐技术提取的主要义原不仅对分类的准确率影响明显,而且大幅降低特征向量的维数,减少了处理时间。
引用
收藏
页码:108 / 111
页数:4
相关论文
共 5 条
[1]
基于知网的中文问题自动分类 [J].
孙景广 ;
蔡东风 ;
吕德新 ;
董燕举 .
中文信息学报, 2007, (01) :90-95
[2]
基于句法结构分析的中文问题分类 [J].
文勖 ;
张宇 ;
刘挺 ;
马金山 .
中文信息学报, 2006, (02) :33-39
[3]
基于改进贝叶斯模型的问题分类 [J].
张宇 ;
刘挺 ;
文勖 .
中文信息学报, 2005, (02) :100-105
[4]
自动问答综述 [J].
郑实福 ;
刘挺 ;
秦兵 ;
李生 .
中文信息学报, 2002, (06) :46-52
[5]
基于概念的文本自动分类研究 [D]. 
苏伟峰 .
厦门大学,
2002