基于支持向量机的汉语问句分类

被引:19
作者
余正涛
樊孝忠
郭剑毅
机构
[1] 昆明理工大学信息工程与自动化学院
[2] 北京理工大学计算机科学与工程系
关键词
问答系统; 问句分类; 支持向量机; 句法特征; 语义特征;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
目前汉语问句分类一般都依据疑问词及其相关词的组合规则,但由于规则的提取很深地依赖于语言知识,而且很难穷举出所有的特征规则,因此会影响分类的效果.支持向量机(SVM)是建立在统计理论基础上的机器学习方法,对于小样本分类问题有很好的识别效果.文中分析和定义了汉语问句的类型,建立了以SVM为基础的问句分类模型,详细描述了问句分类特征的选取过程,并在句法特征的基础上引入语义特征进行汉语问句分类实验,分类准确率达88.7%,表明结合句法和语义特征以SVM进行汉语问句分类具有很好的效果.
引用
收藏
页码:25 / 29+34 +34
页数:6
相关论文
共 4 条
[1]   基于最大熵模型的组块分析 [J].
李素建 ;
刘群 ;
杨志峰 .
计算机学报, 2003, (12) :1722-1727
[2]   自动问答综述 [J].
郑实福 ;
刘挺 ;
秦兵 ;
李生 .
中文信息学报, 2002, (06) :46-52
[3]   关于统计学习理论与支持向量机 [J].
张学工 .
自动化学报, 2000, (01) :36-46
[4]  
基于互联网的中文问答系统研究.[D].赵辄谦.山西大学.2003, 01