基于SVM的组块识别及其错误驱动学习方法

被引:21
作者
黄德根
王莹莹
机构
[1] 大连理工大学计算机科学与工程系
关键词
计算机应用; 中文信息处理; 组块分析; 错误驱动学习; 支持向量机(SVM); 规则集;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
081102 [检测技术与自动化装置];
摘要
给出了一种错误驱动学习机制与SVM相结合的汉语组块识别方法。该方法在SVM组块识别的基础上,对SVM识别结果中的错误词语序列的词性、组块标注信息等进行分析,获得候选校正规则集;之后按照阈值条件对候选集进行筛选,得到最终的校正规则集;最后应用该规则集对SVM的组块识别结果进行校正。实验结果表明,与单独采用SVM模型的组块识别相比,加入错误驱动学习方法后,组块识别的精确率、召回率和F值均得到了提高。
引用
收藏
页码:17 / 24
页数:8
相关论文
共 11 条
[1]
基于神经元网络的汉语组块自动划分 [J].
王荣波 ;
池哲儒 .
计算机工程, 2004, (20) :133-135
[2]
基于转换的时间-事件关系映射 [J].
王昀 ;
苑春法 .
中文信息学报, 2004, (04) :23-30
[3]
基于SVM的中文组块分析 [J].
李珩 ;
朱靖波 ;
姚天顺 .
中文信息学报, 2004, (02) :1-7
[4]
基于增益的隐马尔科夫模型的文本组块分析 [J].
李珩 ;
杨峰 ;
朱靖波 ;
姚天顺 .
计算机科学, 2004, (02) :152-154+192
[5]
基于最大熵模型的组块分析 [J].
李素建 ;
刘群 ;
杨志峰 .
计算机学报, 2003, (12) :1722-1727
[6]
基于最大熵方法的中英文基本名词短语识别 [J].
周雅倩 ;
郭以昆 ;
黄萱菁 ;
吴立德 .
计算机研究与发展, 2003, (03) :440-446
[7]
汉语基本短语的自动识别 [J].
张昱琪 ;
周强 .
中文信息学报, 2002, (06) :1-8
[8]
基于神经元网络的汉语短语边界识别 [J].
奚晨海 ;
孙茂松 .
中文信息学报, 2002, (02) :20-26
[9]
基于统计的汉语组块分析 [J].
刘芳 ;
赵铁军 ;
于浩 ;
杨沐昀 ;
方高林 .
中文信息学报, 2000, (06) :28-32+39
[10]
浅层句法分析方法概述 [J].
孙宏林 ;
俞士汶 .
当代语言学, 2000, (02) :74-83+124