基于混合模型的中国人名自动识别

被引:9
作者
毛婷婷
李丽双
黄德根
机构
[1] 大连理工大学计算机科学与工程系
关键词
计算机应用; 中文信息处理; 支持向量机; 概率统计; 混合模型; 人名识别;
D O I
暂无
中图分类号
TP391.43 [];
学科分类号
摘要
本文提出了一种支持向量机(SVM)和概率统计模型相结合的中国人名自动识别方法。该方法首先按字抽取特征向量的属性得到训练集,采用多项式核函数建立SVM人名识别模型,然后在特征空间中计算测试样本到SVM最优超平面的距离,当该距离大于给定的阈值时使用SVM对测试样本进行分类,否则使用概率统计方法。实验表明,采用混合模型,对样本在空间的不同分布使用不同的方法可以取得比单独使用SVM或概率统计更好的分类效果,系统开式综合指标F-值比单纯使用支持向量机方法提高了1.51%。
引用
收藏
页码:22 / 28
页数:7
相关论文
共 5 条
[1]   结合决策树方法的中文姓名识别 [J].
王振华 ;
孔祥龙 ;
陆汝占 ;
刘绍明 .
中文信息学报, 2004, (06) :10-15
[2]   基于角色标注的中国人名自动识别研究 [J].
张华平 ;
刘群 .
计算机学报, 2004, (01) :85-91
[3]   基于统计方法的中文姓名识别 [J].
黄德根 ;
杨元生 ;
王省 ;
张艳丽 ;
钟万勰 .
中文信息学报, 2001, (02) :31-37+44
[4]   基于统计方法的中文姓名识别 [J].
刘秉伟 ;
黄萱菁 ;
郭以昆 ;
吴立德 .
中文信息学报, 2000, (03) :16-24+36
[5]   基于支持向量机的手写体相似字识别 [J].
田盛丰 ;
黄厚宽 ;
李洪波 .
中文信息学报, 2000, (03) :37-41