基于Tri-training半监督学习的中文组织机构名识别

被引:4
作者
蔡月红 [1 ,2 ]
朱倩 [1 ]
程显毅 [1 ]
机构
[1] 江苏大学计算机科学与通信工程学院
[2] 江苏大学外语学习中心
关键词
中文组织机构名; 半监督学习; 协同训练; Tri-training;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
针对中文组织机构名识别中的标注语料匮乏问题,提出了一种基于协同训练机制的组织机构名识别方法。该算法利用Tri-training学习方式将基于条件随机场的分类器、基于支持向量机的分类器和基于记忆学习方法的分类器组合成一个分类体系,并依据最优效用选择策略进行新加入样本的选择。在大规模真实语料上与co-training方法进行了比较实验,实验结果表明,此方法能有效利用大量未标注语料提高算法的泛化能力。
引用
收藏
页码:193 / 195
页数:3
相关论文
共 5 条
[1]   基于支持向量机方法的中文组织机构名的识别 [J].
陈霄 ;
刘慧 ;
陈玉泉 .
计算机应用研究, 2008, (02) :362-364+367
[2]   基于层叠条件随机场模型的中文机构名自动识别 [J].
周俊生 ;
戴新宇 ;
尹存燕 ;
陈家骏 .
电子学报, 2006, (05) :804-809
[3]   采用主动学习策略的组织机构名识别 [J].
冯冲 ;
陈肇雄 ;
黄河燕 .
小型微型计算机系统, 2006, (04) :710-714
[4]   基于HMM的中国组织机构名自动识别 [J].
郑家恒 ;
张辉 .
计算机应用, 2002, (11) :1-2+25
[5]   中文机构名称的识别与分析 [J].
张小衡 ;
王玲玲 .
中文信息学报, 1997, (04) :22-33