融合迁移学习的中文命名实体识别

被引:24
作者
王红斌
沈强
线岩团
机构
[1] 昆明理工大学信息工程与自动化学院
关键词
命名实体识别; 迁移学习; 机器学习; TLNERAdaBoost;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
命名实体识别是自然语言处理研究领域中的一项很重要的基础性任务,是实体关系抽取和事件抽取等高层任务重要基石.如何在缺乏标注语料或只有少量标注语料条件下,提高命名实体识别的性能是自然语言处理领域的一个重要研究方向.针对这一问题,提出一种基于实例的迁移学习算法——TLNERAdaBoost.该方法通过自动调整训练集中实例样本的权重和计算辅助训练样本的迁移能力来提高训练语料质量,并选取采用不完全标注语料的自学习方法和采用完全标注语料的基于条件随机场的方法来对该方法进行实验对比分析.经实验对比分析得知,本文方法在提高命名实体识别的准确率、召回率和F值的同时,大大降低了人工标注语料的工作量.
引用
收藏
页码:346 / 351
页数:6
相关论文
共 10 条
[1]  
基于实例迁移学习的文本分类研究.[D].刘晓明.吉林大学.2014, 10
[2]   Multitask learning [J].
Caruana, R .
MACHINE LEARNING, 1997, 28 (01) :41-75
[3]  
统计自然语言处理.[M].宗成庆; 编著.清华大学出版社.2007,
[4]   基于词表示方法的生物医学命名实体识别 [J].
李丽双 ;
何红磊 ;
刘珊珊 ;
黄德根 .
小型微型计算机系统, 2016, 37 (02) :302-307
[5]   基于CRF和规则相结合的地理命名实体识别方法 [J].
何炎祥 ;
罗楚威 ;
胡彬尧 .
计算机应用与软件, 2015, 32 (01) :179-185+202
[6]   基于规则的越南语命名实体识别研究 [J].
闫丹辉 ;
毕玉德 .
中文信息学报, 2014, 28 (05) :198-205+214
[7]   主动学习与自学习的中文命名实体识别 [J].
钟志农 ;
刘方驰 ;
吴烨 ;
伍江江 .
国防科技大学学报, 2014, 36 (04) :82-88
[8]   迁移学习研究进展 [J].
庄福振 ;
罗平 ;
何清 ;
史忠植 .
软件学报, 2015, 26 (01) :26-39
[9]   迁移学习支持向量回归机 [J].
史荧中 ;
王士同 ;
蒋亦樟 ;
刘培林 .
计算机应用, 2013, 33 (11) :3084-3089
[10]   命名实体识别、排歧和跨语言关联 [J].
赵军 .
中文信息学报, 2009, (02) :3-17