采用主动学习策略的组织机构名识别

被引:10
作者
冯冲 [1 ]
陈肇雄 [2 ]
黄河燕 [2 ]
机构
[1] 中国科学技术大学计算机科学与技术系
[2] 中国科学院计算机语言信息工程研究中心
关键词
主动学习; 命名实体识别; 最大熵模型; 组织机构名;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
组织机构名等命名实体的识别是信息抽取、机器翻译等任务的重要基础.为了克服识别器训练过程中对标注数据的依赖,本文提出了一种基于主动学习的训练策略,改进了基本的最大熵模型的解码算法和训练过程.实验表明采用主动学习策略的最大熵模型训练算法能够有效减少标注数据的使用.
引用
收藏
页码:710 / 714
页数:5
相关论文
共 1 条
[1]   基于多策略的交互式智能辅助翻译平台总体设计 [J].
黄河燕 ;
陈肇雄 .
计算机研究与发展, 2004, (07) :1266-1272