基于CRF算法的航天命名实体识别

被引:19
作者
徐建忠 [1 ]
朱俊 [2 ]
赵瑞 [3 ]
张亮 [1 ]
李娇娇 [1 ]
机构
[1] 杭州世平信息科技有限公司
[2] 西昌卫星发射中心
[3] 装甲兵工程学院
关键词
航天; 命名实体识别; CRF; 信息抽取;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; V4 [航天(宇宙航行)];
学科分类号
082501 [飞行器设计]; 120506 [数字人文];
摘要
航天领域相关文本正在飞速累积,随着人类探索太空的进程快速推进,相关文本的累积速度进一步加快。人工阅读整理此类文本显得效率低下,因此,针对航天文本研究信息抽取技术实现信息自动抽取变得十分有价值,而命名实体识别技术又是自动信息抽取的基础,建立一种航天命名实体识别的高效方法具有很重要的现实意义。本文针对航天领域命名实体识别这一特定问题,通过人工构建训练数据集、特征设计和CRF模型训练,建立了一种航天命名实体识别的高效方法。通过与基于字符串匹配的方法相比较,本文所提方法有着更高的准确率和召回率,验证了本文所提方法的有效性。
引用
收藏
页码:42 / 46
页数:5
相关论文
共 5 条
[1]
基于改进SVM和HMM的文本信息抽取算法 [J].
孙师尧 ;
妙全兴 .
计算机应用与软件, 2015, 32 (11) :281-284+292
[2]
An algorithm that learns what's in a name [J].
Bikel, DM ;
Schwartz, R ;
Weischedel, RM .
MACHINE LEARNING, 1999, 34 (1-3) :211-231
[3]
基于规则和条件随机场的中文命名实体识别方法研究 [D]. 
程志刚 .
华中师范大学,
2015
[4]
面向中文微博的产品名实体识别与规范化算法设计与实现 [D]. 
杨献祥 .
北京理工大学,
2015
[5]
基于最大熵的自动文摘技术研究 [D]. 
陈淑栋 .
昆明理工大学,
2013