基于深度学习的数据科学招聘实体自动抽取及分析研究

被引:15
作者
王东波 [1 ]
胡昊天 [1 ]
周鑫 [2 ]
朱丹浩 [3 ]
机构
[1] 南京农业大学信息科学技术学院
[2] 南京大学信息管理学院
[3] 南京大学计算机科学与技术系
关键词
数据科学; 条件随机场; 深度学习; Bi-LSTM-CRF;
D O I
10.13266/j.issn.0252-3116.2018.13.009
中图分类号
G203 [信息资源及其管理];
学科分类号
1204 ; 1402 ;
摘要
[目的/意义]数据科学作为一个融合诸多领域的新兴交叉学科正在快速形成。从数据科学招聘的公告信息中,抽取出相应的实体知识不仅有助于从市场的角度了解数据科学的发展动态,而且有助于改进数据科学教学的内容。[方法/过程]基于各大招聘网站职位招聘公告,结合情报学的数据获取、标注和组织方法,构建数据科学招聘语料库并从中抽取相应的实体进行分析与研究。[结果/结论]在搜集到的11 000篇经过标注的职位招聘公告语料的基础上,基于Bi-LSTM-CRF、CRF和Bi-LSTM模型,对数据科学招聘实体的抽取任务进行性能的对比,确定最终的数据科学招聘实体自动抽取模型,设计数据科学招聘实体自动抽取平台,并构建数据科学招聘实体网络。
引用
收藏
页码:64 / 73
页数:10
相关论文
共 13 条
[1]   数据科学及其对信息科学的影响 [J].
朝乐门 ;
卢小宾 .
情报学报, 2017, 36 (08) :761-771
[2]   基于深度学习的中文机构名识别研究——一种汉字级别的循环神经网络方法 [J].
朱丹浩 ;
杨蕾 ;
王东波 .
现代图书情报技术, 2016, (12) :36-43
[3]   国外数据科学研究的回顾与展望 [J].
王曰芬 ;
谢清楠 ;
宋小康 .
图书情报工作, 2016, 60 (14) :5-14
[4]   基于深度信念网络的命名实体识别 [J].
冯蕴天 ;
张宏军 ;
郝文宁 ;
陈刚 .
计算机科学, 2016, 43 (04) :224-230
[5]   数据科学与工程:大数据时代的新兴交叉学科 [J].
周傲英 ;
钱卫宁 ;
王长波 .
大数据, 2015, 1 (02) :90-99
[6]   数据科学兴起及其与信息科学的关联 [J].
叶鹰 ;
马费成 .
情报学报, 2015, (06) :575-580
[7]   基于语言规则的病症菌实体抽取 [J].
许华 ;
刘茂福 ;
姜丽 ;
顾进广 .
武汉大学学报(理学版), 2015, 61 (02) :151-155
[8]   大数据背景下数据科学分析工具现状及发展趋势 [J].
杨京 ;
王效岳 ;
白如江 ;
祝娜 .
情报理论与实践, 2015, (03) :134-137+144
[9]   基于实体消歧的中文实体关系抽取 [J].
邵发 ;
黄银阁 ;
周兰江 ;
郭剑毅 ;
余正涛 ;
张金鹏 .
山东大学学报(工学版), 2014, 44 (06) :32-37+76
[10]   基于Deep Belief Nets的中文名实体关系抽取 [J].
陈宇 ;
郑德权 ;
赵铁军 .
软件学报, 2012, 23 (10) :2572-2585