共 13 条
基于深度学习的数据科学招聘实体自动抽取及分析研究
被引:15
作者:
王东波
[1
]
胡昊天
[1
]
周鑫
[2
]
朱丹浩
[3
]
机构:
[1] 南京农业大学信息科学技术学院
[2] 南京大学信息管理学院
[3] 南京大学计算机科学与技术系
来源:
关键词:
数据科学;
条件随机场;
深度学习;
Bi-LSTM-CRF;
D O I:
10.13266/j.issn.0252-3116.2018.13.009
中图分类号:
G203 [信息资源及其管理];
学科分类号:
1204 ;
1402 ;
摘要:
[目的/意义]数据科学作为一个融合诸多领域的新兴交叉学科正在快速形成。从数据科学招聘的公告信息中,抽取出相应的实体知识不仅有助于从市场的角度了解数据科学的发展动态,而且有助于改进数据科学教学的内容。[方法/过程]基于各大招聘网站职位招聘公告,结合情报学的数据获取、标注和组织方法,构建数据科学招聘语料库并从中抽取相应的实体进行分析与研究。[结果/结论]在搜集到的11 000篇经过标注的职位招聘公告语料的基础上,基于Bi-LSTM-CRF、CRF和Bi-LSTM模型,对数据科学招聘实体的抽取任务进行性能的对比,确定最终的数据科学招聘实体自动抽取模型,设计数据科学招聘实体自动抽取平台,并构建数据科学招聘实体网络。
引用
收藏
页码:64 / 73
页数:10
相关论文