共 5 条
基于正则表达式批量提取CNKI文献元数据技术探究
被引:3
作者:
曹俊
[1
,2
]
万晓云
[2
]
廖顺宝
[1
,2
]
机构:
[1] 中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室
[2] 中国科学院研究生院
来源:
关键词:
CNKI;
元数据;
正则表达式;
批量提取;
D O I:
暂无
中图分类号:
G353 [情报资料的处理];
学科分类号:
1205 ;
摘要:
介绍一种仅仅依靠中国知网文献磁盘文件提取元数据的方法。根据已下载的CNKI文献提取元数据,构建个人文献信息数据库,进而能建立个人文献信息管理系统。虽然CNKI文献库没有提供外界的数据库访问接口,但是文献的元数据都以web页面的方式展现。通过分析与文献绑定的属性页面的结构,利用正则表达式提取文献元数据,可以将其批量导入到数据库中。
引用
收藏
页码:111 / 114
页数:4
相关论文