基于XSLT的PDF论文元数据的优化抽取

被引:8
作者
陈俊林
张文德
机构
[1] 福州大学图书馆
关键词
PDF; PDFtoHTML; XSLT; 元数据;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
简述PDF信息抽取过程中采用的转换工具及抽取语言,简析PDFTOHTML格式转换后的中间文档,分析PDF科技论文首页元数据存在的问题,给出对以上问题的解决方案。
引用
收藏
页码:18 / 23
页数:6
相关论文
empty
未找到相关数据