海量网络学术文献自动分类系统

被引:9
作者
王效岳
白如江
王晓笛
祝娜
机构
[1] 山东理工大学科技信息研究所
关键词
学术文献; 自动分类; 并行处理;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; G254.11 [分类理论与方法];
学科分类号
081203 ; 0835 ; 1205 ; 120501 ;
摘要
随着Internet的发展,互联网上的学术文献数量呈指数增长,很难为科研工作者所利用,因此亟需一种方法对海量的网络学术文献进行自动的搜集、整理、分类。在前期充分的实验论证后,设计实现一个海量网络学术文献自动分类系统,该系统使用模块化设计,包括学术文献自动抓取模块、学术文献词-文档矩阵处理模块、本体集成模块以及基于语义驱动的分类模块。实验证明,该系统可以有效地完成海量学术文献的自动抓取、处理和分类工作。
引用
收藏
页码:117 / 122
页数:6
相关论文
共 7 条
[1]   基于Heritrix的网络学术文献获取研究 [J].
白如江 ;
王效岳 ;
亢丽芸 .
图书情报工作, 2012, (11) :99-104+108
[2]   MapReduce原理及其主要实现平台分析 [J].
亢丽芸 ;
王效岳 ;
白如江 .
现代图书情报技术, 2012, (02) :60-67
[3]   本体集成方法和工具综述 [J].
于晓繁 ;
王效岳 ;
白如江 .
现代图书情报技术, 2011, (01) :14-21
[4]   基于SUMO和WordNet本体集成的文本分类模型研究 [J].
胡泽文 ;
王效岳 ;
白如江 .
现代图书情报技术, 2011, (01) :31-38
[5]   国内外主要本体库比较分析研究 [J].
白如江 ;
于晓繁 ;
王效岳 .
现代图书情报技术, 2011, (01) :3-13
[6]   基于SUMO本体的图书自动分类模型研究 [J].
马范玲 ;
胡泽文 .
情报杂志, 2011, (01) :168-173
[7]  
WordNet[J] . George A. Miller. Communications of the ACM . 1995 (11)