Web Archive的采集策略研究

被引:24
作者
刘兰 [1 ,2 ]
吴振新 [1 ]
张智雄 [1 ]
徐麒 [3 ]
机构
[1] 中国科学院国家科学图书馆
[2] 中国科学院研究生院
[3] 西南交通大学图书馆
关键词
Web Archive; 采集策略; 完整性采集; 选择性采集; 混合型采集;
D O I
暂无
中图分类号
G250.73 [网络资源开发与利用];
学科分类号
摘要
通过总结目前国际上Web Archive中常用的三种采集策略:完整性采集、选择性采集和混合型采集,对比分析各种采集策略的特点、关键问题和代表性的项目,最后分析选择采集策略需要考虑的关键因素,并提出一般性的建议。
引用
收藏
页码:10 / 15
页数:6
相关论文
共 6 条
  • [1] The Australian Web Domain Harvests:A Preliminary Quantitative Analysis of the Archive Data. http://pandora.nla.gov.au/documents/auscrawls.pdf . 2008
  • [2] Collecting and Preserving the World Wide Web:A Feasibility Study Undertaken for the JISC and Wellcome Trust. Michael Day. http://www.jisc.ac.uk/uploaded-docu-ments/archiving-feasibility.pdf . 2008
  • [3] WebArchiv-Archive of the Czech Web. http://en.webarchiv.cz/thematic-collections . 2008
  • [4] The Internet Archive Web Archive. ht-tp://wa.archive.org/aroundtheworld/index.new.html . 2008
  • [5] Online Australian Publications:Selection Guidelines for Archiving and Preservation by the National Library of Australia. http://pandora.nla.gov.au/selectionguide-lines.html . 2008
  • [6] Approaches to the Preservation of Web Sites. Kelly B. http://www.ukoln.ac.uk/ . 2008