Reborn digital i black box – wpływ procesu archiwizacji na zasób archiwów Webu

Bartłomiej Konopa

doi:10.12775/AKZ.2019.008

Archiwa - Kancelarie - Zbiory (Jan 2020)

Reborn digital i black box – wpływ procesu archiwizacji na zasób archiwów Webu

Bartłomiej Konopa

Affiliations

Bartłomiej Konopa: Archiwum Państwowe w Bydgoszczy

DOI: https://doi.org/10.12775/AKZ.2019.008
Journal volume & issue: Vol. 0, no. 10(12)
pp. 147 – 168

Abstract

Read online

W artykule podjęte zostały rozważania nad ogólną charakterystyką zasobów znajdujących się w różnorodnych archiwach Webu. Zrozumienie problemu postawionego w tytule wydaje się być kluczowe dla refleksji nad tym nowym rodzajem źródeł oraz wykorzystaniem ich w późniejszych badaniach. Użytkownik chcący zagłębić się w dawną Sieć musi wiedzieć, co przechowują tego rodzaju cyfrowe repozytoria i jaki jest charakter tych zbiorów. Problem ten został przedstawiony na dwóch płaszczyznach, które wynikają z dwóch etapów archiwizacji Webu – selekcji i gromadzenia. Pierwszy aspekt – teoretyczny zależy przede wszystkim od gromadzenia zasobów metodą harvestingu, czyli z wykorzystaniem crawlerów. Ich możliwości oraz ograniczenia przekładają się na to, co zostanie zarchiwizowane i jaka będzie tego postać. Należy odnotować fakt, iż prowadzi to do pewnego przekształcenia zasobów Sieci, a więc po zarchiwizowaniu nie będą już one dokładnie tym, czym były wcześniej. Drugi aspekt – praktyczny jest efektem selekcji, a więc wszystkich decyzji podejmowanych przez pracowników archiwum przed rozpoczęciem gromadzenia. Zaliczyć można do nich m.in. określenie celu i zakresu archiwizacji oraz wybór strategii pozwalających je realizować. W tekście przedstawione zostały dwie podstawowe metody – archiwizacja masowa oraz selektywna. Znaczącym utrudnieniem dla użytkowników archiwów Webu jest brak informacji dotyczący stosowanych kryteriów selekcji lub logów crawlera. Zasoby dawnej Sieci mogą stanowić pewnego rodzaju zagadkę, ponieważ nie zawsze można wskazać, co się w nich znalazło, a co nie, i jaka była tego przyczyna.

Published in Archiwa - Kancelarie - Zbiory

ISSN: 1895-9075 (Print); 2544-5685 (Online)
Publisher: Nicolaus Copernicus University in Toruń
Country of publisher: Poland
LCC subjects: Auxiliary sciences of history; Bibliography. Library science. Information resources
Website: http://apcz.umk.pl/czasopisma/index.php/AKZ/index

About the journal

Abstract

Keywords