Veiligstellen
TIP
Zorg dat informatie niet kwijt kan raken. Maak het liefst twee back-ups waarvan één op een andere (fysieke) locatie en plaats eventueel een back-up in de cloud.
Een erfgoedinstelling kan digitale objecten (de masterbestanden en de representatie-informatie) op allerlei manieren aangeleverd krijgen:
- via een fysieke drager (CD-rom, DVD, etc.)
- via FTP
- via mail
- als cloudtransfer
- via harvesting (een proces waarbij een script wordt gebruikt om een grote hoeveelheid gegevens automatisch te extraheren uit websites)
Omdat opslagmedia vergaan, computers wel eens crashen, bestanden per ongeluk overschreven of verwijderd worden, virussen de digitale integriteit van bestanden aan kunnen tasten en rampen zoals brand om zich heen kunnen slaan is het zaak werk te maken van duurzame opslag. Zodra een digitaal object voor opname is geselecteerd, is het een goede praktijk om de digitale originelen in meerdere kopieën op te slaan op minimaal twee verschillende fysieke locaties. Je kunt daarbij kiezen voor een combinatie van on-site, off-site en cloudopslag. Bij een on-site back-up bevindt de back-up van je gegevens zich op dezelfde locatie als het origineel. Denk hierbij aan een externe harde schijf. Bij een off-site back-up (ook wel remote back-up) bevindt de extra kopie zich op een andere, geografische gescheiden locatie. Bij een cloudopslag wordt je back-up via het internet verstuurd naar een speciaal ingericht datacentrum. Hierbij moet je er rekening mee houden dat cloudopslag vaak wordt gehost door commerciële partijen en die kunnen er bij wijze van spreken morgen mee ophouden.
Op dit preserveringsniveau ben je bezig met het veiligstellen van digitale objecten, ook wel ‘passief preserveren’ genoemd. Het is de eerste stap voor bitpreservering.
Het jargon
FTP
FTP is de afkorting van File Transfer Protocol. Met FTP is het mogelijk om op een eenvoudige manier informatie vanaf je eigen computer te uploaden naar een server.
Harvesting
Harvesting is een proces waarbij een script wordt gebruikt om een grote hoeveelheid gegevens automatisch te extraheren uit websites. Bekende voorbeelden zijn webharvesting met tools zoals Web Curator en metadataharvesting via het OAI-PMH protocol.
Preserveringsniveaus
Preserveringsniveaus (in het Engels ‘preservation levels‘) is een begrip dat aangeeft dat het vormgeven van duurzame toegang op allerlei niveau’s – daar waar je bent – kan worden ingestoken. Het is een term die bedacht is door The National Digital Stewardship Alliance.
Meer weten?
- Hulp nodig bij cloud storage? Lees de ‘cloud storage guidance‘ (pdf, Engelstalig) van The National Archives.
Het schema van de NDSA is toegepast door de USGS (United States Geological Survey). Interessant is dat zij een zesde ‘area’ ‘Physical Media’ hebben toegevoegd aan de NDSA-richtlijn. Onduidelijk vind ik wel waarom, want deze problematiek (overzetten van fysieke dragers zoals harde schijven etc. ) behoort toch in area ‘Storage and Geographical Location’ thuis? De USGS heeft het schema van de NDSA ook als assessment/score-tool opgevat: welke cellen in de tabel scoren op de criteria Pass/Incomplete/Fail, met resp. kleuren groen/oranje/rood. Je kunt a.d.h. hiervan ook een nul-meting doen (Before/After).
Heel helder. Ook het progressieve karakter van de ‘levels of preservation’ heeft de USGS slim opgevat als:
Level One: The minimum criteria and activities needed to maintain data through the life of a research project
Level Two: Better. Implement Level Two elements after all Level One elements are in place.
Level Three: Even better. Implement Level Three elements after all Level Two elements are in place.
Level Four: Best. USGS should plan to provide repositories that meet these criteria for a long
term USGS records