Preserveringsstrategieën
TIP
Maak een plan om informatie mee te nemen door de tijd
Zonder preserveringsstrategie is een organisatie niet in staat om een levensvatbaar preserveringsproces in te richten voor het duurzaam behoud van de digitale collecties. Permanente technologische veranderingen van bestandsformaten, hardware en software vereisen doordachte maatregelen om informatieobjecten authentiek, begrijpelijk en blijvend toegankelijk te houden.
Bitpreservering
Het allereerste preserveringsniveau is bitpreservering: zorgen dat de volgorde van nullen en enen intact blijft. Bitpreservering omvat:
- het onderhouden van on-site and off-site back-ups (zoals je hebt geleerd in Hoofdstuk 1 van deze module);
- het regelmatig uitvoeren van een viruscheck;
- het tijdig verversen van opslagmedia;
- het regelmatig checken van de integriteit van de digitale objecten.
Een manier om te checken of een bestand onveranderd is ten opzichte van zijn originele staat, is het achterhalen van de zogeheten digitale handtekening van het digitale object met een zogeheten checksumchecker. Je checkt dan de volgorde van nullen en enen op de digitale drager: dat heet ook wel een fixity check. Idealiter wordt een informatiepakketje bij een archief aangeleverd mét een checksumwaarde. Als je op gezette tijdstippen in de levenscyclus van een digitaal object een checksum bepaalt, dan kun je die waarde vergelijken met de oorspronkelijke waarde. Mocht de volgorde van nullen en enen dan onbedoeld veranderd zijn, dan kun je het bestand vervangen door een back-up.
Checksum-algoritmes
Er zijn verschillende checksum-algoritmes zoals MD5 en SHA (Secure Hash Algorithm) waarmee je de checksum kunt checken. Een verschil is dat SHA een langere checksumcode genereert dan MD5. Hoe ‘sterker’ het algoritme, des te moeilijker het is om een bestand met opzet te veranderen op een manier die niet wordt ontdekt. Als je aanwijzingen hebt dat je bestanden moedwillig beschadigd zouden kunnen worden (bijvoorbeeld omdat je bestand in rechtszaken gebruikt wordt) dan gebruik je het beste een sterk algoritme. Als checksums worden gebruikt om verlies of beschadiging van bestanden op te sporen als gevolg van een fout tijdens het opslaan dan is MD5 voldoende.
In de keuzeopdrachten van deze module kun je ook zelf oefenen met het genereren van een checksum.
Bitpreservering vormt de basis voor duurzame toegankelijkheid, omdat het zorgt voor de instandhouding van het digitale object. Echter, er is meer nodig om ook het informatieobject en de representatie-informatie, zoals je hebt geleerd in Module A, in stand te houden, zodat die langdurig bruikbaar en authentiek blijft.
Functionele preservering
Functionele preservering wordt ook wel contentpreservering of logische preservering genoemd. Het zorgt ervoor dat informatieobjecten op de lange termijn authentiek en bruikbaar blijven. Functionele preservering omvat verschillende preserveringsstrategieën zoals migratie, emulatie, converteren en normaliseren. Andere mogelijke strategieën zijn afdrukken op papier, de originele software en hardware bewaren en herinterpretatie. In onderstaand filmpje komt een aantal van de bovengenoemde strategieën aan bod.
Elke strategie heeft gevolgen voor het behoud van de essentiële kenmerken en voor de expertise, voorzieningen en middelen die nodig zijn. Migratie en normalisatie kunnen bijvoorbeeld leiden tot veranderingen in structuur, vorm en gedrag van digitale objecten en voor emuleren is veel expertise en een complexe infrastructuur nodig.
Omkeerbare en onomkeerbare migratie
Er bestaan omkeerbare en niet-omkeerbare migraties. Vergelijk een niet-omkeerbare migratie met het koken van een ei: een gekookt ei wordt nooit meer een rauw ei. Een omkeerbare migratie kun je vergelijken met de overgang van ijs naar water en weer terug. De migratie is – onder de juiste omstandigheden – ongedaan te maken.
In de wereld van digitale objecten is een omkeerbare migratie bijvoorbeeld het omzetten van een ASCII-tekst naar een UTF-8- tekst: dat is een een-op-een-transformatie die je ook kunt terugdraaien. Als je een TIFF-file omzet naar een JPEG 2000-file kun je niet zonder meer terug zonder informatie te verliezen. In dit geval is er sprake van een niet-omkeerbare migratie en is er geen een-op-een-relatie meer tussen de volgorde van nullen en enen in het origineel en de afgeleide. Als je ongewenst informatieverlies wilt voorkomen is het van belang dat je je verdiept in de ‘Transformation Information Properties’ van de bestanden die je opneemt in je archief.
Ongewild informatieverlies voorkomen
Het kan ook gebeuren dat je zelf ongewild de integriteit van een bestand verandert. Een van de geboden om dat te voorkomen luidt als volgt:
“Gij zult een bestand niet openen voordat u een kopie heeft gemaakt”
Bij het openen van bestanden ontstaat feitelijk een nieuwe kopie van het bestand en kunnen er veranderingen in documentinstellingen en -inhoud optreden. Daarom mag je alleen kopieën van bestanden openen, omdat je anders ongewild de authenticiteit en integriteit aan kunt tasten. Dat betekent bijvoorbeeld ook dat je de foto’s die op een geheugenkaartje staan niet mag draaien van landscape naar portrait of andersom voordat je de bestanden hebt gekopieerd. Bij het roteren van een bestand kan de volgorde van nullen en enen namelijk ook veranderen, waardoor het bestand onleesbaar kan worden.
Het jargon
Checksum
Fixity (vastheid) gaat over de garantie dat een digitaal object onveranderd is en dat de integriteit intact is. Zo’n check voer je uit met een zogeheten checksum checker en na het checken volgt er een controlegetal (de checksum).
Idealiter wordt een informatiepakketje bij een archief aangeleverd mét een checksumwaarde. Als je op gezette tijdstippen in de levenscyclus van een digitaal object een checksum bepaalt, dan kun je die waarde vergelijken met de oorspronkelijke waarde. Mocht de volgorde van nullen en enen dan onbedoeld veranderd zijn, dan kun je het bestand vervangen door een back-up.
Converteren
Converteren is het omzetten naar een hogere versie van hetzelfde bestandsformaat.
Migreren
Migreren is het overzetten naar een ander media- of bestandsformaat. Media-migratie is het overzetten van bestanden naar een andere drager en formaat-migratie is het overzetten naar een ander bestandsformaat.
Normaliseren
Normaliseren is de omzetting naar een bestandsformaat dat duurzamer wordt geacht binnen het duurzaamheidsbeleid en de preserveringsstrategie van een organisatie.
Emulatie/Virtualisatie
Duurzaamheidsstrategie gericht op het behoud van digitale bronnen zoals ze oorspronkelijk zijn vervaardigd en gebruikt. Door emulatietechnieken toe te passen wordt het mogelijk het gedrag van een verouderde computer na te bootsen op een andere (nieuwere) computer. Emulatie kan op vier aspecten van een computer van toepassing zijn: de hardware, het besturingssysteem, de bijbehorende software en de digitale objecten die met die software zijn vervaardigd.
Herinterpretatie
Het opnieuw installeren, uitvoeren of reconstrueren van een werk (mede op basis van documentatie) en het bewaren van de oorspronkelijke beleving. Dit wordt toegepast door LIMA.
Meer weten?
- Bekijk de experimenten van Beeld en Geluid met emulatie van games.
- Lees het rapport van LIMA over CD-romarchivering waarbij emulatie als strategie wordt onderzocht.
- Onderstaand filmpje (in het Engels) van Dough Boyd, directeur van het Louie B. Nunn Center for Oral History at the University of Kentucky Libraries, legt de rol van een checksum in klare taal uit.
In 2019 is er een website gelanceerd, ontwikkeld door DANS en het Netherlands eScience Center, die onderzoekers en ontwikkelaars helpt hun software meer duurzaam en FAIR (Findable – Accessible – Interoperable – Reusable) te maken: https://fair-software.nl