paragraaf

Preserveringsstrategieën

paragraaf Progress:
TIP

Maak een plan om informatie mee te nemen door de tijd

Zonder preserveringsstrategie is een organisatie niet in staat om een levensvatbaar preserveringsproces in te richten voor het duurzaam behoud van de digitale collecties. Permanente technologische veranderingen van bestandsformaten, hardware en software vereisen doordachte maatregelen om informatieobjecten authentiek, begrijpelijk en blijvend toegankelijk te houden.

Bitpreservering
Het allereerste preserveringsniveau is bitpreservering: zorgen dat de volgorde van nullen en enen intact blijft. Bitpreservering omvat:

  • het onderhouden van on-site and off-site back-ups;
  • het regelmatig uitvoeren van een viruscheck;
  • het tijdig verversen van opslagmedia;
  • het regelmatig checken van de integriteit van de digitale objecten.

Een manier om te checken of een bestand onveranderd is ten opzichte van zijn originele staat, is het achterhalen van de zogeheten digitale handtekening van het digitale object met een zogeheten checksumchecker. Je checkt dan de volgorde van nullen en enen op de digitale drager: dat heet ook wel een fixity check. Idealiter wordt een informatiepakketje bij een archief aangeleverd mét een checksumwaarde. Als je op gezette tijdstippen in de levenscyclus van een digitaal object een checksum bepaalt, dan kun je die waarde vergelijken met de oorspronkelijke waarde. Mocht de volgorde van nullen en enen dan onbedoeld veranderd zijn, dan kun je het bestand vervangen door een back-up.

Checksum algoritmes

Er zijn verschillende checksum algoritmes zoals MD5 en SHA (Secure Hash Algorithm) waarmee je de checksum kunt checken. Een verschil is dat SHA een langere checksumcode genereert dan MD5. Hoe ‘sterker’ het algoritme, des te moeilijker het is om een bestand met opzet te veranderen op een manier die niet wordt ontdekt. Als je aanwijzingen hebt dat je bestanden moedwillig beschadigd zouden kunnen worden (bijvoorbeeld omdat je bestand in rechtszaken gebruikt wordt) dan gebruik je het beste een sterk algoritme. Als checksums worden gebruikt om verlies of beschadiging van bestanden op te sporen als gevolg van een fout tijdens het opslaan dan is MD5 voldoende.

In de keuzeopdrachten kun je ook zelf oefenen met het genereren van een checksum.

Bitpreservering vormt de basis voor duurzame toegankelijkheid, omdat het zorgt voor de instandhouding van het digitale object. Er is echter meer nodig om ook het informatieobject en de representatie-informatie in stand te houden, zodat die langdurig bruikbaar en authentiek blijft.

Functionele preservering
Functionele preservering wordt ook wel content preservering of logische preservering genoemd. Het zorgt ervoor dat informatieobjecten op de lange termijn authentiek en bruikbaar blijven. Functionele preservering omvat verschillende preserveringsstrategieën zoals migratie, emulatie, converteren en normaliseren. Andere mogelijke strategieën zijn afdrukken op papier, de originele software en hardware bewaren en herinterpretatie.
In onderstaand filmpje komt een aantal van de bovengenoemde strategieën aan bod.

Elke strategie heeft gevolgen voor het behoud van de essentiële kenmerken en voor de expertise, voorzieningen en middelen die nodig zijn. Migratie en normalisatie kunnen bijvoorbeeld leiden tot veranderingen in structuur, vorm en gedrag van digitale objecten en voor emuleren is veel expertise en een complexe infrastructuur nodig.

Omkeerbare en onomkeerbare migratie

Er bestaan omkeerbare en niet-omkeerbare migraties. Vergelijk een niet-omkeerbare migratie met het koken van een ei: een gekookt ei wordt nooit meer een rauw ei. Een omkeerbare migratie kun je vergelijken met de overgang van ijs naar water en weer terug. De migratie is – onder de juiste omstandigheden – ongedaan te maken.

In de wereld van digitale objecten is een omkeerbare migratie bijvoorbeeld het omzetten van een ASCII-tekst naar een UTF-8- tekst: dat is een een-op-een-transformatie die je ook kunt terugdraaien. Als je een TIFF-file omzet naar een JPEG 2000-file kun je niet zonder meer terug zonder informatie te verliezen. In dit geval is er sprake van een niet-omkeerbare migratie en is er geen een-op-een-relatie meer tussen de volgorde van nullen en enen in het origineel en de afgeleide. Als je ongewenst informatieverlies wilt voorkomen is het van belang dat je je verdiept in de ‘Transformation Information Properties’ van de bestanden die je opneemt in je archief.

Ongewild informatieverlies voorkomen

Het kan ook gebeuren dat je zelf ongewild de integriteit van een bestand verandert. Een van de geboden om dat te voorkomen luidt als volgt:

Gij zult een bestand niet openen voordat u een kopie heeft gemaakt”

Bij het openen van bestanden ontstaat feitelijk een nieuwe kopie van het bestand en kunnen er veranderingen in documentinstellingen en -inhoud optreden. Daarom mag je alleen kopieën van bestanden openen, omdat je anders ongewild de authenticiteit en integriteit aan kunt tasten. Dat betekent bijvoorbeeld ook dat je de foto’s die op een geheugenkaartje staan niet mag draaien van landscape naar portrait of andersom voordat je de bestanden hebt gekopieerd. Bij het roteren van een bestand kan de volgorde van nullen en enen namelijk ook veranderen, waardoor het bestand onleesbaar kan worden.

Het jargon

Checksum


Fixity (vastheid) gaat over de garantie dat een digitaal object onveranderd is en dat de integriteit in tact is. Zo’n check voer je uit met een zogeheten checksum checker en na het checken volgt er een controlegetal (de checksum).

Idealiter wordt een informatiepakketje bij een archief aangeleverd mét een checksumwaarde. Als je op gezette tijdstippen in de levenscyclus van een digitaal object een checksum bepaalt, dan kun je die waarde vergelijken met de oorspronkelijke waarde. Mocht de volgorde van nullen en enen dan onbedoeld veranderd zijn, dan kun je het bestan

Converteren


Converteren is het omzetten naar een hogere versie van hetzelfde bestandsformaat.

Migreren


Migreren is het overzetten naar een ander media- of bestandsformaat. Media-migratie is het overzetten van bestanden naar een andere drager en formaat-migratie is het overzetten naar een ander bestandsformaat.

Normaliseren


Normaliseren is de omzetting naar een bestandsformaat dat duurzamer wordt geacht binnen het duurzaamheidsbeleid en de preserveringsstrategie van een organisatie.

Emulatie/Virtualisatie


Duurzaamheidsstrategie gericht op het behoud van digitale bronnen zoals ze oorspronkelijk zijn vervaardigd en gebruikt. Door emulatietechnieken toe te passen wordt het mogelijk het gedrag van een verouderde computer na te bootsen op een andere (nieuwere) computer. Emulatie kan op vier aspecten van een computer van toepassing zijn: de hardware, het besturingssysteem, de bijbehorende software en de digitale objecten die met die software zijn vervaardigd.

Herinterpretatie


Het opnieuw installeren, uitvoeren of reconstrueren van een werk (mede op basis van documentatie) en het bewaren van de oorspronkelijke beleving. Dit wordt toegepast door LiMa.

Meer weten?

Comments

  1. Joost Salverda

    UNECO kent het op het gebied van software sustainability het project PERSIST. Hier wordt naar ik heb begrepen onder andere gesproken met grote softwareproducenten over het openstellen van het gebruik van (inmiddels verouderde) software.

Deze website gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie-gegevens worden verwerkt.