paragraaf

Preserveringssoftware kiezen

paragraaf Progress:

Archieven, bibliotheken en musea gebruiken al jaren database systemen om hun collecties (boeken, archiefstukken, objecten) te registreren. In de bibliotheekwereld noemen ze dit een catalogus, de archieven hebben documentmanagementsystemen en musea beschikken over collectieregistratiesystemen. Een ding hebben ze gemeen, het zijn géén digitale archieven, geen preserveringssystemen. Ze bewaren namelijk niet perse de (digitale) objecten zélf, maar vertellen ons vooral dát we ze hebben. Ook zorgen ze er niet voor dat de digitale objecten die ze beheren duurzaam in stand blijven.

Een preserveringssysteem (e-depot, trusted digital repository) is een systeem dat ervoor zorgt dat digitale informatie integer, betrouwbaar, bruikbaar en voor de lange termijn beschikbaar en toegankelijk wordt gehouden. Denk aan het bewaren van je digitale objecten, registreren van de kenmerken ervan, beheren en uitvoeren van je preserveringsstrategieën, etc. Wil je werk maken van duurzame toegang dan is een preserveringssysteem dus een noodzakelijke aanvulling op je collectiebeheerssysteem. Ook het gegeven dat steeds diverser digitaal materiaal de archieven van erfgoedinstellingen binnenstroomt maakt de keuze voor een preserveringssysteem – met geautomatische verwerking – noodzakelijk.

In deze paragraaf vind je twee cases waarbij organisaties keuzes hebben gemaakt voor zo’n preserveringssysteem.

Vergelijkend warenonderzoek IISG

Het Internationaal Instituut voor Sociale Geschiedenis (IISG) heeft in februari 2017 besloten om Archivematica te gaan gebruiken. Dit is een applicatie die speciaal is gebouwd om een OAIS-conforme levenscyclus van digitale objecten te ondersteunen.

De collecties van IISG omvatten archief-, bibliotheek- en audiovisueel materiaal met de nadruk op sociale en emancipatorische bewegingen. Het Instituut beheert meer dan 4.000 archieven, bezit meer dan een miljoen boeken en tijdschriften en ongeveer evenveel items in de afdeling Beeld en Geluid, waaronder posters. De collectievorming van het IISG richt zich in toenemende mate op digitale archieven en onderzoeksdata. Het instituut is op het terrein van de sociaaleconomische geschiedenis een van de grootste datacentra ter wereld.

Na een voortraject waarin een flink aantal softwarepakketten werd vergeleken, ging de keuze uiteindelijk tussen Archivematica en Preservica. Feitelijk zijn deze twee pakketten softwarepakketten waarin andere softwaretools zijn geïntegreerd (als zogenaamde microservices). Denk aan tools voor bestandsformaatidentificatie (zoals Jhove en DROID), virusscanning, normalisering en het maken van SIP’s, AIP’s en DIP’s. Om de keuze tussen tussen Preservica en Archivematica goed te maken, heeft het IISG een uitgebreid vergelijkend warenonderzoek gedaan. In de onderstaande tabel zie je een selectie van de punten waarop de software met elkaar is vergeleken.

 Archivematica
 preservica
URL https://www.archivematica.org/en/ http://preservica.com/
Open source ja nee
Gebruiksvriendelijkheid relatief intuïtief relatief intuïtief
Taal waarin applicatie is geschreven  Python  Java
Workflows Gepersonaliseerde workflows Gaat uit van standaard workflows die naar wens kunnen worden aangepast
Pre-ingest functionaliteiten  ja nee
Kwaliteit van documentatie niet altijd even goed vindbaar uitgebreid en up-to-date
Preserveringsmetadata ondersteunt METS eigen XML
Gebruikers in de nabijheid Regionaal Archief Tilburg Nationaal Archief en een aantal RHC’s (Regionaal Historisch Centrum)
Onderzoeksdata standaard dataverse-ondersteuning geen standaard dataverse-ondersteuning
Stabiliteit grote, levendige community gezond bedrijf met grote klantenkring
Tip voor het vergelijken van software

Ga je ook een traject in waarbij je een bepaalde software-oplossing gaat kiezen? Volg dan dé tip van Robert Gillesse, digitale archivaris bij IISG: “De ultieme oplossing bestaat niet”.

De Brabant Cloud

De Brabant Cloud is een mooi voorbeeld van een oplossing-op-maat waarbij het collectiebeheersysteeem is gekoppeld aan een preserveringssysteem.

Brabant Cloud ontsluit alle erfgoedinformatie die nu nog vaak zit opgesloten in versnipperde, lokale database-systemen van de verschillende heemkundekringen, musea, archieven en bibliotheken die Brabant rijk is. Sinds de lancering in 2012 zijn er 35 instellingen aangesloten. Er is een verdienmodel waarbij deelnemende instellingen een bescheiden bijdrage betalen, zodat het project niet alleen van subsidies afhangt.

De Brabant Cloud is een duurzaam erfgoedplatform gebouwd op open source standaarden. Het platform is een doorontwikkeling van Thuis in Brabant, maar dat platform werd gekenmerkt door te weinig openheid. Ze zaten indertijd nog vast aan één leverancier met een gesloten infrastructuur. De Memorix applicatie waarbinnen de Brabant Cloud draait is de onderliggende infrastructuur laag waarbinnen:

• collectiebeheer voor de deelnemende instellingen mogelijk is;
• gedigitaliseerd materiaal kan worden opgenomen en beheerd;
• digitaal geboren objecten kunnen worden opgenomen;
• publicatie binnen platforms als Thuis in Brabant, DiMCon en Europeana mogelijk is.

Brabant Cloud biedt voor kleinere instellingen een mooie manier om hun collectie te presenteren. De stappen die de instellingen doorlopen van opnemen via beschrijven naar beschikbaar stellen zijn eenvoudig en duidelijk.

Meer weten?
  • Neem een kijkje bij de POWRR Tool Grid v2, een reeks interactieve overzichten van tools die bijdragen aan duurzame toegang. De Tool grid is ontworpen om de praktijkbeoefenaar te helpen bij het identificeren en selecteren van geschikte oplossingen.
  • Bekijk het rapport ‘The use of preservation tools amongst Dutch Heritage Institutions‘ (pdf, april 2020). In dit rapport zijn behoeften en hiaten in het gebruik van tools voor (pre)ingest in kaart gebracht. De tools waarmee archiefinstellingen ten tijde van het onderzoek aan het experimenteren waren, staan hieronder. Hoeveel herken je er?Overzicht van tools die worden onderzocht binnen instellingen voor digitaal erfgoed

Comments

  1. Reem Weda

    Hier een voorbeeld van een organisatie (Wellcome Collection) die zelf een open-source software in the cloud oplossing ontwikkelde. https://stacks.wellcomecollection.org/building-wellcome-collections-new-archival-storage-service-3f68ff21927e
    Een aantal interessante elementen vond ik: vraagstuk van eigenaarschap, leesbare paden en identifiers ipv ‘ proprietary UIID’s voor bestanden; het open source BagIt packaging format. De cloudopslag zelf is wel via Amazon op 2 locaties, maar ze willen nóg een versie via Microsoft’s Azure data centre in Amsterdam opslaan.

  2. Joost Salverda

    De tabel van het IISg performt niet goed op de Ipad. Ik denk hier te lezen dat er staat dat ‘een aantal’ RHC’s Preservica gebruikt, maar feitelijk is het zo dat de RHC’s in alle provinciehoofdsteden de e-Depotoplossing van het Nationaal Archief inzetten voor minimaal hun rijkscolllectie. Dat is absoluut niet hetzelfde als Preservica afnemen bij de leverancier..

  3. Joost Salverda

    Wat de Brabant-cloud aangaat: Memorix is ook een leveranciersoplossing (Picturae); kan iemand me vertellen in hoeverre die opener is dan de oude oplossing (ook leveranciersafhankelijk, gesloten)? Wordt er bv (meer) gebruikt gemaakt van open standaarden?

  4. Joost Salverda

    Een essentieel kwaliteitskenmerk van archiefstukken is, naast bruikbaarheid, betrouwbaarheid en toegankelijkheid (leesbaarheid, vindbaarheid) ook de authenticiteit (dat je kunt vaststellen het is wat het zegt te zijn). Deel daarvan is dat je het stuk ook kunt relateren aan zijn ontstaans- en beheercontext.

Deze website gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie-gegevens worden verwerkt.