om in de testbeds experimenten te kunnen uitvoeren. Voorbeelden zijn: characteri
sation tools, zoals FIDO voor het identificeren en valideren van bestandsformaten,
ondersteuning van het beslissingsproces om te komen tot een goede bewaarstrategie
voor een bepaald type digitale objecten (preservation planning).
Identificatie en validatie van bestandsformaten
Een ander thema was 'hoe ga je om met de vele verschillende bestandsformaten?'
Een belangrijke rol in dit alles speelt een register van bestandsformaten. The
National Archives (TNA, VK) heeft zo'n register aangelegd, PRONOM genaamd.
Pogingen om tot één globaal register te komen, zoals het Unified Digital Format
Registry (UDFR, University of California Curation Centre) en Global Digital Format
Registry (GDFR, Harvard University) zijn op niets uitgelopen.48 Het gevolg is dat
PRONOM nu die rol vervult.49 In nauwe samenhang hiermee speelt het karakterise
ren en valideren van de gebruikte bestandsformaten bij informatie die in e-depots
wordt opgenomen. Hiervoor zijn door verschillende organisaties softwarehulp-
middelen ontwikkeld zoals DROID (TNA), of JHOVE (Harvard), Jpylyzer (SCAPE
project) en FIDO (Planets project).50
Metadata
Welke metadata51 zijn nodig en met welke beschrijvingsstructuren? Het gaat om
informatie met betrekking tot het beheer, de context (ontstaan, betrokkenen, in
welk proces enz.), de structuur en de inhoud van digitale archiefbescheiden, dan wel
objecten. Vanuit verschillende invalshoeken, disciplines als ook landen werden
metadata sets voor de digitale omgeving ontwikkeld. Zo werd bijvoorbeeld voor de
web-omgeving Dublin Core (DCMI) en voor 'digital preservation' PREMIS (preser
vation metadata, gebaseerd op OAIS) ontwikkeld.52 Het ging in het laatste geval
vooral om gegevens over aspecten als 'provenance, fixity, significant properties, techni
cal specifications and current activity', begrippen in het OAIS-model.
In de wereld van recordkeeping (incl. archieven) werden onder de vlag van ISO, door
TC46/SC11, eveneens standaarden op dit gebied ontwikkeld, maar dan meer gericht
op de onderliggende principes en concepten dan op het vaststellen van metadata
sets.53 Naast informatie over structuur, verschijningsvorm en technische gegevens,
gaat het dan om informatie over de inhoud en context (waarom, waar, wanneer,
door wie). Tenslotte is de informatie over het beheer van digitale archiefbescheiden
essentieel om vast te kunnen stellen wat er gebeurd is sinds de creatie. Zoals aangege
ven dienen metadata onverbrekelijk met de informatie (zoals publicaties of archief-
bescheiden) verbonden te zijn. Bovendien zijn metadata niet statisch, maar zullen
gedurende het bestaan van digitale objecten metadata toegevoegd blijven worden.
Een manier om metadata met de informatie vast te leggen is inkapseling ('encapsu
lation'). Een voorbeeld is de zgn. VEO (VERS encapsulated object) die door het
Public Records Office van Victoria (PROV, Australië) is ontwikkeld.54
De grootste uitdaging zit hem in het feit dat deze metadata veelal los van de eigen
lijke informatie/documenten staan, vaak systeemgebonden zijn en in talloze forma
ten en samenstellingen voorkomen. Elke (overheids)organisatie heeft zijn eigen
invulling daarvan. Voor een goed beheer in een depot moeten deze echter tot een
bepaalde voor het depot geldende (in de regel 'open') standaard kunnen worden
getransformeerd en dat blijkt ingewikkeld.
Unieke identificatie
Hoe kun je in een virtuele, 'onbegrensde' omgeving 'informatie-eenheden' (docu
menten, datasets e.d.) uniek identificeren? Een onderdeel daarvan was ook de zgn.
persistent identifier (PID), een uniek kenmerk, waarmee digitale objecten (blijvend)
kunnen worden geïdentificeerd. Verschillende systemen zijn daarvoor ontwikkeld,
zoals Digital Object Identifier (DOI) of OpenURL.55
Migratie tussen systemen
Hoe migreer je informatie tussen verschillende systemen? Een project op dit terrein
was het Australische CRKM project (2003-2006) dat informatie uitwisseling tussen
informatiesystemen heeft onderzocht.56 Doel was de ontwikkeling van een model
op basis waarvan door slim gebruik van metadata digitale informatie toegankelijk,
bruikbaar en authentiek kan worden gehouden zo lang als nodig is. Migratie tussen
systemen, vaak met verschillende metadataschema's is daarbij een belangrijk aan
dachtspunt. Om dat te ondervangen en te vergemakkelijken zou gebruik gemaakt
moeten worden van metadata schema registers, en een 'metadata broker' waarin
de verschillende schema's met elkaar 'gematcht' zijn of worden. Daarmee wordt
uitwisseling mogelijk gemaakt. Het in standhouden van digitale informatie vraagt
sowieso steeds migratie ervan tussen systemen met al dan niet nieuwere technolo
gie. Veelal gaat dat ook gepaard met conversie naar een ander bestandsformaat.
Migratie van informatie kan bijvoorbeeld plaatsvinden van uit het oorspronkelijke
systeem naar een e-depot, maar ook vanuit Word-omgeving naar een DMS (docu
mentmanagementsysteem) dan wel RMS (recordmanagementsysteem) en vandaar
naar e-depot en vervolgens tussen e-depots. Belangrijk probleem hierbij is vaak het
exporteren van de metadata uit systemen en het gebrek aan standaardisatie ervan.
hoofdstuk 1
48 Hierbij was o.a. het PLANETS project betrokken.
49 Zie http://www.udfr.org als ook http://udfr.org/project/UDFR-final-report.pdf en https://library.harvard.
edu/preservation/digital-preservation_gdfr.html
50 Zie https: //www.nationalarchives.gov.uk/PRONOM/Default.aspx. Andere herkennings/validatiesoftware-
hulpmiddelen zijn o.a JHOVE (https://github.com/openpreserve/jhove/releases/tag/v1.20.!
FIDO (http://openpreservation.org/technology/products/fido/ en Jpylyzer (http://openpreservation.org/
technology/products/jpylyzer/
51 De term metadata komt op gelijk met de ontwikkeling van informatiesystemen. In de archivistiek werd dit
gevangen onder de noemer van beschrijven of toegankelijk maken. Het omschrijft of duidt kort gezegd
andere informatie. Vooral bij uitwisseling van informatie tussen systemen, maar ook bij het beschikbaar
stellen ervan zijn deze metadata van belang, omdat die informatie dan betekenis krijgt. Het is vergelijkbaar
met bijv. een formulier waarin de velden nader worden aangeduid met een term of omschrijving. Een getal op
zich zegt niet zoveel, maar als er 'jaartal' voor staat krijgt het betekenis. Zonder die metadata zou het bijv.
moeilijk zo niet onmogelijk zijn om de digitale informatie te begrijpen, te zoeken of te beheren. Zij maken
onverbrekelijk deel uit van die digitale informatie.
30
hans hofman een wereld van verschil?
52 Zie voor DCMI http://dublincore.org en voor PREMIS: https://www.loc.gov/standards/premis/. Voor enige
geschiedenis, zie o.a.: http://www.dcc.ac.uk/sites/default/files/documents/resource/curation-manual/
chapters/preservation-metadata/preservation-metadata.pdf. Voor PREMIS zie ook: https://www.dpconline.
org/handbook/organisational-activities/metadata-and-documentation
53 Dat is de serie onder nr. ISO 23081 Metadata for records, waarvan de eerste in 2004 werd gepubliceerd.
54 Zie https: //www.prov.vic.gov.au/recordkeeping-government/a-z-topics/vers. Een ander voorbeeld is METS:
https: //www.loc.gov/standards/mets/ dat de structuur van een uitwisselingscontainer defineert. Weer een
andere methode is die van zgn. 'self documenting objects', waarbij bij elke handeling met het digitale object
(of record) de informatie erover 'automatisch' wordt vastgelegd.
55 Zie bijv.: http://www.ncdd.nl/pid/ voor een korte inleiding en http: //www.ncdd.nl/projecten/netwerk-
digitaal-erfgoed/project-persistent-identifiers/. Als ook: https: //www.oclc.org/research/publications/2017/
oclcresearch-convenience-compliance-rim-europe.html
56 Zie https: //www.monash.edu/it/our-research/research-centres-and-labs/cosi/projects/past-projects/crkm
31