om in de testbeds experimenten te kunnen uitvoeren. Voorbeelden zijn: characteri sation tools, zoals FIDO voor het identificeren en valideren van bestandsformaten, ondersteuning van het beslissingsproces om te komen tot een goede bewaarstrategie voor een bepaald type digitale objecten (preservation planning). Identificatie en validatie van bestandsformaten Een ander thema was 'hoe ga je om met de vele verschillende bestandsformaten?' Een belangrijke rol in dit alles speelt een register van bestandsformaten. The National Archives (TNA, VK) heeft zo'n register aangelegd, PRONOM genaamd. Pogingen om tot één globaal register te komen, zoals het Unified Digital Format Registry (UDFR, University of California Curation Centre) en Global Digital Format Registry (GDFR, Harvard University) zijn op niets uitgelopen.48 Het gevolg is dat PRONOM nu die rol vervult.49 In nauwe samenhang hiermee speelt het karakterise ren en valideren van de gebruikte bestandsformaten bij informatie die in e-depots wordt opgenomen. Hiervoor zijn door verschillende organisaties softwarehulp- middelen ontwikkeld zoals DROID (TNA), of JHOVE (Harvard), Jpylyzer (SCAPE project) en FIDO (Planets project).50 Metadata Welke metadata51 zijn nodig en met welke beschrijvingsstructuren? Het gaat om informatie met betrekking tot het beheer, de context (ontstaan, betrokkenen, in welk proces enz.), de structuur en de inhoud van digitale archiefbescheiden, dan wel objecten. Vanuit verschillende invalshoeken, disciplines als ook landen werden metadata sets voor de digitale omgeving ontwikkeld. Zo werd bijvoorbeeld voor de web-omgeving Dublin Core (DCMI) en voor 'digital preservation' PREMIS (preser vation metadata, gebaseerd op OAIS) ontwikkeld.52 Het ging in het laatste geval vooral om gegevens over aspecten als 'provenance, fixity, significant properties, techni cal specifications and current activity', begrippen in het OAIS-model. In de wereld van recordkeeping (incl. archieven) werden onder de vlag van ISO, door TC46/SC11, eveneens standaarden op dit gebied ontwikkeld, maar dan meer gericht op de onderliggende principes en concepten dan op het vaststellen van metadata sets.53 Naast informatie over structuur, verschijningsvorm en technische gegevens, gaat het dan om informatie over de inhoud en context (waarom, waar, wanneer, door wie). Tenslotte is de informatie over het beheer van digitale archiefbescheiden essentieel om vast te kunnen stellen wat er gebeurd is sinds de creatie. Zoals aangege ven dienen metadata onverbrekelijk met de informatie (zoals publicaties of archief- bescheiden) verbonden te zijn. Bovendien zijn metadata niet statisch, maar zullen gedurende het bestaan van digitale objecten metadata toegevoegd blijven worden. Een manier om metadata met de informatie vast te leggen is inkapseling ('encapsu lation'). Een voorbeeld is de zgn. VEO (VERS encapsulated object) die door het Public Records Office van Victoria (PROV, Australië) is ontwikkeld.54 De grootste uitdaging zit hem in het feit dat deze metadata veelal los van de eigen lijke informatie/documenten staan, vaak systeemgebonden zijn en in talloze forma ten en samenstellingen voorkomen. Elke (overheids)organisatie heeft zijn eigen invulling daarvan. Voor een goed beheer in een depot moeten deze echter tot een bepaalde voor het depot geldende (in de regel 'open') standaard kunnen worden getransformeerd en dat blijkt ingewikkeld. Unieke identificatie Hoe kun je in een virtuele, 'onbegrensde' omgeving 'informatie-eenheden' (docu menten, datasets e.d.) uniek identificeren? Een onderdeel daarvan was ook de zgn. persistent identifier (PID), een uniek kenmerk, waarmee digitale objecten (blijvend) kunnen worden geïdentificeerd. Verschillende systemen zijn daarvoor ontwikkeld, zoals Digital Object Identifier (DOI) of OpenURL.55 Migratie tussen systemen Hoe migreer je informatie tussen verschillende systemen? Een project op dit terrein was het Australische CRKM project (2003-2006) dat informatie uitwisseling tussen informatiesystemen heeft onderzocht.56 Doel was de ontwikkeling van een model op basis waarvan door slim gebruik van metadata digitale informatie toegankelijk, bruikbaar en authentiek kan worden gehouden zo lang als nodig is. Migratie tussen systemen, vaak met verschillende metadataschema's is daarbij een belangrijk aan dachtspunt. Om dat te ondervangen en te vergemakkelijken zou gebruik gemaakt moeten worden van metadata schema registers, en een 'metadata broker' waarin de verschillende schema's met elkaar 'gematcht' zijn of worden. Daarmee wordt uitwisseling mogelijk gemaakt. Het in standhouden van digitale informatie vraagt sowieso steeds migratie ervan tussen systemen met al dan niet nieuwere technolo gie. Veelal gaat dat ook gepaard met conversie naar een ander bestandsformaat. Migratie van informatie kan bijvoorbeeld plaatsvinden van uit het oorspronkelijke systeem naar een e-depot, maar ook vanuit Word-omgeving naar een DMS (docu mentmanagementsysteem) dan wel RMS (recordmanagementsysteem) en vandaar naar e-depot en vervolgens tussen e-depots. Belangrijk probleem hierbij is vaak het exporteren van de metadata uit systemen en het gebrek aan standaardisatie ervan. hoofdstuk 1 48 Hierbij was o.a. het PLANETS project betrokken. 49 Zie http://www.udfr.org als ook http://udfr.org/project/UDFR-final-report.pdf en https://library.harvard. edu/preservation/digital-preservation_gdfr.html 50 Zie https: //www.nationalarchives.gov.uk/PRONOM/Default.aspx. Andere herkennings/validatiesoftware- hulpmiddelen zijn o.a JHOVE (https://github.com/openpreserve/jhove/releases/tag/v1.20.! FIDO (http://openpreservation.org/technology/products/fido/ en Jpylyzer (http://openpreservation.org/ technology/products/jpylyzer/ 51 De term metadata komt op gelijk met de ontwikkeling van informatiesystemen. In de archivistiek werd dit gevangen onder de noemer van beschrijven of toegankelijk maken. Het omschrijft of duidt kort gezegd andere informatie. Vooral bij uitwisseling van informatie tussen systemen, maar ook bij het beschikbaar stellen ervan zijn deze metadata van belang, omdat die informatie dan betekenis krijgt. Het is vergelijkbaar met bijv. een formulier waarin de velden nader worden aangeduid met een term of omschrijving. Een getal op zich zegt niet zoveel, maar als er 'jaartal' voor staat krijgt het betekenis. Zonder die metadata zou het bijv. moeilijk zo niet onmogelijk zijn om de digitale informatie te begrijpen, te zoeken of te beheren. Zij maken onverbrekelijk deel uit van die digitale informatie. 30 hans hofman een wereld van verschil? 52 Zie voor DCMI http://dublincore.org en voor PREMIS: https://www.loc.gov/standards/premis/. Voor enige geschiedenis, zie o.a.: http://www.dcc.ac.uk/sites/default/files/documents/resource/curation-manual/ chapters/preservation-metadata/preservation-metadata.pdf. Voor PREMIS zie ook: https://www.dpconline. org/handbook/organisational-activities/metadata-and-documentation 53 Dat is de serie onder nr. ISO 23081 Metadata for records, waarvan de eerste in 2004 werd gepubliceerd. 54 Zie https: //www.prov.vic.gov.au/recordkeeping-government/a-z-topics/vers. Een ander voorbeeld is METS: https: //www.loc.gov/standards/mets/ dat de structuur van een uitwisselingscontainer defineert. Weer een andere methode is die van zgn. 'self documenting objects', waarbij bij elke handeling met het digitale object (of record) de informatie erover 'automatisch' wordt vastgelegd. 55 Zie bijv.: http://www.ncdd.nl/pid/ voor een korte inleiding en http: //www.ncdd.nl/projecten/netwerk- digitaal-erfgoed/project-persistent-identifiers/. Als ook: https: //www.oclc.org/research/publications/2017/ oclcresearch-convenience-compliance-rim-europe.html 56 Zie https: //www.monash.edu/it/our-research/research-centres-and-labs/cosi/projects/past-projects/crkm 31

Periodiekviewer Koninklijke Vereniging van Archivarissen

Jaarboeken Stichting Archiefpublicaties | 2018 | | pagina 16