Koninklijke Bibliotheek ontwikkelt Depot van NederlandseElektronische Publicaties 33 digitale archivering digitale archivering In 1974 begon de KB met het Depot van Nederlandse Publicaties en ruim 99 procent van alle boeken, tijdschriften en kranten van erkende uitgevers is nu aanwezig in de KB en kan door alle geregistreerde gebruikers van de KB geraadpleegd worden. De dekkingsgraad van de 'grijze litera tuur' (publicaties zonder ISBN-nummer) van overheidsinstellingen, universiteiten etc. is zo'n 70 procent. Nederland heeft geen depotwet en het is opmerkelijk dat de dekkingsgraden in Nederland hoger zijn dan in veel landen die wel een depotwet hebben. Wereldwijd zijn nationale bibliotheken begonnen met het verzamelen van elektronische publicaties op vrijwillige basis, omdat een wijziging van de depotwet een aantal jaren in beslag neemt. Immers, men realiseerde zich dat dit digitale materiaal voor toekomstige generaties raadpleegbaar moet zijn, net zoals het analoge materiaal. Dit was ook het geval in de KB. Vanaf 1980 kwamen boeken binnen met een begeleidende diskette en later cd-rom. De publi catie werd zoals gebruikelijk beschreven volgens de ISBD-regels voor titelbeschrijving en duur zaam opgeslagen in de magazijnen. Gaandeweg verschenen steeds meer cd-rom's en diskettes als zelfstandige publicaties en het werd duidelijk dat nieuwe publicatievormen ontstonden. Deze nieu we elektronische publicaties bleken kwetsbaar te zijn en dat werd benadrukt met de opkomst van het internet en het world wide web. De problematiek van digitale archivering en digitale duurzaamheid heeft verschillende aspec ten. De dragers hebben een beperkte levensduur. De verwachte levensduur van een cd-rom varieert nu van zo'n 25 tot ruim 100 jaar, afhan kelijk van de materiaalsamenstelling en bewaar omstandigheden zoals hygiëne, luchtvochtig heid en temperatuur. Tapes moeten om de paar jaar ververst worden en ook de verwachte levens duur van diskettes is beperkt. In de Verenigde Staten zijn bijvoorbeeld tapes van de NASA en tapes met demografische gegevens uit 1973 onherstelbaar beschadigd. Digitale gegevens zijn ook kwetsbaar, omdat computers en toepassings programmatuur zo snel verouderen. Wie heeft er nog een Commodore 64 en wie gebruikt nog Wordstar als tekstverwerker? Bestandsformaten en standaarden volgen elkaar op en internetpu blicaties zijn al helemaal vluchtig. Een publicatie staat er de ene dag, maar morgen ook? En is de versie die men dan raadpleegt wel dezelfde als die van gisteren? Digitale archivering is een inge wikkeld vraagstuk dat nog niet is opgelost. Wel is het zo dat steeds meer mensen zich realiseren dat digitaal materiaal kwetsbaar is. De bewustwor ding bij bedrijven, met name banken, en bij archiefbeherende instellingen zoals archieven, bibliotheken, musea en overheidsinstellingen is de laatste jaren sterk toegenomen. In 1995 besloot de directie van de KB, in samenspraak met het Nederlands Bibliografisch Centrum, de selectiecriteria voor het depot uit te breiden met elektronische publicaties en te gaan onderzoeken hoe een Depot van Nederlandse Elektronische Publicaties opgebouwd kon wor den. Een projectgroep coördineerde de onder zoeksactiviteiten. In 1998 verscheen een rapport met de verwachte groei van het aantal publica ties, selectiecriteria, voorlopige regels voor beschrijving van elektronische publicaties, een plan voor een opslagsysteem en de stand van zaken van het auteursrecht in Nederland. Vervolgens werd geëxperimenteerd met het 'oogsten' van zo'n honderd websites. De werk processen van het DNEP werden in grote lijnen gedefinieerd. Het was een nuttig eerste resultaat, maar tegelijkertijd bleek dat een goede methode voor digitale archivering die op lange termijn toegang geeft tot authentieke, integere publica ties nog in de kinderschoenen stond. In het kader van het Actieplan voor de Elektronische Snelweg werden veel elektronische publicaties aangeschaft. DONOR (Directory Of Netherlands Online Resources) leverde een eerste plan voor 'preservation metadata'. Bijvoorbeeld velden voor de registratie van besturingssysteem, bestandsformaat en toepassingsprogrammatuur. Cerberus stelde zich de vraag hoe we kunnen garanderen dat gebruikers in de verre toekomst er zeker van kunnen zijn dat de documenten die zij inzien integer en authentiek zijn. En wat is de beste methode om gegevens toegankelijk te hou den? Moet men voortdurend migreren van de ene omgeving en drager naar de andere of kan men emuleren, waarbij men de publicatie niet verandert, maar op een nieuwe computer de oude computer wordt gesimuleerd? Het is bekend dat emulatoren werken, want men kan bijvoorbeeld oude spelletjes op de nieuwste com puters spelen. De meeste emulatoren zijn ont wikkeld voor de grote markt van consumenten programma's. Maar werkt emulatie ook voor de heterogene publicaties die nationale bibliothe ken ontvangen? Beantwoording van deze vragen bleek te ambitieus binnen het kader van Cerberus, maar maakt nu deel uit van het onder zoek voor het digitale archief van de KB. Het Europese project BIBLINK ontwikkelde software waarmee uitgevers 'Dublin Core metadata' kun nen uitwisselen met nationale bibliotheken. NEDLIB leverde een reeks publicaties op, waar onder een procesmodel en richtlijnen voor de bouw van een digitaal archief. De KB had inmid dels contacten gelegd met een groot aantal instellingen, nationaal en internationaal, die bezig waren met dezelfde problematiek en parti cipeert in een initiatief van de National Library of Australia, PADI: Preserving Access to Digital Information. De PADI-website biedt een goed overzicht van de stand van zaken op het gebied van digitale archivering. In de periode 1996 tot 1998 testte de KB de systemen Right Pages van AT&T, ICL Commands van Sinet en IBM Digital Library voor de opslag van elektronische tijdschriften. Vanaf 1998 is IBM-DL ontwikkeld tot een digitaal magazijn voor de elektronische tijdschriften van Elsevier en Kluwer en ook overheidspublicaties van SDU Opmaat worden hierin bewaard. Tevens is IBM- DL de opslagruimte voor de images van digitalise ringsprojecten van de KB zoals de middeleeuwse verluchte handschriften en gedigitaliseerde pam fletten, prenten, penningen en objecten. Dit pro ject, Digitale Atlas Geschiedenis, is een samen werking tussen het Rijksmuseum in Amsterdam en de KB, waarbij diverse documenttypen in een website over de zeventiende eeuw bijeen worden gebracht. Het betreft bijvoorbeeld bestanden in tiff, jpeg, sid (inzoom) en gif. Het digitale maga zijn IBM-DL biedt nog geen mogelijkheden voor toegankelijkheid op de lange termijn. In 1999 stuurde de KB een 'request for informa tion' naar bedrijven, die hun interesse konden tonen voor de bouw van het digitale archief. Vervolgens kwam er een Europese Aanbesteding en uiteindelijk is IBM Nederland geselecteerd voor de bouw van het echte digitale archief van de KB, het Depot van Nederlandse Elektronische Publicaties. Het project is bijzonder vanwege de grote hoe- veelheid gegevens die opgeslagen moet worden en omdat digitale duurzaamheid van de elektro nische bestanden in het systeem geïntegreerd moet zijn. Er bestaat immers nog nergens een systeem dat digitale duurzaamheid kan garande ren. De realisatie bestaat voor IBM uit levering, configuratie en installatie van hardware en stan daardsoftware en het 'maatwerken' van de soft ware. Daarnaast voert IBM in samenwerking met medewerkers van de KB een onderzoek uit naar een ontwikkelingstraject voor digitale duurzaam heid van elektronische bestanden. Het functio neel ontwerp is samen met de medewerkers van de KB vastgesteld. Acceptatie-testcases worden geschreven door de KB-medewerkers en zo wordt bij oplevering gecontroleerd of het ontwerp inderdaad gerealiseerd is in het uiteindelijke sys teem. Een aparte werkgroep richt zich op de ont wikkeling van praktische toepassing van digitale duurzaamheidsmodellen en webarchivering. De KB heeft een computerruimte aangepast voor de apparatuur van het DNEP-systeem. Die appa ratuur bestaat uit een centrale computer (RS6000), disk opslagsysteem (Enterprise Storage Server), optische schijfkasten, tape libraries, een beheerstation en drie ontwikkelstations. In totaal is nu twaalf Terabytes (1 Terabyte is 1000 Gygabyte) opslagruimte beschikbaar. Deze wordt verder uitgebreid na oplevering van het project. Het systeem zal zeer veel elektronische publica ties bevatten en dat vergt binnen vijf jaar tussen 300 en 400 Terabytes. Eind 2002 moet het pro ject klaar zijn en hopelijk beschikt de KB dan over een volledig operationeel digitaal archief. 10 11 VAR-themamiddag preservering MLG De Vereniging Restauratoren van Papier, Boeken en Fotografisch Materiaal (VAR) kent vier vakgroepen die bestaan uit leden met een spe cialisme in de restauratie en/of conservering van respectievelijk werken op papier, boeken, foto grafisch materiaal en MLG (machineleesbaare gegevens). De vakgroep MLG telt drie leden: Han Kuipers van het Stadsarchief Dordrecht en Marjet Zondag en Annie de Roover van de sectie Materieel Beheer binnen de vakdirectie Document Management en Archief van de Gemeente Breda. De twee laatstgenoemden orga niseerden op 20 februari jl. de themamiddag 'Preservering MLG', die plaatsvond in het stadskantoor van Breda. De locatie was niet toevallig geko zen. Bij de gemeente Breda is de voormalige Gemeentelijke Archiefdienst samengevoegd met de voormalige afdeling DIV tot de hierboven genoemde vakdirectie. Deze vakdirectie beheert de analoge en digitale documenten(stroom) van ont staan tot archivering. De taak van de sectie Materieel Beheer is het bewaken van de houd baarheid van documenten van hun oorsprong tot hun bewa ring in de archiefbewaarplaats ongeacht hun vorm. Vandaar dat op de MLG-themamiddag naast het meer bekende terrein DoorTrudi Noordermeer* De Koninklijke Bibliotheek (KB) is de Nationale Bibliotheek van Nederland. Een van de taken is de vorming van het Depot van Nederlandse Publicaties en de daarop gebaseerde Nederlandse Bibliografie. Het depot omvat boeken, tijdschriften en kranten van erkende uitgevers, maar ook publicaties van overheidsinstellingen, proefschriften etc. Sinds 1996 verzamelt de KB ook elektronische publicaties op cd-rom of diskette en elektronische tijdschriften. Er is ook geëxperimenteerd met webarchivering. De strategie van onderzoek, ontwikkeling en implemen tatie en opnieuw onderzoek moet in 2002 leiden tot de eerste versie van het digitaal archief, het Depot van Nederlandse Elektronische Publicaties (DNEP). De problematiek Eerste resultaat Systeemontwikkeling *Trudi Noordermeer is Hoofd Nederlandse Bibliografie bij de Koninklijke Bibliotheek. Relevante websites: Koninklijke Bibliotheek: http://www.kb.nl/ Systeemontwikkeling: http://www.kb.nl/kb/ict/dea/ Open Archival Information System (OAIS): http://ssdoo.gsfc.nasa.gov/nost/isoas/ref model.htm Nedlib: http://www.kb.nl/nedlib/ Preserving Access to Digital Information http://www.nla.gov.au/padi/ Trudi Noordermeer. DMA-Breda. (Foto: Bas Linssen) van 'polymere informatiedra gers' ook het terrein van de 'digitale duurzaamheid' werd verkend. De lezingen van Peter Horsman, John Havermans en Trudi Noordermeer leverden veel nieuwe informatie en inzichten op. De vakgroep MLG heeft de the mamiddag geëvalueerd in ver band met de verdere oriëntatie op in de toekomst aan te boren thema's. De conclusie is dat de studie van 'digitale duurzaamheid' op zich (los van de drager) niet tot de taak van de vakgroep MLG behoort. Preservering van polymere informatiedragers (ongeacht het feit of ze analoge dan wel digitale informatie bevatten) daarentegen wel. Gezien de evolutie in verschillende archie ven waar fotografie/scannen bij materieel beheer hoort en gezien de nauwe link tussen scannen en preservering van beeldmateriaal, zal de vak groep MLG in de toekomst ook daarover informatie inwinnen en themadagen organiseren. U kunt contact opnemen met de VAR via de website www.conserveer.nl. archievenblad juni 2001 juni 2001 archievenblad

Periodiekviewer Koninklijke Vereniging van Archivarissen

Archievenblad | 2001 | | pagina 5