Koninklijke Bibliotheek ontwikkelt
Depot van NederlandseElektronische Publicaties
33
digitale archivering
digitale archivering
In 1974 begon de KB met het Depot van
Nederlandse Publicaties en ruim 99 procent van
alle boeken, tijdschriften en kranten van erkende
uitgevers is nu aanwezig in de KB en kan door alle
geregistreerde gebruikers van de KB geraadpleegd
worden. De dekkingsgraad van de 'grijze litera
tuur' (publicaties zonder ISBN-nummer) van
overheidsinstellingen, universiteiten etc. is zo'n
70 procent. Nederland heeft geen depotwet en
het is opmerkelijk dat de dekkingsgraden in
Nederland hoger zijn dan in veel landen die wel
een depotwet hebben. Wereldwijd zijn nationale
bibliotheken begonnen met het verzamelen van
elektronische publicaties op vrijwillige basis,
omdat een wijziging van de depotwet een aantal
jaren in beslag neemt. Immers, men realiseerde
zich dat dit digitale materiaal voor toekomstige
generaties raadpleegbaar moet zijn, net zoals het
analoge materiaal. Dit was ook het geval in de KB.
Vanaf 1980 kwamen boeken binnen met een
begeleidende diskette en later cd-rom. De publi
catie werd zoals gebruikelijk beschreven volgens
de ISBD-regels voor titelbeschrijving en duur
zaam opgeslagen in de magazijnen. Gaandeweg
verschenen steeds meer cd-rom's en diskettes als
zelfstandige publicaties en het werd duidelijk dat
nieuwe publicatievormen ontstonden. Deze nieu
we elektronische publicaties bleken kwetsbaar te
zijn en dat werd benadrukt met de opkomst van
het internet en het world wide web.
De problematiek van digitale archivering en
digitale duurzaamheid heeft verschillende aspec
ten. De dragers hebben een beperkte levensduur.
De verwachte levensduur van een cd-rom
varieert nu van zo'n 25 tot ruim 100 jaar, afhan
kelijk van de materiaalsamenstelling en bewaar
omstandigheden zoals hygiëne, luchtvochtig
heid en temperatuur. Tapes moeten om de paar
jaar ververst worden en ook de verwachte levens
duur van diskettes is beperkt. In de Verenigde
Staten zijn bijvoorbeeld tapes van de NASA en
tapes met demografische gegevens uit 1973
onherstelbaar beschadigd. Digitale gegevens zijn
ook kwetsbaar, omdat computers en toepassings
programmatuur zo snel verouderen. Wie heeft er
nog een Commodore 64 en wie gebruikt nog
Wordstar als tekstverwerker? Bestandsformaten
en standaarden volgen elkaar op en internetpu
blicaties zijn al helemaal vluchtig. Een publicatie
staat er de ene dag, maar morgen ook? En is de
versie die men dan raadpleegt wel dezelfde als
die van gisteren? Digitale archivering is een inge
wikkeld vraagstuk dat nog niet is opgelost. Wel is
het zo dat steeds meer mensen zich realiseren dat
digitaal materiaal kwetsbaar is. De bewustwor
ding bij bedrijven, met name banken, en bij
archiefbeherende instellingen zoals archieven,
bibliotheken, musea en overheidsinstellingen is
de laatste jaren sterk toegenomen.
In 1995 besloot de directie van de KB, in
samenspraak met het Nederlands Bibliografisch
Centrum, de selectiecriteria voor het depot uit te
breiden met elektronische publicaties en te gaan
onderzoeken hoe een Depot van Nederlandse
Elektronische Publicaties opgebouwd kon wor
den. Een projectgroep coördineerde de onder
zoeksactiviteiten. In 1998 verscheen een rapport
met de verwachte groei van het aantal publica
ties, selectiecriteria, voorlopige regels voor
beschrijving van elektronische publicaties, een
plan voor een opslagsysteem en de stand van
zaken van het auteursrecht in Nederland.
Vervolgens werd geëxperimenteerd met het
'oogsten' van zo'n honderd websites. De werk
processen van het DNEP werden in grote lijnen
gedefinieerd. Het was een nuttig eerste resultaat,
maar tegelijkertijd bleek dat een goede methode
voor digitale archivering die op lange termijn
toegang geeft tot authentieke, integere publica
ties nog in de kinderschoenen stond.
In het kader van het Actieplan voor de
Elektronische Snelweg werden veel elektronische
publicaties aangeschaft. DONOR (Directory Of
Netherlands Online Resources) leverde een eerste
plan voor 'preservation metadata'. Bijvoorbeeld
velden voor de registratie van besturingssysteem,
bestandsformaat en toepassingsprogrammatuur.
Cerberus stelde zich de vraag hoe we kunnen
garanderen dat gebruikers in de verre toekomst
er zeker van kunnen zijn dat de documenten die
zij inzien integer en authentiek zijn. En wat is de
beste methode om gegevens toegankelijk te hou
den? Moet men voortdurend migreren van de
ene omgeving en drager naar de andere of kan
men emuleren, waarbij men de publicatie niet
verandert, maar op een nieuwe computer de
oude computer wordt gesimuleerd? Het is
bekend dat emulatoren werken, want men kan
bijvoorbeeld oude spelletjes op de nieuwste com
puters spelen. De meeste emulatoren zijn ont
wikkeld voor de grote markt van consumenten
programma's. Maar werkt emulatie ook voor de
heterogene publicaties die nationale bibliothe
ken ontvangen? Beantwoording van deze vragen
bleek te ambitieus binnen het kader van
Cerberus, maar maakt nu deel uit van het onder
zoek voor het digitale archief van de KB. Het
Europese project BIBLINK ontwikkelde software
waarmee uitgevers 'Dublin Core metadata' kun
nen uitwisselen met nationale bibliotheken.
NEDLIB leverde een reeks publicaties op, waar
onder een procesmodel en richtlijnen voor de
bouw van een digitaal archief. De KB had inmid
dels contacten gelegd met een groot aantal
instellingen, nationaal en internationaal, die
bezig waren met dezelfde problematiek en parti
cipeert in een initiatief van de National Library
of Australia, PADI: Preserving Access to Digital
Information. De PADI-website biedt een goed
overzicht van de stand van zaken op het gebied
van digitale archivering.
In de periode 1996 tot 1998 testte de KB de
systemen Right Pages van AT&T, ICL Commands
van Sinet en IBM Digital Library voor de opslag
van elektronische tijdschriften. Vanaf 1998 is
IBM-DL ontwikkeld tot een digitaal magazijn
voor de elektronische tijdschriften van Elsevier
en Kluwer en ook overheidspublicaties van SDU
Opmaat worden hierin bewaard. Tevens is IBM-
DL de opslagruimte voor de images van digitalise
ringsprojecten van de KB zoals de middeleeuwse
verluchte handschriften en gedigitaliseerde pam
fletten, prenten, penningen en objecten. Dit pro
ject, Digitale Atlas Geschiedenis, is een samen
werking tussen het Rijksmuseum in Amsterdam
en de KB, waarbij diverse documenttypen in een
website over de zeventiende eeuw bijeen worden
gebracht. Het betreft bijvoorbeeld bestanden in
tiff, jpeg, sid (inzoom) en gif. Het digitale maga
zijn IBM-DL biedt nog geen mogelijkheden voor
toegankelijkheid op de lange termijn.
In 1999 stuurde de KB een 'request for informa
tion' naar bedrijven, die hun interesse konden
tonen voor de bouw van het digitale archief.
Vervolgens kwam er een Europese Aanbesteding
en uiteindelijk is IBM Nederland geselecteerd
voor de bouw van het echte digitale archief van
de KB, het Depot van Nederlandse Elektronische
Publicaties.
Het project is bijzonder vanwege de grote hoe-
veelheid gegevens die opgeslagen moet worden
en omdat digitale duurzaamheid van de elektro
nische bestanden in het systeem geïntegreerd
moet zijn. Er bestaat immers nog nergens een
systeem dat digitale duurzaamheid kan garande
ren. De realisatie bestaat voor IBM uit levering,
configuratie en installatie van hardware en stan
daardsoftware en het 'maatwerken' van de soft
ware. Daarnaast voert IBM in samenwerking met
medewerkers van de KB een onderzoek uit naar
een ontwikkelingstraject voor digitale duurzaam
heid van elektronische bestanden. Het functio
neel ontwerp is samen met de medewerkers van
de KB vastgesteld. Acceptatie-testcases worden
geschreven door de KB-medewerkers en zo wordt
bij oplevering gecontroleerd of het ontwerp
inderdaad gerealiseerd is in het uiteindelijke sys
teem. Een aparte werkgroep richt zich op de ont
wikkeling van praktische toepassing van digitale
duurzaamheidsmodellen en webarchivering.
De KB heeft een computerruimte aangepast voor
de apparatuur van het DNEP-systeem. Die appa
ratuur bestaat uit een centrale computer
(RS6000), disk opslagsysteem (Enterprise Storage
Server), optische schijfkasten, tape libraries, een
beheerstation en drie ontwikkelstations. In totaal
is nu twaalf Terabytes (1 Terabyte is 1000
Gygabyte) opslagruimte beschikbaar. Deze wordt
verder uitgebreid na oplevering van het project.
Het systeem zal zeer veel elektronische publica
ties bevatten en dat vergt binnen vijf jaar tussen
300 en 400 Terabytes. Eind 2002 moet het pro
ject klaar zijn en hopelijk beschikt de KB dan
over een volledig operationeel digitaal archief.
10
11
VAR-themamiddag
preservering MLG
De Vereniging Restauratoren
van Papier, Boeken en
Fotografisch Materiaal (VAR)
kent vier vakgroepen die
bestaan uit leden met een spe
cialisme in de restauratie en/of
conservering van respectievelijk
werken op papier, boeken, foto
grafisch materiaal en MLG
(machineleesbaare gegevens).
De vakgroep MLG telt drie
leden: Han Kuipers van het
Stadsarchief Dordrecht en
Marjet Zondag en Annie de
Roover van de sectie Materieel
Beheer binnen de vakdirectie
Document Management en
Archief van de Gemeente Breda.
De twee laatstgenoemden orga
niseerden op 20 februari jl. de
themamiddag 'Preservering
MLG', die plaatsvond in het
stadskantoor van Breda. De
locatie was niet toevallig geko
zen. Bij de gemeente Breda is
de voormalige Gemeentelijke
Archiefdienst samengevoegd
met de voormalige afdeling DIV
tot de hierboven genoemde
vakdirectie. Deze vakdirectie
beheert de analoge en digitale
documenten(stroom) van ont
staan tot archivering. De taak
van de sectie Materieel Beheer
is het bewaken van de houd
baarheid van documenten van
hun oorsprong tot hun bewa
ring in de archiefbewaarplaats
ongeacht hun vorm. Vandaar
dat op de MLG-themamiddag
naast het meer bekende terrein
DoorTrudi Noordermeer*
De Koninklijke Bibliotheek (KB) is de Nationale
Bibliotheek van Nederland. Een van de taken is de
vorming van het Depot van Nederlandse Publicaties
en de daarop gebaseerde Nederlandse Bibliografie.
Het depot omvat boeken, tijdschriften en kranten
van erkende uitgevers, maar ook publicaties van
overheidsinstellingen, proefschriften etc. Sinds 1996
verzamelt de KB ook elektronische publicaties op
cd-rom of diskette en elektronische tijdschriften. Er
is ook geëxperimenteerd met webarchivering. De
strategie van onderzoek, ontwikkeling en implemen
tatie en opnieuw onderzoek moet in 2002 leiden tot
de eerste versie van het digitaal archief, het Depot
van Nederlandse Elektronische Publicaties (DNEP).
De problematiek
Eerste resultaat
Systeemontwikkeling
*Trudi Noordermeer is Hoofd Nederlandse Bibliografie bij de
Koninklijke Bibliotheek.
Relevante websites:
Koninklijke Bibliotheek: http://www.kb.nl/
Systeemontwikkeling: http://www.kb.nl/kb/ict/dea/
Open Archival Information System (OAIS):
http://ssdoo.gsfc.nasa.gov/nost/isoas/ref model.htm
Nedlib: http://www.kb.nl/nedlib/
Preserving Access to Digital Information
http://www.nla.gov.au/padi/
Trudi Noordermeer.
DMA-Breda. (Foto: Bas Linssen)
van 'polymere informatiedra
gers' ook het terrein van de
'digitale duurzaamheid' werd
verkend. De lezingen van Peter
Horsman, John Havermans en
Trudi Noordermeer leverden
veel nieuwe informatie en
inzichten op.
De vakgroep MLG heeft de the
mamiddag geëvalueerd in ver
band met de verdere oriëntatie
op in de toekomst aan te
boren thema's. De conclusie is
dat de studie van 'digitale
duurzaamheid' op zich (los van
de drager) niet tot de taak van
de vakgroep MLG behoort.
Preservering van polymere
informatiedragers (ongeacht
het feit of ze analoge dan wel
digitale informatie bevatten)
daarentegen wel. Gezien de
evolutie in verschillende archie
ven waar fotografie/scannen bij
materieel beheer hoort en
gezien de nauwe link tussen
scannen en preservering van
beeldmateriaal, zal de vak
groep MLG in de toekomst ook
daarover informatie inwinnen
en themadagen organiseren.
U kunt contact opnemen met
de VAR via de website
www.conserveer.nl.
archievenblad
juni 2001
juni 2001
archievenblad