Digitale content als digitaal erfgoed
In talloze recente documenten van de Europese Commissie worden memory
institutes als bibliotheken, archieven en musea regelmatig aangespoord om digi
taal erfgoed in 'al zijn verschijningsvormen' serieus te nemen. De Europese Raad
kondigde middels een speciale resolutie een plan aan voor samenwerking op het
terrein van conservering. Custodial organisations worden hierin opgeroepen hun
digitale kennis en vaardigheden uit te wisselen. Als expliciet onderdeel van het
cultureel erfgoed noemt de Raad de collecties van omroeporganisaties. Hij stelt
dat: 'The digital preservation extends the existing vast publicly held collections,
and that a significant quantity of digital content is also in possession of broad
casters, which should be taken into account when analyzing the situation and
planning long-term preservation measures'1. De 'significant quantity' verwijst
allereerst naar de radio-, televisie- en stillscollecties, waarvan grote delen inmid
dels zijn gedigitaliseerd of digitaal worden geproduceerd. De Raad heeft echter
ook een andere categorie op het oog: websites. Deze nieuwe-mediapublicaties
moeten - als onderdeel van de bedrijfscollecties - worden betrokken bij de
conserveringsmaatregelen.
Inmiddels draagt de Europese Commissie het zijne bij door financiering van het
Information Society Technologies (1ST) programma, een serie omvangrijke
projectenclusters waarin researchinstituten, collectiebeheerders en de industrie
zich in meer praktische zin bezig houden met digitale ontsluitings- en duurzaam-
heidsproblematiek. Projecten die onder dit programma vallen zijn onder meer
ERPANET, DigiCULT, PRESTO, ECHO, MINERVA, PRESTOSPACE en DELOS.
UNESCO presenteerde vorig jaar een indrukwekkende lijst richtlijnen voor het
bewaren van digitaal erfgoed, vooral gericht op materiaal dat digitaal is ont
staan. Naast teksten, databases, multimedia en software, staan ook websites bij
de opsomming. Over het onderwerp webcontent wordt verder gedebatteerd
binnen kringen als het International Council of Archives, de Conference of
Directors of National Libraries (CDNL) en de Internationale Bibliotheek
Associatie IFLA. Een ander netwerk heeft zich gevormd rond de LUND-principes,
geformuleerd in 2001 als activiteit van het MINERVA (Ministerial Network for
Valorising Activities in Digitization). Het LUND Actieplan - aanvankelijk vooral
gericht op toegang en digitalisering - is inmiddels aangescherpt en omvat nu ook
conservering. Met steun van de Europese Commissie worden bijeenkomsten
gehouden die moeten leiden tot kwaliteitscriteria en voorbeelden van good
practice. De Nederlandse LUND-afdeling is speciaal belast met de inrichting van
een coördinatiemechanisme voor benchmarkonderzoek van digitale projecten.
Een heel recent initiatiefis de oprichting van het International Internet
Preservation Consortium (IIPC). Dit consortium begeleidt de ontwikkeling van
gemeenschappelijke tools, technieken en standaarden. Wereldwijde uitwisseling
en contacten moeten archieven aanmoedigen om het archiveren van webcontent
serieus te nemen. Leden zijn nationale bibliotheken van Frankrijk, Italië,
Finland, Zweden, IJsland, Canada, Noorwegen, Engeland en de Library of
Congress in de Verenigde Staten.
Wie bewaart het web?
Bovengenoemde initiatieven zijn vooral gericht op internationale samenwerking
in het opbouwen en verspreiden van kennis over het bewaren van digitale
content, waaronder websites. Organisaties zoals de Nederlandse DEN (Stichting
Digitaal Erfgoed Nederland) behartigen deze problematiek op een nationaal
plan. In diverse landen wordt momenteel ook geïnvesteerd in het daadwerkelijk
vastleggen van webcontent. Het nationaal archief van Australië, de Library of
Congress en de British Library hebben hun beleid voor elektronisch record
management inmiddels uitgebreid naar websites. In Frankrijk hebben de
Bibliothèque National en het INA (Institut National de l'Audiovisuel) de
krachten op dit vlak gebundeld. In Finland verzamelt het zogeheten EVA-project
alle gepubliceerde Finse HTML-documenten. Zweden kent zijn Kulturarw3
Erfgoed-project, waarin Zweedse sites en sites over Zweden worden bewaard.
Deze nationale conserveringsprojecten streven ernaar technieken te ontwikkelen
waarmee zowel de inhoud, de functies als de Took-and-feel' van hun talloze
objecten kunnen worden bewaard op een manier die past bij hun verzamelbeleid.
Door nationale bibliotheken wordt het web in het algemeen benaderd vanuit de
invalshoek van de wettelijke depotplicht. Online elektronische materialen
worden behandeld als een uitbreiding van gedrukte publicaties en opgeslagen op
stabiele dragers zoals CD-rom en DVD. Centraal in het verzamelbeleid is het idee
van een nationale productie die het cultureel erfgoed constitueert: de sites
moeten gaan over het land en/of ze moeten zijn geschreven door landgenoten.
Speciale aandacht verdient het Internetarchive, een Amerikaanse non-profit
organisatie die publieke websites verzamelt en beschikbaar stelt. De sites worden
aangeboden via een eigen zoekmachine, de 'Way Back machine'. Meer dan
20.000 bezoekers per dag maken als referentieservice gebruik van deze Way Back
machine. De toegang tot de informatie is vrij maar privacy en copyright moeten
worden gerespecteerd. Het Internetarchive bewaart niet alleen statische snap
shots van de sites maar probeert ook het deep web te vangen, dat wil zeggen de
links die naar andere sites verwijzen. Per maand wordt zo'n tien terabyte aan
webcontent vastgelegd. Op dit moment omvat de collectie meer dan twee
billioen pagina's. Via webcrawlers (software die geselecteerde websites kan
binnenhalen en opslaan) wordt iedere twee maanden een complete sweep gedaan
van het hele Internet. Het Internetarchive verzamelt ook steeds meer 'losse'
collecties van digitale teksten, multimedia en audiovisuele materialen. Deze
collecties worden vooral opgebouwd vanuit schenkingen en depotstellingen.
Het Internetarchive bezit inmiddels schaduwarchieven in Alexandrië en
- sinds eind 2004 - in Amsterdam. Oprichter Brewster Kahle ('We learned a
lesson from Alexandria') heeft duidelijke opvattingen over de beste manier om
(digitale) content te bewaren: verstrek kopieën aan zoveel mogelijk verschillende
mensen en instanties, in zoveel mogelijk verschillende landen en culturele
omgevingen. Ieder voor zich zullen zij zorgen voor de beste manier van opslag en
conservering.2
BEHOUD
1 European Council, resolutie no. 2002/C162/02, juni 2002
http: www. ibeurope. com/Newslink/311 .htm# 5850
78
ANNEMIEKE DE JONG HET AUDIOVISUELE DOMEIN ALS KRINGLOOPWINKEL
2 DigiNews, Editors' interview: Brewster Kahle, the Internetarchive, 10 juni 2002
http://www.rlg.org/preserv/diginews/diginews6-3 .html#interview
79