e a
xverxng
van websites
VJ
webzijdelings
Door Erika Hokke*
De eerste initiatieven om over te gaan tot
het bewaren van websites stammen uit
1996. Deze projecten, zoals The Internet
Archive, het Kulturarw3-project van de
Nationale Bibliotheek van Zweden en het
Pandora-project van de Nationale
Bibliotheek van Australië, hebben hun
wortels in de bibliotheekwereld. Ze heb
ben als doel het hele world wide web, of
delen daarvan, te bewaren voor toekom
stig gebruik. Deze drie oudste projecten
hebben veel navolging gekregen (zie het
kader 'Overzicht initiatieven webarchive
ring')! zowel bij bibliotheken en archieven
als andere wetenschappelijke instellingen.
Bekend Nederlands project is Archipol, het
archief met websites van politieke partij
en.3 Een Belgische koploper is het David-
project van het stadsarchief Antwerpen.
In de projecten wordt een object-georiën
teerde archiveringsstrategie gehanteerd.
Archivering is gericht op 'objecten', dat wil
zeggen dat wat op het scherm verschijnt:
de inhoud en structuur van een website of
webpagina op een bepaald moment in tijd
(inclusief functionaliteiten). Periodiek
wordt een kopie (snapshot of mirror
genaamd) gemaakt van de gewenste websi
tes. Het gaat in deze projecten om het
archiveren van websites van 'anderen'. Er
is dus veel aandacht voor de vraag welke
websites in het website-archief opgeno
men moeten worden (bulk of selectief) en
op welke manier dat kan gebeuren (pull of
push).
De verschillende projecten geven waarde
volle informatie over de bereikte resultaten
en de vraagstukken waar men mee te
maken kreeg. Zoals inzicht in het verschil
in kosten tussen bulk- en selectieve archi
vering en in de ervaringen met het maken
van snapshots.4 Het David-project verkent
ook andere archiveringsmogelijkheden als
het opslaan van de website in pdf en het
verfilmen van een website met een screen-
recorder.
De vraag is echter of deze object-georiën
teerde archiveringsstrategie, die 'op
afstand' uitgevoerd wordt, voldoende is.
Om hier antwoord op te kunnen geven is
een nadere analyse van websites en het
gebruik van websites van belang.
Een website is een medium voor de presen
tatie van informatie via het internet.
Organisaties en personen maken websites
om via internet informatie te verspreiden
of te communiceren.
Toch is niet iedere website hetzelfde.
Allereerst kan onderscheid gemaakt wor
den tussen statische en dynamische websi
tes. Statische websites zijn aanbodgericht.
De website wordt altijd op dezelfde door
Managing Web resources
Web snapshot project
28
webzijdelings
de ontwerper bepaalde manier opge
bouwd. Zoals de website van de Archief-
school www.archiefschool.nl. De dynami
sche website is vraaggericht. De website
wordt opgebouwd vanuit de vraag of voor
keur van de bezoeker. Een voorbeeld is de
site www.leren.nl of de pagina's met per
soonlijke aanbevelingen in de website van
Amazon.
Verder kan er onderscheid gemaakt wor
den tussen de 'enkele websites' en de web
sites in combinatie met andere technolo
gie. De 'enkele websites' variëren van een
voudige html-pagina's met alleen tekst tot
websites die zijn samengesteld uit elemen
ten uit verschillende bestanden en pro
gramma's, eventueel afkomstig uit ver
schillende organisaties. Een voorbeeld van
een dergelijke samengestelde website is de
combinatie van www.kvan.nl met de sta
tistiekapplicatie van het bedrijf Nedstat, of
de combinatie van een website met zoek
functionaliteiten of een Adobe Acrobat
reader.
Een derde factor is dat websites ook wor
den gecombineerd met andere technolo
gie, namelijk met e-mail en met databases.
De website fungeert als een brievenbus
voor e-mail of als interface voor een data
base.
leder type website roept zijn eigen archive-
ringsvraagstukken op. Statische websites
zijn relatief eenvoudig te archiveren via de
object-georiënteerde archiveringsstrategie.
Maar als de statische website gecombi
neerd wordt met een e-mailmogelijkheid,
zoals bij een e-loket het geval is, dan wordt
de website alleen als brievenbus of loket
gearchiveerd.
Voor een dynamische website is de object
georiënteerde strategie alleen niet vol
doende. Omdat deze website wordt opge
bouwd vanuit de vraag van de bezoeker is
deze vraagmogelijkheid een belangrijk
onderdeel van de website. En moet dus
ook gearchiveerd worden.
De vraagstukken die samenhangen met de
archivering van websites die fungeren als
interface tot een database worden ook wel
de 'deep-web'-problematiek genoemd. Bij
dit type website worden gegevens uit de
database binnen de website gepresenteerd,
zoals bijvoorbeeld de NS-reisplanner. Via
een snapshot wordt wel de website gear
chiveerd, maar dat geldt niet voor de gege
vens uit de database. Voor een volledige
archivering is dus ook archivering van de
gegevens in de database en zoekmogelijk
heden van belang. Bij de samengestelde
websites (of deze nu statisch of dynamisch
worden opgebouwd) is onder meer van
belang dat er maatregelen genomen wor
den dat de programma's en bestanden die
niet beheerd worden door de eigenaar van
de website ook na archivering beschikbaar
blijven.
Voor de overheid zijn websites instrumen
ten in de ontwikkeling van de elektroni
sche overheid.5 Uit een analyse van over-
heidswebsites blijkt dat websites niet
alleen gebruikt worden om voorlichting te
geven.6 Naast deze publicatiefunctie wor
den websites gebruikt voor tweezijdige
communicatie (de consultatie-functie) en
voor het uitvoeren van transacties (trans-
actie-functie). Er zijn vier typen processen
te onderscheiden waarbinnen websites
deze functies vervullen:
zelfstandige communicatieprocessen, de
processen waarin informatie gegeven
wordt over bijvoorbeeld beleid of activi
teiten;
beleidsprocessen, de processen waarin
beleid en wetgeving ontwikkeld worden;
uitvoeringsprocessen, de processen waar
in beleid uitgevoerd wordt;
ondersteunende processen, de processen
die gericht zijn op het in stand houden
van de organisatie.
Een website is dus meer dan een eindpro
duct van overheidsinformatievoorziening.
Door de koppeling tussen websites en pro
cessen kan gesteld worden dat voor web
archiefstukken eenzelfde selectie- en ver
nietigingsregime geldt als voor de overige
documenten die binnen een werkproces
worden gegenereerd. Het vraagstuk van de
bulk dan wel selectieve archivering is dus
niet relevant. De vraag is echter wel of het
selectie-instrumentarium direct toepasbaar
is op websites. Eén website kan immers
gebruikt worden in meerdere processen en
binnen die processen ook meerdere func
ties vervullen. Voor een website van een
ministerie kan het zijn dat voor één websi
te handelingen gedefinieerd zijn in de
selectielijst voorlichting, de (nog niet vast
gestelde) selectielijst overheidsinformatie
voorziening en selectielijsten van diverse
beleidsterreinen, mogelijk met verschillen
de bewaartermijnen.
De vraag hoe archivering van websites
vormgegeven kan worden roept dus een
aantal vraagstukken op die slechts ten dele
met de bestaande strategie op te lossen
zijn. De object-georiënteerde strategie is
een start, geen definitieve archiveringsstra
tegie. Technologische vraagstukken, zoals
de 'deep-web'-problematiek, en archivisti-
sche, zoals selectie en het behouden van
de relatie tussen website en proces, spelen
een rol. Om deze op te lossen en de archi
vering verder vorm te geven is contact met
webdesigners, voorlichters en ICT'ers
onontbeerlijk. Afwachten is geen optie,
het archief is immers vluchtig (en mooi).
sa
In maart maakte het Archievenblad melding
van de uitreiking van de Webwijzer Awards
voor de beste Nederlandse overheidswebsi-
tes.1 De gemeenten Dordrecht en Wassenaar
ontvingen een prijs voor hun goede website,
de gemeente IJsselstein ontving de 'Webflop'.
Het berichtje toont dat de elektronische over
heid vorm begint te krijgen en dat websites
daarin een steeds belangrijker instrument
vormen. Websites worden niet alleen gebruikt
om informatie te presenteren, maar ook om
met burgers te communiceren over beleid en
om transacties uit te voeren. Websites heb
ben daarmee een functie gekregen die breder
is dan voorlichting, ze spelen een rol binnen
de beleidsontwikkeling, de uitvoerende pro
cessen (het e-loket) en de interne ondersteu
nende processen (zoals een vacaturesite). De
inzet van websites bij deze processen leidt
ertoe dat websites niet alleen aan te merken
zijn als mooie (maar vluchtige) 'publicaties',
maar ook als 'archief dat doorgaans niet in
papieren vorm aanwezig is. Hoe de archive
ring van deze websites vorm te geven?2
Websites bevatten en genereren archief
Een overheidsorganisatie die een website gebruikt
bij de uitvoering van haar taken, zal in of via die
website archief creëren, in de vorm van webpagina's
en formulieren (zoals e-mail). Archief is immers pro
cesgebonden informatie, informatie 'die door onder
ling samenhangende werkprocessen is gegenereerd
en die zodanig door die werkprocessen is gestructu
reerd en vastgelegd dat ze vanuit de context van die
werkprocessen kan worden bevraagd.'7 De
Archiefwet 1995 is van toepassing op dit archief.
Terminologie websitearchivering
'Object' of 'Event'
Een object-georiënteerde strategie is erop gericht
om 'objecten', dat wil zeggen dat wat op het
scherm verschijnt, te archiveren. Archivering is
gericht op de inhoud en structuur van een site op
een bepaald moment in tijd, bijvoorbeeld in de
vorm van een snapshot. De event-georiënteerde
strategie richt zicht op het registreren van de inter
actie tussen website en gebruiker; datum en tijd
stip van de interactie, gebruikersprofiel, de query
en de gepresenteerde informatie worden gearchi
veerd.
'Selectief' of 'Bulk'
Selectieve archivering houdt in dat op basis van
vooraf bepaalde criteria bepaald wordt welke web
sites gearchiveerd worden, zoals bij Archipol. In de
buikstrategie worden periodiek alle websites in
hun geheel gearchiveerd, zie 'The Internet Archive'.
'Pull' of 'Push'
Push houdt in dat het aan de eigenaar van de web
site overgelaten wordt om de website periodiek te
archiveren. Pull houdt in dat de archivering geïni
tieerd wordt vanuit de organisatie die het archief
met websites beheert.
Snapshot/mirror
Benamingen voor een kopie van de website. De
kopie wordt gemaakt door de website te downlo
aden met behulp van speciale programmatuur: de
webcrawlers of robots.
De website nader bekeken
Bewaarbelangen
Het blijvend beschikbaar houden van de informatie
in de website is bijvoorbeeld van belang voor het
kunnen afleggen van verantwoording over het
gecommuniceerde beleid. Daarnaast vormen de web
sites een steeds belangrijker onderdeel van het
eigen geheugen van de organisatie. Websites tonen
bijvoorbeeld de ontwikkelingen in beleid en uitvoe
ring en in de communicatie daarover. Ook zijn de
ontwikkelingen in vormgeving en gebruik van websi
tes eruit af te lezen.
Overzicht initiatieven webarchivering
PRO: www.pro.gov.uk/recordsmanagement/eros/wph-
site_toolkit.pdf
Minerva
Library of Congres: www.loc.gov/minerva
Pandora
NLA: http://pandora.nla.gov.au
Policy and Guidelines
NAA: www.naa.gov.au/recordkeeping/er/web
records/intro.html
The Internet Archive
www.archive.org
Kulturarw3
Sveriges nationalbibliotek:
www.kb.se/kw3/ENG/Default.htm
Archipol
Documentatiecentrum Nederlandse Politieke Partijen
en Bibliotheek Rijksuniversiteit Groningen:
www.archipol.nl
Smithsonian Institution Archives
www.si.edu/archives/dollar%20report.html
NARA: www.archives.gov/records management
AO LA
Nationale bibliotheek Oostenrijk: www.onb.ac.at
Universiteit: www.if5.tuwien.ac.at/~anla/
DAVID
Stadsarchief Antwerpen: www.antwerpen.be/david
archievenblad
mei 2003
Website als instrument van het overheids
handelen
Websites blijvend beschikbaar
Erika Hokke werkt als onderzoeker en docent bij de
Archiefschool.
De Archiefschool organiseert een symposium over
archivering van websites op 12 juni a.s. Voor meer
informatie zie www.archiefschool.nl.
1. Archievenblad (maart 2003) p. 7.
2. De Archiefschool heeft in 2002 onderzoek gedaan
naar deze vraag. Aanleiding voor dit onderzoek was de
vraag van het ministerie van Verkeer en Waterstaat of de
websites van het ministerie archiefbescheiden zijn in de
zin van de Archiefwet 1995 en, zo ja, hoe de archivering
van deze websites van het ministerie dan vormgegeven
kan worden. Het onderzoek heeft geresulteerd in een
onderzoeksrapport Blijvend beschikbaar en een imple
mentatieadvies Naar archivering van websites.
3. Verder hebben het gemeentearchief Amsterdam, de
Koninklijke Bibliotheek en het ministerie van Verkeer en
Waterstaat plannen in verschillende stadia om over te
gaan tot archivering van websites.
4. Zie bijvoorbeeld de publicaties van Minerva, via
www.loc.gov/minerva.
5. Het streven is dat in 2003 ruim eenderde van alle
diensten van overheidsinstanties elektronisch wordt
afgehandeld en dat een kwart van de beleidsmakende
instanties een website met interactieve beleidsvormings
instrumenten heeft. Zie de begroting ministerie van BZK
voor 2003. Geraadpleegd op 14-10-2002 via
www.minbzk.nl.
6. Een analyse van de relatie tussen processen en web
sites was onderdeel 58 van het onderzoek dat de
Archiefschool heeft uitgevoerd voor het ministerie van
Verkeer en Waterstaat, (zie noot 3).
7. Theo Thomassen, 'Een korte introductie in de archi-
vistiek' in: Paradigma. Naar een nieuw paradigma in de
archivistiek. (Stichting Archiefpublicaties, Jaarboek 1999)
p. 11 - 12.