de praktijk
de praktijk
Het antwoord op de vraag wat er bij het ont
werp van een website gedaan kan worden ten
bate van eventuele archivering wordt in sterke
mate bepaald door het antwoord op de volgende
vragen:
1. Aan welke eisen moeten de bescheiden van
een webarchief volgens de wet voldoen?
2. Hoe kan een website het beste gearchiveerd
worden?
Bij de verkenning is ten aanzien van de wettelij
ke eisen de 'Regeling geordende en toegankelijke
staat archiefbescheiden 2001' als uitgangspunt
gekozen. Al snel kon ech
ter geconcludeerd worden
dat deze regeling voor
websites weinig bruikbaar
is. Als bijvoorbeeld de
voorgeschreven bestands
formaten gebruikt zou
den worden, dan zou de
aard van de website bij
het archiveren dermate
veranderen dat van ver
vanging gesproken zou
moeten worden. Dat lijkt
een slecht uitgangspunt.
Dit beknopte artikel gaat echter niet in op de
discussie aangaande de toepasbaarheid van de
Regeling maar bespreekt de tweede subvraag:
'Hoe kan een website het beste gearchiveerd
worden?' Welke methoden en technieken lenen
zich daar het beste voor?
Er kunnen ruwweg drie benaderingen
onderscheiden worden bij het archiveren (hier
met name gebruikt in de zin van 'capture') van
websites:
1het archiveren van de achterliggende bronnen;
2. het archiveren van het eindresultaat (snap
shot-methode);
'3. integrale recordkeeping-functionaliteit.
Deze drie benaderingen worden beknopt behan
deld waarna conclusies volgen.
De allereerste websites waren volledig sta
tisch van aard (statisch in de zin van 'gefixeerd',
niet-veranderlijk). Iedere pagina van zo'n stati
sche site bestaat uit een tekstbestand met daarin
opmaakcodes. In de opmaakcodes (geschreven
in de opmaaktaal HTML) van dit bestand staan
doorgaans verwijzingen naar andere statische
bestanden die door de webbrowser binnen de
pagina getoond moeten worden, of die na een
klik met de muis getoond moeten worden. Denk
hierbij aan respectievelijk afbeeldingen en zoge
naamde hyperlinks. Door deze eenvoud van
opzet hoeft de archivering van een dergelijke
site qua techniek niet veel meer om het lijf te
hebben dan het opslaan van al die statische
bestanden in hun samenhang. Er is slechts een
minimum aan technische metadata nodig om
de site weer op de oorspronkelijke wijze aan te
kunnen bieden. Bij een passende opzet1 is zelfs
geen webserver2 nodig om de gearchiveerde
bestanden opnieuw als integrale website te kun
nen benaderen. Webarchivering door het archi
veren van bronbestanden is zo een geschikte
aanpak voor statische websites waarbij de bron
nen beschikbaar zijn.
De techniek die tegenwoordig doorgaans
gebruikt wordt voor het genereren van websites
is vele malen complexer dan de oorspronkelijke
opzet met statische bestanden. De meeste websi
tes zijn nu zeer dynamisch van karakter. De
pagina's van een moderne site worden door
gaans feitelijk pas bij het opvragen door de
E.D,lrt
bezoeker gegenereerd. Dit gebeurt met deels op
maat gemaakte programmatuur (zogenaamde
scripts) en database-bevragingen. Een conse
quentie van deze techniek voor archivering is
dat de bronnenbenadering exponentieel com
plexer is geworden. Om een gearchiveerde dyna
mische website weer op basis van de bronnen op
oorspronkelijke wijze aan te kunnen bieden
krijgt men vaak te maken met ketens van afhan
kelijkheden van soms zeer specifieke versies van
software. In sommige gevallen zal deze software
zelfs niet altijd geschikt zijn voor de meest actu
ele hardware. Er zal dan geschikte oude hardwa
re gezocht moeten worden.3 Een zeer onwense
lijke situatie.
Deze exponentieel toenemende complexiteit
kan doorbroken worden door alleen het eindre
sultaat van de complexe techniek te archiveren,
dat wil zeggen de uiteindelijke pagina's en
afbeeldingen zoals een bezoeker ze te zien krijgt
(vergelijkbaar met het fotografisch bevriezen
van de site, vandaar ook de naam snapshot
methode). Dit archiveren kan gebeuren met
behulp van een applicatie die, enigszins verwar
rend, vaak een offline browser wordt genoemd.
Ook deze methode van archivering kent beper
kingen. In sommige gevallen kunnen webpagi
na's via deze aanpak niet gearchiveerd worden.
Door bij de opzet van websites met de beperkin
gen van deze aanpak rekening te houden, kun
nen veel problemen voorkomen worden. Hier
toe zijn in de rapportage aan Verkeer en
Waterstaat aanbevelingen gedaan. Waar ook dit
geen soelaas biedt, kan voor die specifieke
onderdelen desgewenst alsnog toevlucht geno
men worden tot het archiveren van bronnen als
scripts en databases.
Een website staat nooit op zichzelf.
Verschillende processen en systemen binnen
een organisatie leiden tot de pagina's van de
website van een organisatie. Essentieel onder
deel hierin vormt het zogenaamde Content
Management Systeem (CMS), een applicatie
voor het beheer van de inhoud en in zekere
mate ook de vormgeving van een website. Een
logische benadering voor het archiveren van
websites zou dan ook zijn om dergelijke syste
men uit te breiden met een recordkeeping-func
tionaliteit. Een CMS met integrale recordkee
ping-functionaliteit zou dan bijvoorbeeld in
staat zijn om de website terug te toveren zoals
die er bijvoorbeeld drie jaar geleden uitzag.
Dergelijke uitgebreide CM-systemen bestaan
echter nog niet. Als ze zouden bestaan, dan is
a-smmmc
het de vraag of ze voor archivering
in de zin van de Archiefwet een
goede oplossing zouden bieden.
Immers, het digitaal archiveren van
een compleet CMS zal vele malen
duurder uitvallen dan het archiveren
van de uiteindelijke pagina's van de
website, zoals bij de andere twee
methodes gebeurt. Bedenk boven
dien dat een CMS een beperkte
levensduur heeft en er dus over bij
voorbeeld twintig jaar meerdere van
dergelijke systemen in het digitale
archief opgenomen moeten worden. Wellicht
kunnen de kosten behapbaar blijven als er
gebruik gemaakt kan worden van generieke en
gestandaardiseerde recordkeeping-functionali
teit. Websites stellen echter weer bijzondere
eisen aan systemen voor recordkee
ping, wat maakt dat ook van deze
oplossing op korte termijn geen heil
verwacht mag worden.
Afsluitend lijkt voor complexe
websites met de huidige stand van
de techniek alleen de snapshot
methode een goede aanpak voor de
archivering of de 'capture' van websi
tes. Deze methode heeft als belang
rijkste nadeel dat het in beperkte
mate aanvullende eisen stelt aan de
opzet van de te archiveren website.
In een advies aan het Ministerie van Verkeer en
Waterstaat is een aanzet gemaakt tot richtlijnen
voor de opzet van archiveerbare websites.
Bij eenvoudige, statische websites kan ook goed
de bronnenmethode gevolgd worden. In de wat
verdere toekomst wordt misschien een oplos
sing geboden door een in Content Manage-
ment-systemen geïntegreerde recordkeeping-
functionaliteit.
De applicatie van Capsis,
bezig met archiveren.
Naar archivering van websites
Voortgang capture
Door René Voorburg en Hans Goutier*
Ook websites kunnen te archiveren bescheiden
vormen. Om aan de eisen van de Archiefwet te
voldoen zal daarom bij de opzet van websites al
rekening gehouden moeten worden met eisen voor
toekomstige archivering. Voor het Ministerie van
Verkeer en Waterstaat vormde dit een reden om een
verkenning te laten maken naar kwaliteitseisen
voor websites ten behoeve van archivering.
De vraag die bij de verkenning centraal stond was
'Wat kan er bij ontwerp en publicatie van een web
site al gedaan worden om de website later op een
goede wijze te kunnen archiveren?'
Benaderingen bij het archiveren van websites
Tl
Het archiveren van achterliggende bronnen
Het archiveren van het eindresultaat (de snapshot
methode)
De applicatie van Capsis, een overzicht van captures.
Collectie
Zoek
naar
inp
b perioden
"Ti
1 Beschikbare captures voor
overlieid.nl
1 Periode Digitale handtekening
20-04-2004
Bekijk
Beheer-.oenevens
Export
3110
392 MB
01-04-2004 V
01AD3F2FAE
Bekiik
Beheerfgegevcn?
Export
3125
391 MB
22-03-2004 v'
3F2FAE01AD
Beknk
Beheersoeoevens
Export
2965
364 MB
02-03-2004 V
FAE01AD3F2
Bekiik
Beheersaeaeveris
2962
384 MB
15-01 2004 v'
FAE01AD3F2
Beknk
Beheersaeoevens
Export
22-12-2003 v'
01AD3F2FAE
Beknk
Beheersaeaeven*
2815
06-12-2003 v"
3F2FAE01AD
Q Beknk
Beknl.
Beheerioeoevens
Bcheersaeoeytni
2980
16-11-2003
Beknk
Behee'S«gever>s
2973
Integrale recordkeeping-functionaliteit
P-jgtlqgyinu 'mdi-wil'.
Conclusie
René Voorburg (r.voorburg@capsis.nl) is werkzaam bij Capsis.
Hans Goutier (Hans.Goutier@sso.minvenw.nl) is werkzaam bij
het Ministerie van Verkeer en Waterstaat.
Thema index 1 Oigan
xslic- index 1 Zo weikl de overheid 1
Koninklijk huis
Adviescolleges
Kabinet der Koningin
Zelfstandige
bestuursorganen
Staten-Generaal
Openbare lichamen voor
bedrijf en beroep
Raad van State
Wate rschapp en
Algemene Rekenkamer
Provincies
Nationale ombudsman
Gemeenten
Rechterlijke macht
Regionale
samenwerkingsorganen
Ministeries
De archiefversie van
www.overheid.nl in 2000.
Dverheid.nl
Wegwijs op deze site
In de schijnwerpers
De huidige versie van
www.overheid.nl.
Noten
Bij gebruik van enkel relatieve
verwijzingen in plaats van
absolute verwijzingen naar
andere bestanden op de site.
2. De applicatie die zorgt dat de
bezoeker van een website de
gewenste informatie (pagina's)
via het internet toegestuurd
krijgt.
3. Of er moet gebruik gemaakt
worden van de techniek van
emulatie.
20
archievenblad
mei 2004
archievenblad