de praktijk de praktijk Het antwoord op de vraag wat er bij het ont werp van een website gedaan kan worden ten bate van eventuele archivering wordt in sterke mate bepaald door het antwoord op de volgende vragen: 1. Aan welke eisen moeten de bescheiden van een webarchief volgens de wet voldoen? 2. Hoe kan een website het beste gearchiveerd worden? Bij de verkenning is ten aanzien van de wettelij ke eisen de 'Regeling geordende en toegankelijke staat archiefbescheiden 2001' als uitgangspunt gekozen. Al snel kon ech ter geconcludeerd worden dat deze regeling voor websites weinig bruikbaar is. Als bijvoorbeeld de voorgeschreven bestands formaten gebruikt zou den worden, dan zou de aard van de website bij het archiveren dermate veranderen dat van ver vanging gesproken zou moeten worden. Dat lijkt een slecht uitgangspunt. Dit beknopte artikel gaat echter niet in op de discussie aangaande de toepasbaarheid van de Regeling maar bespreekt de tweede subvraag: 'Hoe kan een website het beste gearchiveerd worden?' Welke methoden en technieken lenen zich daar het beste voor? Er kunnen ruwweg drie benaderingen onderscheiden worden bij het archiveren (hier met name gebruikt in de zin van 'capture') van websites: 1het archiveren van de achterliggende bronnen; 2. het archiveren van het eindresultaat (snap shot-methode); '3. integrale recordkeeping-functionaliteit. Deze drie benaderingen worden beknopt behan deld waarna conclusies volgen. De allereerste websites waren volledig sta tisch van aard (statisch in de zin van 'gefixeerd', niet-veranderlijk). Iedere pagina van zo'n stati sche site bestaat uit een tekstbestand met daarin opmaakcodes. In de opmaakcodes (geschreven in de opmaaktaal HTML) van dit bestand staan doorgaans verwijzingen naar andere statische bestanden die door de webbrowser binnen de pagina getoond moeten worden, of die na een klik met de muis getoond moeten worden. Denk hierbij aan respectievelijk afbeeldingen en zoge naamde hyperlinks. Door deze eenvoud van opzet hoeft de archivering van een dergelijke site qua techniek niet veel meer om het lijf te hebben dan het opslaan van al die statische bestanden in hun samenhang. Er is slechts een minimum aan technische metadata nodig om de site weer op de oorspronkelijke wijze aan te kunnen bieden. Bij een passende opzet1 is zelfs geen webserver2 nodig om de gearchiveerde bestanden opnieuw als integrale website te kun nen benaderen. Webarchivering door het archi veren van bronbestanden is zo een geschikte aanpak voor statische websites waarbij de bron nen beschikbaar zijn. De techniek die tegenwoordig doorgaans gebruikt wordt voor het genereren van websites is vele malen complexer dan de oorspronkelijke opzet met statische bestanden. De meeste websi tes zijn nu zeer dynamisch van karakter. De pagina's van een moderne site worden door gaans feitelijk pas bij het opvragen door de E.D,lrt bezoeker gegenereerd. Dit gebeurt met deels op maat gemaakte programmatuur (zogenaamde scripts) en database-bevragingen. Een conse quentie van deze techniek voor archivering is dat de bronnenbenadering exponentieel com plexer is geworden. Om een gearchiveerde dyna mische website weer op basis van de bronnen op oorspronkelijke wijze aan te kunnen bieden krijgt men vaak te maken met ketens van afhan kelijkheden van soms zeer specifieke versies van software. In sommige gevallen zal deze software zelfs niet altijd geschikt zijn voor de meest actu ele hardware. Er zal dan geschikte oude hardwa re gezocht moeten worden.3 Een zeer onwense lijke situatie. Deze exponentieel toenemende complexiteit kan doorbroken worden door alleen het eindre sultaat van de complexe techniek te archiveren, dat wil zeggen de uiteindelijke pagina's en afbeeldingen zoals een bezoeker ze te zien krijgt (vergelijkbaar met het fotografisch bevriezen van de site, vandaar ook de naam snapshot methode). Dit archiveren kan gebeuren met behulp van een applicatie die, enigszins verwar rend, vaak een offline browser wordt genoemd. Ook deze methode van archivering kent beper kingen. In sommige gevallen kunnen webpagi na's via deze aanpak niet gearchiveerd worden. Door bij de opzet van websites met de beperkin gen van deze aanpak rekening te houden, kun nen veel problemen voorkomen worden. Hier toe zijn in de rapportage aan Verkeer en Waterstaat aanbevelingen gedaan. Waar ook dit geen soelaas biedt, kan voor die specifieke onderdelen desgewenst alsnog toevlucht geno men worden tot het archiveren van bronnen als scripts en databases. Een website staat nooit op zichzelf. Verschillende processen en systemen binnen een organisatie leiden tot de pagina's van de website van een organisatie. Essentieel onder deel hierin vormt het zogenaamde Content Management Systeem (CMS), een applicatie voor het beheer van de inhoud en in zekere mate ook de vormgeving van een website. Een logische benadering voor het archiveren van websites zou dan ook zijn om dergelijke syste men uit te breiden met een recordkeeping-func tionaliteit. Een CMS met integrale recordkee ping-functionaliteit zou dan bijvoorbeeld in staat zijn om de website terug te toveren zoals die er bijvoorbeeld drie jaar geleden uitzag. Dergelijke uitgebreide CM-systemen bestaan echter nog niet. Als ze zouden bestaan, dan is a-smmmc het de vraag of ze voor archivering in de zin van de Archiefwet een goede oplossing zouden bieden. Immers, het digitaal archiveren van een compleet CMS zal vele malen duurder uitvallen dan het archiveren van de uiteindelijke pagina's van de website, zoals bij de andere twee methodes gebeurt. Bedenk boven dien dat een CMS een beperkte levensduur heeft en er dus over bij voorbeeld twintig jaar meerdere van dergelijke systemen in het digitale archief opgenomen moeten worden. Wellicht kunnen de kosten behapbaar blijven als er gebruik gemaakt kan worden van generieke en gestandaardiseerde recordkeeping-functionali teit. Websites stellen echter weer bijzondere eisen aan systemen voor recordkee ping, wat maakt dat ook van deze oplossing op korte termijn geen heil verwacht mag worden. Afsluitend lijkt voor complexe websites met de huidige stand van de techniek alleen de snapshot methode een goede aanpak voor de archivering of de 'capture' van websi tes. Deze methode heeft als belang rijkste nadeel dat het in beperkte mate aanvullende eisen stelt aan de opzet van de te archiveren website. In een advies aan het Ministerie van Verkeer en Waterstaat is een aanzet gemaakt tot richtlijnen voor de opzet van archiveerbare websites. Bij eenvoudige, statische websites kan ook goed de bronnenmethode gevolgd worden. In de wat verdere toekomst wordt misschien een oplos sing geboden door een in Content Manage- ment-systemen geïntegreerde recordkeeping- functionaliteit. De applicatie van Capsis, bezig met archiveren. Naar archivering van websites Voortgang capture Door René Voorburg en Hans Goutier* Ook websites kunnen te archiveren bescheiden vormen. Om aan de eisen van de Archiefwet te voldoen zal daarom bij de opzet van websites al rekening gehouden moeten worden met eisen voor toekomstige archivering. Voor het Ministerie van Verkeer en Waterstaat vormde dit een reden om een verkenning te laten maken naar kwaliteitseisen voor websites ten behoeve van archivering. De vraag die bij de verkenning centraal stond was 'Wat kan er bij ontwerp en publicatie van een web site al gedaan worden om de website later op een goede wijze te kunnen archiveren?' Benaderingen bij het archiveren van websites Tl Het archiveren van achterliggende bronnen Het archiveren van het eindresultaat (de snapshot methode) De applicatie van Capsis, een overzicht van captures. Collectie Zoek naar inp b perioden "Ti 1 Beschikbare captures voor overlieid.nl 1 Periode Digitale handtekening 20-04-2004 Bekijk Beheer-.oenevens Export 3110 392 MB 01-04-2004 V 01AD3F2FAE Bekiik Beheerfgegevcn? Export 3125 391 MB 22-03-2004 v' 3F2FAE01AD Beknk Beheersoeoevens Export 2965 364 MB 02-03-2004 V FAE01AD3F2 Bekiik Beheersaeaeveris 2962 384 MB 15-01 2004 v' FAE01AD3F2 Beknk Beheersaeoevens Export 22-12-2003 v' 01AD3F2FAE Beknk Beheersaeaeven* 2815 06-12-2003 v" 3F2FAE01AD Q Beknk Beknl. Beheerioeoevens Bcheersaeoeytni 2980 16-11-2003 Beknk Behee'S«gever>s 2973 Integrale recordkeeping-functionaliteit P-jgtlqgyinu 'mdi-wil'. Conclusie René Voorburg (r.voorburg@capsis.nl) is werkzaam bij Capsis. Hans Goutier (Hans.Goutier@sso.minvenw.nl) is werkzaam bij het Ministerie van Verkeer en Waterstaat. Thema index 1 Oigan xslic- index 1 Zo weikl de overheid 1 Koninklijk huis Adviescolleges Kabinet der Koningin Zelfstandige bestuursorganen Staten-Generaal Openbare lichamen voor bedrijf en beroep Raad van State Wate rschapp en Algemene Rekenkamer Provincies Nationale ombudsman Gemeenten Rechterlijke macht Regionale samenwerkingsorganen Ministeries De archiefversie van www.overheid.nl in 2000. Dverheid.nl Wegwijs op deze site In de schijnwerpers De huidige versie van www.overheid.nl. Noten Bij gebruik van enkel relatieve verwijzingen in plaats van absolute verwijzingen naar andere bestanden op de site. 2. De applicatie die zorgt dat de bezoeker van een website de gewenste informatie (pagina's) via het internet toegestuurd krijgt. 3. Of er moet gebruik gemaakt worden van de techniek van emulatie. 20 archievenblad mei 2004 archievenblad

Periodiekviewer Koninklijke Vereniging van Archivarissen

Archievenblad | 2004 | | pagina 10