e a xverxng van websites VJ webzijdelings Door Erika Hokke* De eerste initiatieven om over te gaan tot het bewaren van websites stammen uit 1996. Deze projecten, zoals The Internet Archive, het Kulturarw3-project van de Nationale Bibliotheek van Zweden en het Pandora-project van de Nationale Bibliotheek van Australië, hebben hun wortels in de bibliotheekwereld. Ze heb ben als doel het hele world wide web, of delen daarvan, te bewaren voor toekom stig gebruik. Deze drie oudste projecten hebben veel navolging gekregen (zie het kader 'Overzicht initiatieven webarchive ring')! zowel bij bibliotheken en archieven als andere wetenschappelijke instellingen. Bekend Nederlands project is Archipol, het archief met websites van politieke partij en.3 Een Belgische koploper is het David- project van het stadsarchief Antwerpen. In de projecten wordt een object-georiën teerde archiveringsstrategie gehanteerd. Archivering is gericht op 'objecten', dat wil zeggen dat wat op het scherm verschijnt: de inhoud en structuur van een website of webpagina op een bepaald moment in tijd (inclusief functionaliteiten). Periodiek wordt een kopie (snapshot of mirror genaamd) gemaakt van de gewenste websi tes. Het gaat in deze projecten om het archiveren van websites van 'anderen'. Er is dus veel aandacht voor de vraag welke websites in het website-archief opgeno men moeten worden (bulk of selectief) en op welke manier dat kan gebeuren (pull of push). De verschillende projecten geven waarde volle informatie over de bereikte resultaten en de vraagstukken waar men mee te maken kreeg. Zoals inzicht in het verschil in kosten tussen bulk- en selectieve archi vering en in de ervaringen met het maken van snapshots.4 Het David-project verkent ook andere archiveringsmogelijkheden als het opslaan van de website in pdf en het verfilmen van een website met een screen- recorder. De vraag is echter of deze object-georiën teerde archiveringsstrategie, die 'op afstand' uitgevoerd wordt, voldoende is. Om hier antwoord op te kunnen geven is een nadere analyse van websites en het gebruik van websites van belang. Een website is een medium voor de presen tatie van informatie via het internet. Organisaties en personen maken websites om via internet informatie te verspreiden of te communiceren. Toch is niet iedere website hetzelfde. Allereerst kan onderscheid gemaakt wor den tussen statische en dynamische websi tes. Statische websites zijn aanbodgericht. De website wordt altijd op dezelfde door Managing Web resources Web snapshot project 28 webzijdelings de ontwerper bepaalde manier opge bouwd. Zoals de website van de Archief- school www.archiefschool.nl. De dynami sche website is vraaggericht. De website wordt opgebouwd vanuit de vraag of voor keur van de bezoeker. Een voorbeeld is de site www.leren.nl of de pagina's met per soonlijke aanbevelingen in de website van Amazon. Verder kan er onderscheid gemaakt wor den tussen de 'enkele websites' en de web sites in combinatie met andere technolo gie. De 'enkele websites' variëren van een voudige html-pagina's met alleen tekst tot websites die zijn samengesteld uit elemen ten uit verschillende bestanden en pro gramma's, eventueel afkomstig uit ver schillende organisaties. Een voorbeeld van een dergelijke samengestelde website is de combinatie van www.kvan.nl met de sta tistiekapplicatie van het bedrijf Nedstat, of de combinatie van een website met zoek functionaliteiten of een Adobe Acrobat reader. Een derde factor is dat websites ook wor den gecombineerd met andere technolo gie, namelijk met e-mail en met databases. De website fungeert als een brievenbus voor e-mail of als interface voor een data base. leder type website roept zijn eigen archive- ringsvraagstukken op. Statische websites zijn relatief eenvoudig te archiveren via de object-georiënteerde archiveringsstrategie. Maar als de statische website gecombi neerd wordt met een e-mailmogelijkheid, zoals bij een e-loket het geval is, dan wordt de website alleen als brievenbus of loket gearchiveerd. Voor een dynamische website is de object georiënteerde strategie alleen niet vol doende. Omdat deze website wordt opge bouwd vanuit de vraag van de bezoeker is deze vraagmogelijkheid een belangrijk onderdeel van de website. En moet dus ook gearchiveerd worden. De vraagstukken die samenhangen met de archivering van websites die fungeren als interface tot een database worden ook wel de 'deep-web'-problematiek genoemd. Bij dit type website worden gegevens uit de database binnen de website gepresenteerd, zoals bijvoorbeeld de NS-reisplanner. Via een snapshot wordt wel de website gear chiveerd, maar dat geldt niet voor de gege vens uit de database. Voor een volledige archivering is dus ook archivering van de gegevens in de database en zoekmogelijk heden van belang. Bij de samengestelde websites (of deze nu statisch of dynamisch worden opgebouwd) is onder meer van belang dat er maatregelen genomen wor den dat de programma's en bestanden die niet beheerd worden door de eigenaar van de website ook na archivering beschikbaar blijven. Voor de overheid zijn websites instrumen ten in de ontwikkeling van de elektroni sche overheid.5 Uit een analyse van over- heidswebsites blijkt dat websites niet alleen gebruikt worden om voorlichting te geven.6 Naast deze publicatiefunctie wor den websites gebruikt voor tweezijdige communicatie (de consultatie-functie) en voor het uitvoeren van transacties (trans- actie-functie). Er zijn vier typen processen te onderscheiden waarbinnen websites deze functies vervullen: zelfstandige communicatieprocessen, de processen waarin informatie gegeven wordt over bijvoorbeeld beleid of activi teiten; beleidsprocessen, de processen waarin beleid en wetgeving ontwikkeld worden; uitvoeringsprocessen, de processen waar in beleid uitgevoerd wordt; ondersteunende processen, de processen die gericht zijn op het in stand houden van de organisatie. Een website is dus meer dan een eindpro duct van overheidsinformatievoorziening. Door de koppeling tussen websites en pro cessen kan gesteld worden dat voor web archiefstukken eenzelfde selectie- en ver nietigingsregime geldt als voor de overige documenten die binnen een werkproces worden gegenereerd. Het vraagstuk van de bulk dan wel selectieve archivering is dus niet relevant. De vraag is echter wel of het selectie-instrumentarium direct toepasbaar is op websites. Eén website kan immers gebruikt worden in meerdere processen en binnen die processen ook meerdere func ties vervullen. Voor een website van een ministerie kan het zijn dat voor één websi te handelingen gedefinieerd zijn in de selectielijst voorlichting, de (nog niet vast gestelde) selectielijst overheidsinformatie voorziening en selectielijsten van diverse beleidsterreinen, mogelijk met verschillen de bewaartermijnen. De vraag hoe archivering van websites vormgegeven kan worden roept dus een aantal vraagstukken op die slechts ten dele met de bestaande strategie op te lossen zijn. De object-georiënteerde strategie is een start, geen definitieve archiveringsstra tegie. Technologische vraagstukken, zoals de 'deep-web'-problematiek, en archivisti- sche, zoals selectie en het behouden van de relatie tussen website en proces, spelen een rol. Om deze op te lossen en de archi vering verder vorm te geven is contact met webdesigners, voorlichters en ICT'ers onontbeerlijk. Afwachten is geen optie, het archief is immers vluchtig (en mooi). sa In maart maakte het Archievenblad melding van de uitreiking van de Webwijzer Awards voor de beste Nederlandse overheidswebsi- tes.1 De gemeenten Dordrecht en Wassenaar ontvingen een prijs voor hun goede website, de gemeente IJsselstein ontving de 'Webflop'. Het berichtje toont dat de elektronische over heid vorm begint te krijgen en dat websites daarin een steeds belangrijker instrument vormen. Websites worden niet alleen gebruikt om informatie te presenteren, maar ook om met burgers te communiceren over beleid en om transacties uit te voeren. Websites heb ben daarmee een functie gekregen die breder is dan voorlichting, ze spelen een rol binnen de beleidsontwikkeling, de uitvoerende pro cessen (het e-loket) en de interne ondersteu nende processen (zoals een vacaturesite). De inzet van websites bij deze processen leidt ertoe dat websites niet alleen aan te merken zijn als mooie (maar vluchtige) 'publicaties', maar ook als 'archief dat doorgaans niet in papieren vorm aanwezig is. Hoe de archive ring van deze websites vorm te geven?2 Websites bevatten en genereren archief Een overheidsorganisatie die een website gebruikt bij de uitvoering van haar taken, zal in of via die website archief creëren, in de vorm van webpagina's en formulieren (zoals e-mail). Archief is immers pro cesgebonden informatie, informatie 'die door onder ling samenhangende werkprocessen is gegenereerd en die zodanig door die werkprocessen is gestructu reerd en vastgelegd dat ze vanuit de context van die werkprocessen kan worden bevraagd.'7 De Archiefwet 1995 is van toepassing op dit archief. Terminologie websitearchivering 'Object' of 'Event' Een object-georiënteerde strategie is erop gericht om 'objecten', dat wil zeggen dat wat op het scherm verschijnt, te archiveren. Archivering is gericht op de inhoud en structuur van een site op een bepaald moment in tijd, bijvoorbeeld in de vorm van een snapshot. De event-georiënteerde strategie richt zicht op het registreren van de inter actie tussen website en gebruiker; datum en tijd stip van de interactie, gebruikersprofiel, de query en de gepresenteerde informatie worden gearchi veerd. 'Selectief' of 'Bulk' Selectieve archivering houdt in dat op basis van vooraf bepaalde criteria bepaald wordt welke web sites gearchiveerd worden, zoals bij Archipol. In de buikstrategie worden periodiek alle websites in hun geheel gearchiveerd, zie 'The Internet Archive'. 'Pull' of 'Push' Push houdt in dat het aan de eigenaar van de web site overgelaten wordt om de website periodiek te archiveren. Pull houdt in dat de archivering geïni tieerd wordt vanuit de organisatie die het archief met websites beheert. Snapshot/mirror Benamingen voor een kopie van de website. De kopie wordt gemaakt door de website te downlo aden met behulp van speciale programmatuur: de webcrawlers of robots. De website nader bekeken Bewaarbelangen Het blijvend beschikbaar houden van de informatie in de website is bijvoorbeeld van belang voor het kunnen afleggen van verantwoording over het gecommuniceerde beleid. Daarnaast vormen de web sites een steeds belangrijker onderdeel van het eigen geheugen van de organisatie. Websites tonen bijvoorbeeld de ontwikkelingen in beleid en uitvoe ring en in de communicatie daarover. Ook zijn de ontwikkelingen in vormgeving en gebruik van websi tes eruit af te lezen. Overzicht initiatieven webarchivering PRO: www.pro.gov.uk/recordsmanagement/eros/wph- site_toolkit.pdf Minerva Library of Congres: www.loc.gov/minerva Pandora NLA: http://pandora.nla.gov.au Policy and Guidelines NAA: www.naa.gov.au/recordkeeping/er/web records/intro.html The Internet Archive www.archive.org Kulturarw3 Sveriges nationalbibliotek: www.kb.se/kw3/ENG/Default.htm Archipol Documentatiecentrum Nederlandse Politieke Partijen en Bibliotheek Rijksuniversiteit Groningen: www.archipol.nl Smithsonian Institution Archives www.si.edu/archives/dollar%20report.html NARA: www.archives.gov/records management AO LA Nationale bibliotheek Oostenrijk: www.onb.ac.at Universiteit: www.if5.tuwien.ac.at/~anla/ DAVID Stadsarchief Antwerpen: www.antwerpen.be/david archievenblad mei 2003 Website als instrument van het overheids handelen Websites blijvend beschikbaar Erika Hokke werkt als onderzoeker en docent bij de Archiefschool. De Archiefschool organiseert een symposium over archivering van websites op 12 juni a.s. Voor meer informatie zie www.archiefschool.nl. 1. Archievenblad (maart 2003) p. 7. 2. De Archiefschool heeft in 2002 onderzoek gedaan naar deze vraag. Aanleiding voor dit onderzoek was de vraag van het ministerie van Verkeer en Waterstaat of de websites van het ministerie archiefbescheiden zijn in de zin van de Archiefwet 1995 en, zo ja, hoe de archivering van deze websites van het ministerie dan vormgegeven kan worden. Het onderzoek heeft geresulteerd in een onderzoeksrapport Blijvend beschikbaar en een imple mentatieadvies Naar archivering van websites. 3. Verder hebben het gemeentearchief Amsterdam, de Koninklijke Bibliotheek en het ministerie van Verkeer en Waterstaat plannen in verschillende stadia om over te gaan tot archivering van websites. 4. Zie bijvoorbeeld de publicaties van Minerva, via www.loc.gov/minerva. 5. Het streven is dat in 2003 ruim eenderde van alle diensten van overheidsinstanties elektronisch wordt afgehandeld en dat een kwart van de beleidsmakende instanties een website met interactieve beleidsvormings instrumenten heeft. Zie de begroting ministerie van BZK voor 2003. Geraadpleegd op 14-10-2002 via www.minbzk.nl. 6. Een analyse van de relatie tussen processen en web sites was onderdeel 58 van het onderzoek dat de Archiefschool heeft uitgevoerd voor het ministerie van Verkeer en Waterstaat, (zie noot 3). 7. Theo Thomassen, 'Een korte introductie in de archi- vistiek' in: Paradigma. Naar een nieuw paradigma in de archivistiek. (Stichting Archiefpublicaties, Jaarboek 1999) p. 11 - 12.

Periodiekviewer Koninklijke Vereniging van Archivarissen

Archievenblad | 2003 | | pagina 14