De eerste keer doet altijd pijn: ervaringen met een overgebrachi digitaal archief Hl I üilll ml c G J|| II I ril r-'ï' de praktijk de praktijk Dat tussenvoegsel 'straks' zal, misschien, niet iedereen in het vakgebied geheel onwelkom zijn. Voor het Gemeente archief Amsterdam kan het inmiddels worden weggelaten. Het gemeentelijke projectbureau Jaar 2000 leverde na opheffing zijn archief aan: elf meter ord ners en... negen cd's. Voor deze speciale gelegenheid werd afgesproken dat dit materiaal door het Gemeentearchief zou worden bewerkt en voor overbrenging gereedgemaakt. Deze operatie zal hier niet uitputtend worden beschreven en leverde, uiteraard, geen pasklare oplos singen voor de digitale problematiek. Als waarschuwing echter staat het belang ervan voor archiefdienst en archiefvor mers in Amsterdam en voor die in andere gemeenten buiten kijf. Projectbureau Jaar 2000 werd in 1998 door het College van B&W in het leven geroepen om de millenniumover gang in Amsterdam in goede banen te leiden. Belangrijke activiteiten waren het inventariseren van de (millenniumbe stendigheid van) de hard- en software die binnen de gemeente werd gebruikt, het rapporteren daarover aan het gemeente bestuur en het realiseren van interne en externe communicatie over de problema tiek. Bij de uitvoering van deze taken speelden digitale instrumenten een belangrijke rol, hetgeen in het archief van de organisatie zou moeten worden teruggevonden. Hoe werden verzamelde gegevens in de database opgeslagen? Hoe zag de powerpointpresentatie eruit waar mee de wethouder op het gevaar van de millenniumbug werd gewezen? Hoe werkte de website die werd ingezet om burgers en bestuurders voor te lichten? Deze vragen kunnen gedeeltelijk met behulp van documentatie (indien aanwe zig) worden beantwoord, maar raadple ging van het digitale document zelf werkt veel inzichtelijker en aanschouwe lijker. Na opheffing van het bureau was ver vroegde overbrenging van het gevormde archief aan de orde. Het papieren gedeel te was al redelijk geordend. Het werd zonder veel moeite geschoond, beschre ven en materieel verzorgd: business as usual. Een eerste, zeer grove inventarisatie van de cd's daarentegen leverde direct hoofd brekens op. Al bij het maken van een back-up gaf het antivirusprogramma een foutmelding. De ICT-afdeling kon de betreffende cd gelukkig 'ontsmetten' zonder de integriteit van de bestanden aan te tasten. Een ernstiger probleem vormde de structuur waarin de informa tie werd aangeboden. De inhoud van gezamenlijke en individuele werkstations was rechtstreeks op cd gebrand, in map penstructuren die maar ten dele verwe zen naar de structuur van het papieren archief. Wat stond er nu op die cd's, en wat zat in de ordners? Was dit Word document ooit als brief verstuurd? Met welk doel was dit rekenblad aangemaakt? Bij welke bijeenkomst werd deze foto geschoten? En welk programma heb ik nodig om dit bestand te openen? Veelal ontbraken hierover de benodigde gege vens: de context- en metagegevens, de metadata. Vastlegging van de relatie van digita le archiefbestanden met de hard- en soft ware waarmee ze zijn geproduceerd is bij digitale archivering onontbeerlijk. Zon der informatie over de context waarin ze zijn ontvangen of opgemaakt worden elektronische bescheiden al snel moeilijk interpreteerbaar. De inhoudelijke con text kan in veel gevallen worden aange bracht door, zo vroeg mogelijk in het te administreren proces, elektronische dos siers te vormen en die, evenals de docu menten die erin worden opgeslagen, van duidelijke inhoudsomschrijvingen te voorzien. Elektronisch archiefmateriaal kan dan, bij goede afspraken over onder andere versiebeheer en status, op directo- ryniveau worden beoordeeld. In directo ries als 'E-mail' of 'diversen' (zoals we die in dit archief aantroffen) weet je niet wat je tegenkomt, zeker niet als de documen ten erin namen krijgen als '3e concept', 'Adam II' of 'ATT01368' (zie de illustra tie). De documenten in zo'n directory moesten daarom stuk voor stuk worden geopend en bekeken. Een arbeidsinten sieve en dus kostbare aangelegenheid. Het gebrek aan structuur en het ontbre ken van duidelijke en door ons interpre teerbare metadata vormden de kern van de problemen waarmee we werden geconfronteerd, in onze pogingen dit archief voor overbrenging naar het 'digi taal depot' gereed te maken. Het Ge meentearchief Amsterdam werkt aan de inrichting van een 'digitaal depot': een voorziening om digitale archiefbestan den te kunnen ontvangen, beheren en beschikbaar stellen. Alleen al het globaal in kaart bren gen van de inhoud van de cd's nam, om genoemde redenen, maar liefst een week in beslag. Daarna kon de conclusie wor den getrokken dat waardering van de bestanden soms op cd-niveau mogelijk was, soms op directoryniveau en soms alleen op documentniveau, afhankelijk van de wijze waarop directories waren ingedeeld en benoemd. Daarbij hadden we te maken met een grote diversiteit aan programma's en bestanden: Word en WordPerfect-documenten, e-mailbe- richten, internetsites, databases, spreads heets, powerpointpresentaties, foto's in JPEG-formaat en andere JPEG-bestanden zoals logo's en informatiekaarten. Zelfs een computerspel was ingezet om Amsterdam op de millenniumwisseling voor te bereiden. We stelden een plan van aanpak op waarin we per bestand soort acties formuleerden. Probleem was daarbij, dat moeilijk was in te schatten hoeveel tijd de uitvoering van de werk zaamheden zou kosten: er was immers nog geen ervaring mee opgedaan. Bovendien deden zich regelmatig onver wachte problemen voor. Ten aanzien van de tekstbestanden, waaronder zowel Word- en WordPerfect- bestanden werden begrepen als e-mailbe- richten en gescande brieven en rappor ten, hanteerden we als uitgangspunt dat de digitale bestanden als aanvulling zou den dienen op het papieren archief, dat dus het papieren archief 'leidend' zou zijn. De meerwaarde van papieren stuk ken ten opzichte van eventuele digitale versies was gelegen in het element van authenticiteit. Daarnaast was er het prak tische feit dat het papieren archief reeds was geïnventariseerd. Van de tekstbe standen moest dus worden nagegaan of ze reeds in het papieren archief aanwezig waren. Als dat het geval bleek werd de digitale versie niet benut. Als dat niet het geval bleek werd, als het om een te bewa ren stuk ging, een uitdraai aan het papie ren archief toegevoegd. De cd's moesten dus worden doorzocht op te bewaren documenten, waarvan vervolgens moest worden vastgesteld of ze al in het papieren archief aanwezig waren. De inventaris van het papieren archief en het verslag van de eerste inventarisatie van de cd's dienden hierbij als hulpmiddel. Dat nam niet weg dat, door de wijze waarop de documenten waren opgeslagen en benoemd, een groot deel van de bestandjes moest wor den geopend en bekeken. Zoals vermeld was het daarbij vaak uitermate moeilijk om te bepalen met wat voor document we van doen hadden. Was dit in Word opgemaakte stuk een definitieve versie? Was die ook als brief verstuurd? Of ging het om een concept? Een concept waar van precies? Versies van hetzelfde tekst bestand konden worden aangetroffen in verschillende directories en zelfs op ver schillende cd's. Een Word-document kon zijn opgesteld als onderdeel van de web site van het bureau, zonder dat dit werd aangegeven. Pas na geruime tijd en na vele malen het papieren archief te zijn ingedoken, konden documenten sneller worden 'geplaatst.' Deze werkwijze bleek in de praktijk zeer arbeidsintensief: het ging immers om duizenden bestanden. Andere opties werden overwogen: alle tekstbestanden in een grote 'bak' gooien en met diverse sorteerfuncties het kaf van het (mogelijke) koren scheiden. Dit bleek niet effectief, omdat de structuur die hier en daar nog wel aanwezig was zo zou verdwijnen. Op mapniveau bewees de sorteerfunctie overigens wel goede diensten. 'Veelbelovende' directories werden op deze manier steekproefsgewijs doorzocht. Daarnaast werd gebruik gemaakt van enkele zoekmachines, waar- bij zoekargumenten werden ingegeven door de wettelijke taken en activiteiten van het projectbureau. Op deze manier kon het archief toch vrij grondig worden bewerkt. Resultaat: vrijwel alle tekstbe standen in het digitale archief zaten al in het papieren archief óf kwamen om andere redenen niet voor bewaring in aanmerking. Maar omdat dit niet voor alle documenten gold (zoals voor het externe communicatieplan en stukken betreffende de organisatie van een bij eenkomst voor Turkse ondernemers) had deze actie niet achterwege mogen blij ven. Van de andere bestandsoorten was duide lijk dat, als we zouden besluiten ze te bewaren, dat digitaal zou moeten gebeu ren. Digitale bestanden als powerpoint presentaties en databases kunnen wor den uitgeprint, maar verliezen dan enorm aan functionaliteit. Bij websites als die van Jaar 2000, met geluidsfrag menten en animaties, achtten wij een dergelijk verlies aan functionaliteit onac ceptabel. Deze bestanden moesten dus in digitale vorm worden geselecteerd en herordend, waartoe de cd's werden geko pieerd naar een netwerkschijf. De problematiek van het (al of niet) archiveren van websites staat in Neder land nog maar kort in de belangstelling, dus teruggrijpen op bevindingen van anderen was slechts in zeer beperkte mate mogelijk. In dit geval had de websi te zo'n belangrijke rol gespeeld in kernta ken van het projectbureau (voorlichting, communicatie) dat we besloten de eerste en laatste versie compleet te bewaren. Voor enkele tussenliggende versies, namelijk de updates waarbij veel meer of andere informatie aan de site werd toege voegd, en die dus een wezenlijke veran dering betekenden, gold hetzelfde. Op de cd's was echter maar één complete site aanwezig, plus 33 updates daarvan. Deze bestanden waren als zip-file op schijf gezet en moesten eerst worden uitgepakt. Vervolgens moesten we aan de enige complete versie die we hadden de upda tes toevoegen, aan de zo ontstane nieu were versie weer de volgende update, tot aan een hopelijk werkende versie 33. Een actie die niet alleen veel tijd, maar ook ruimte in beslag nam. Stonden er oor spronkelijk 299 webbestanden op het netwerk, van in totaal 27,9 Mb groot, na uitpakken waren dat er 2967 met een totale omvang van 70,6 Mb, en na het updaten 32.874 van 370 Mb! Het resultaat pakte niet geheel bevredi gend uit: niet alle onderdelen van de site functioneerden. Bovendien bleek de oud ste versie waarover wij beschikten niet de eerste versie van de website te zijn, een gegeven dat uit een metadataset direct zou zijn gebleken. Uiteindelijk hebben we contact gezocht met de bouwer van de website, in dit geval een klein com mercieel ontwerpbureau. Dat voorzag ons van de eerste versie van de site, en van een werkende laatste versie. Door de korte periode tussen het ontwerp van de website en de overbrenging ervan naar het Gemeentearchief was dit vruchtbare contact mogelijk. Evengoed verdwenen in diezelfde korte periode veel vergelijk bare ICT-bedrijfjes van de aardbodem; en wie vertelt een archivaris dan nog iets over de website die door zo'n bedrijf is gebouwd maar, ook na veel gemopper en erger, onmogelijk aan de praat te krijgen is? Mede naar aanleiding van deze erva ringen wil het Gemeentearchief Amster- iDfl 1 14 15 i'l ij f i 1 I f j 11 m Door Marcel van Dijk* De overheid digitaliseert en de archiefwe reld ondervindt er de veelbesproken gevol gen van. Binnen overheidsorganisaties is de documentaire informatievoorziening en daarmee de goede, geordende en toeganke lijke staat van archiefbescheiden, aan zware digitale turbulentie en onzekerheid onder hevig. Hoe waarborgen we in een elektroni sche omgeving de belangen van bedrijfs voering en verantwoording? En: hoe gaat straks de overdracht van digitale bestanden naar archiefbewaarplaatsen in zijn werk? Projectbureau jaar 2000 r Projectbureau Jaar 2000 jp"' t>« bewailing van aan digitaal archief Een bestand van één van de subdirectories van één van de directories van één van de cd's Email 3kB HTML ClotTOTwm 2I»8 Tefccuiocumert Metadata Plan van aanpak Tekstbestanden Digital e archieven Spreadshékts4"^' ■3 leuldocunert 2tB leksidocunerf Email Q0UHM 11» de |C si esrtlïihe Po wérhöi It Mïi*ëSe n t a t i 0 Ar^ref Mqwr 2000 J- besefcn Databases Powerpoi """'Srimn») presentatio PfftfloV™- Grcüröd- 'Graphics plans S'! yj Tools Internetsites archievenblad augustus 2002 augustus 2002 archievenblad r 1

Periodiekviewer Koninklijke Vereniging van Archivarissen

Archievenblad | 2002 | | pagina 7