De eerste keer doet altijd pijn:
ervaringen met een overgebrachi digitaal archief
Hl
I
üilll
ml
c
G
J||
II I
ril
r-'ï'
de praktijk
de praktijk
Dat tussenvoegsel 'straks' zal, misschien,
niet iedereen in het vakgebied geheel
onwelkom zijn. Voor het Gemeente
archief Amsterdam kan het inmiddels
worden weggelaten. Het gemeentelijke
projectbureau Jaar 2000 leverde na
opheffing zijn archief aan: elf meter ord
ners en... negen cd's. Voor deze speciale
gelegenheid werd afgesproken dat dit
materiaal door het Gemeentearchief zou
worden bewerkt en voor overbrenging
gereedgemaakt. Deze operatie zal hier
niet uitputtend worden beschreven en
leverde, uiteraard, geen pasklare oplos
singen voor de digitale problematiek. Als
waarschuwing echter staat het belang
ervan voor archiefdienst en archiefvor
mers in Amsterdam en voor die in andere
gemeenten buiten kijf.
Projectbureau Jaar 2000 werd in
1998 door het College van B&W in het
leven geroepen om de millenniumover
gang in Amsterdam in goede banen te
leiden. Belangrijke activiteiten waren het
inventariseren van de (millenniumbe
stendigheid van) de hard- en software die
binnen de gemeente werd gebruikt, het
rapporteren daarover aan het gemeente
bestuur en het realiseren van interne en
externe communicatie over de problema
tiek. Bij de uitvoering van deze taken
speelden digitale instrumenten een
belangrijke rol, hetgeen in het archief
van de organisatie zou moeten worden
teruggevonden. Hoe werden verzamelde
gegevens in de database opgeslagen? Hoe
zag de powerpointpresentatie eruit waar
mee de wethouder op het gevaar van de
millenniumbug werd gewezen? Hoe
werkte de website die werd ingezet om
burgers en bestuurders voor te lichten?
Deze vragen kunnen gedeeltelijk met
behulp van documentatie (indien aanwe
zig) worden beantwoord, maar raadple
ging van het digitale document zelf
werkt veel inzichtelijker en aanschouwe
lijker.
Na opheffing van het bureau was ver
vroegde overbrenging van het gevormde
archief aan de orde. Het papieren gedeel
te was al redelijk geordend. Het werd
zonder veel moeite geschoond, beschre
ven en materieel verzorgd: business as
usual.
Een eerste, zeer grove inventarisatie van
de cd's daarentegen leverde direct hoofd
brekens op. Al bij het maken van een
back-up gaf het antivirusprogramma een
foutmelding. De ICT-afdeling kon de
betreffende cd gelukkig 'ontsmetten'
zonder de integriteit van de bestanden
aan te tasten. Een ernstiger probleem
vormde de structuur waarin de informa
tie werd aangeboden. De inhoud van
gezamenlijke en individuele werkstations
was rechtstreeks op cd gebrand, in map
penstructuren die maar ten dele verwe
zen naar de structuur van het papieren
archief. Wat stond er nu op die cd's, en
wat zat in de ordners? Was dit Word
document ooit als brief verstuurd? Met
welk doel was dit rekenblad aangemaakt?
Bij welke bijeenkomst werd deze foto
geschoten? En welk programma heb ik
nodig om dit bestand te openen? Veelal
ontbraken hierover de benodigde gege
vens: de context- en metagegevens, de
metadata.
Vastlegging van de relatie van digita
le archiefbestanden met de hard- en soft
ware waarmee ze zijn geproduceerd is bij
digitale archivering onontbeerlijk. Zon
der informatie over de context waarin ze
zijn ontvangen of opgemaakt worden
elektronische bescheiden al snel moeilijk
interpreteerbaar. De inhoudelijke con
text kan in veel gevallen worden aange
bracht door, zo vroeg mogelijk in het te
administreren proces, elektronische dos
siers te vormen en die, evenals de docu
menten die erin worden opgeslagen, van
duidelijke inhoudsomschrijvingen te
voorzien. Elektronisch archiefmateriaal
kan dan, bij goede afspraken over onder
andere versiebeheer en status, op directo-
ryniveau worden beoordeeld. In directo
ries als 'E-mail' of 'diversen' (zoals we die
in dit archief aantroffen) weet je niet wat
je tegenkomt, zeker niet als de documen
ten erin namen krijgen als '3e concept',
'Adam II' of 'ATT01368' (zie de illustra
tie). De documenten in zo'n directory
moesten daarom stuk voor stuk worden
geopend en bekeken. Een arbeidsinten
sieve en dus kostbare aangelegenheid.
Het gebrek aan structuur en het ontbre
ken van duidelijke en door ons interpre
teerbare metadata vormden de kern van
de problemen waarmee we werden
geconfronteerd, in onze pogingen dit
archief voor overbrenging naar het 'digi
taal depot' gereed te maken. Het Ge
meentearchief Amsterdam werkt aan de
inrichting van een 'digitaal depot': een
voorziening om digitale archiefbestan
den te kunnen ontvangen, beheren en
beschikbaar stellen.
Alleen al het globaal in kaart bren
gen van de inhoud van de cd's nam, om
genoemde redenen, maar liefst een week
in beslag. Daarna kon de conclusie wor
den getrokken dat waardering van de
bestanden soms op cd-niveau mogelijk
was, soms op directoryniveau en soms
alleen op documentniveau, afhankelijk
van de wijze waarop directories waren
ingedeeld en benoemd. Daarbij hadden
we te maken met een grote diversiteit
aan programma's en bestanden: Word
en WordPerfect-documenten, e-mailbe-
richten, internetsites, databases, spreads
heets, powerpointpresentaties, foto's in
JPEG-formaat en andere JPEG-bestanden
zoals logo's en informatiekaarten. Zelfs
een computerspel was ingezet om
Amsterdam op de millenniumwisseling
voor te bereiden. We stelden een plan
van aanpak op waarin we per bestand
soort acties formuleerden. Probleem was
daarbij, dat moeilijk was in te schatten
hoeveel tijd de uitvoering van de werk
zaamheden zou kosten: er was immers
nog geen ervaring mee opgedaan.
Bovendien deden zich regelmatig onver
wachte problemen voor.
Ten aanzien van de tekstbestanden,
waaronder zowel Word- en WordPerfect-
bestanden werden begrepen als e-mailbe-
richten en gescande brieven en rappor
ten, hanteerden we als uitgangspunt dat
de digitale bestanden als aanvulling zou
den dienen op het papieren archief, dat
dus het papieren archief 'leidend' zou
zijn. De meerwaarde van papieren stuk
ken ten opzichte van eventuele digitale
versies was gelegen in het element van
authenticiteit. Daarnaast was er het prak
tische feit dat het papieren archief reeds
was geïnventariseerd. Van de tekstbe
standen moest dus worden nagegaan of
ze reeds in het papieren archief aanwezig
waren. Als dat het geval bleek werd de
digitale versie niet benut. Als dat niet het
geval bleek werd, als het om een te bewa
ren stuk ging, een uitdraai aan het papie
ren archief toegevoegd.
De cd's moesten dus worden doorzocht
op te bewaren documenten, waarvan
vervolgens moest worden vastgesteld of
ze al in het papieren archief aanwezig
waren. De inventaris van het papieren
archief en het verslag van de eerste
inventarisatie van de cd's dienden hierbij
als hulpmiddel. Dat nam niet weg dat,
door de wijze waarop de documenten
waren opgeslagen en benoemd, een
groot deel van de bestandjes moest wor
den geopend en bekeken. Zoals vermeld
was het daarbij vaak uitermate moeilijk
om te bepalen met wat voor document
we van doen hadden. Was dit in Word
opgemaakte stuk een definitieve versie?
Was die ook als brief verstuurd? Of ging
het om een concept? Een concept waar
van precies? Versies van hetzelfde tekst
bestand konden worden aangetroffen in
verschillende directories en zelfs op ver
schillende cd's. Een Word-document kon
zijn opgesteld als onderdeel van de web
site van het bureau, zonder dat dit werd
aangegeven. Pas na geruime tijd en na
vele malen het papieren archief te zijn
ingedoken, konden documenten sneller
worden 'geplaatst.' Deze werkwijze bleek
in de praktijk zeer arbeidsintensief: het
ging immers om duizenden bestanden.
Andere opties werden overwogen: alle
tekstbestanden in een grote 'bak' gooien
en met diverse sorteerfuncties het kaf
van het (mogelijke) koren scheiden. Dit
bleek niet effectief, omdat de structuur
die hier en daar nog wel aanwezig was zo
zou verdwijnen. Op mapniveau bewees
de sorteerfunctie overigens wel goede
diensten. 'Veelbelovende' directories
werden op deze manier steekproefsgewijs
doorzocht. Daarnaast werd gebruik
gemaakt van enkele zoekmachines, waar-
bij zoekargumenten werden ingegeven
door de wettelijke taken en activiteiten
van het projectbureau. Op deze manier
kon het archief toch vrij grondig worden
bewerkt. Resultaat: vrijwel alle tekstbe
standen in het digitale archief zaten al in
het papieren archief óf kwamen om
andere redenen niet voor bewaring in
aanmerking. Maar omdat dit niet voor
alle documenten gold (zoals voor het
externe communicatieplan en stukken
betreffende de organisatie van een bij
eenkomst voor Turkse ondernemers) had
deze actie niet achterwege mogen blij
ven.
Van de andere bestandsoorten was duide
lijk dat, als we zouden besluiten ze te
bewaren, dat digitaal zou moeten gebeu
ren. Digitale bestanden als powerpoint
presentaties en databases kunnen wor
den uitgeprint, maar verliezen dan
enorm aan functionaliteit. Bij websites
als die van Jaar 2000, met geluidsfrag
menten en animaties, achtten wij een
dergelijk verlies aan functionaliteit onac
ceptabel. Deze bestanden moesten dus
in digitale vorm worden geselecteerd en
herordend, waartoe de cd's werden geko
pieerd naar een netwerkschijf.
De problematiek van het (al of niet)
archiveren van websites staat in Neder
land nog maar kort in de belangstelling,
dus teruggrijpen op bevindingen van
anderen was slechts in zeer beperkte
mate mogelijk. In dit geval had de websi
te zo'n belangrijke rol gespeeld in kernta
ken van het projectbureau (voorlichting,
communicatie) dat we besloten de eerste
en laatste versie compleet te bewaren.
Voor enkele tussenliggende versies,
namelijk de updates waarbij veel meer of
andere informatie aan de site werd toege
voegd, en die dus een wezenlijke veran
dering betekenden, gold hetzelfde. Op de
cd's was echter maar één complete site
aanwezig, plus 33 updates daarvan. Deze
bestanden waren als zip-file op schijf
gezet en moesten eerst worden uitgepakt.
Vervolgens moesten we aan de enige
complete versie die we hadden de upda
tes toevoegen, aan de zo ontstane nieu
were versie weer de volgende update, tot
aan een hopelijk werkende versie 33. Een
actie die niet alleen veel tijd, maar ook
ruimte in beslag nam. Stonden er oor
spronkelijk 299 webbestanden op het
netwerk, van in totaal 27,9 Mb groot, na
uitpakken waren dat er 2967 met een
totale omvang van 70,6 Mb, en na het
updaten 32.874 van 370 Mb!
Het resultaat pakte niet geheel bevredi
gend uit: niet alle onderdelen van de site
functioneerden. Bovendien bleek de oud
ste versie waarover wij beschikten niet de
eerste versie van de website te zijn, een
gegeven dat uit een metadataset direct
zou zijn gebleken. Uiteindelijk hebben
we contact gezocht met de bouwer van
de website, in dit geval een klein com
mercieel ontwerpbureau. Dat voorzag
ons van de eerste versie van de site, en
van een werkende laatste versie. Door de
korte periode tussen het ontwerp van de
website en de overbrenging ervan naar
het Gemeentearchief was dit vruchtbare
contact mogelijk. Evengoed verdwenen
in diezelfde korte periode veel vergelijk
bare ICT-bedrijfjes van de aardbodem; en
wie vertelt een archivaris dan nog iets
over de website die door zo'n bedrijf is
gebouwd maar, ook na veel gemopper en
erger, onmogelijk aan de praat te krijgen
is? Mede naar aanleiding van deze erva
ringen wil het Gemeentearchief Amster-
iDfl
1
14
15
i'l ij
f i 1
I
f j 11
m
Door Marcel van Dijk*
De overheid digitaliseert en de archiefwe
reld ondervindt er de veelbesproken gevol
gen van. Binnen overheidsorganisaties is de
documentaire informatievoorziening en
daarmee de goede, geordende en toeganke
lijke staat van archiefbescheiden, aan zware
digitale turbulentie en onzekerheid onder
hevig. Hoe waarborgen we in een elektroni
sche omgeving de belangen van bedrijfs
voering en verantwoording? En: hoe gaat
straks de overdracht van digitale bestanden
naar archiefbewaarplaatsen in zijn werk?
Projectbureau jaar 2000
r Projectbureau Jaar 2000 jp"'
t>« bewailing van aan digitaal archief
Een bestand van één van de subdirectories
van één van de directories van één van de cd's
Email
3kB HTML ClotTOTwm
2I»8 Tefccuiocumert
Metadata
Plan van aanpak
Tekstbestanden
Digital e archieven
Spreadshékts4"^'
■3 leuldocunert
2tB leksidocunerf
Email
Q0UHM
11» de |C si
esrtlïihe
Po wérhöi It Mïi*ëSe n t a t i 0
Ar^ref Mqwr 2000
J- besefcn
Databases
Powerpoi """'Srimn»)
presentatio
PfftfloV™-
Grcüröd- 'Graphics
plans S'! yj
Tools
Internetsites
archievenblad
augustus 2002
augustus 2002
archievenblad
r 1