Wat te doen met tienmiljoen gegevens?
Ontsluiting van archieven en collecties met behulpvan ScopeArchive
de praktijk
de praktijk
30
r-"—
31
M E# S5»W SïjUh lo £ocOfd» Took Sfeail la
\Mxj
aj I nl».|[iTm|a| raj
J <LJ
Betwwi BuLamaccN
1 BOEKHOUDING
2 PROCESSEN EN GESCHIUEH
3 DIVERSEN
4 zakelijke correspondentie
i41 ALGEMEEN
4 2 NEDERLAND EN KOLONIËN
4 3 BELGIE
4 5 DUITSLAND
46 ENGELAND
4 7 FRANKRUK
48 ITAUE
3 44 1 ANCONA
Cj 518 C«ttnr. Bemad 1680-1682.16
Cl 519 Feta. Gio Ban
Cl 520 Neirtim Go Pieiro
Cl 521 Giovaneft. Diego
3 bassano
3 V BOLZANO
Cl 536 Ciwei Mati»
Cl 537 Men.- G«<90 1684 1690 67 Hu
<5 538 M«e*.Ani«»
"I 4 85 BRESCIA
94 86 CHIETI
9 4 8.7 CREMONA
g-1 :i:j FLORENCE
C1 543 Cad. Jacopo
544 Meucci. Artor«o. en Meocci en G
Cl 545 T all. Vncenfo
a 4 89 FOLIGNO
S4810 GENUA
34811 UVORNO
£j4BI2 MANTUA
Door Frans Smit*
In het Gemeentearchief Amsterdam (GAA) zijn naar
schatting tien miljoen ontsluitinggegevens aanwe
zig op informatiedragers als systeemkaartjes, typo
scripten, gedrukte catalogi en inventarissen, klap
pers, tekstverwerkingsbestanden en databases. Al
die gegevens zijn vervaardigd om de toegankelijk
heid van onze archieven en collecties te bevorde
ren. Zij zijn gedurende decennia met toewijding
samengesteld door archivisten, bibliothecarissen,
kunsthistorici en indiceerders.
De gegevens zelf zijn echter al vaak moeilijk toe
gankelijk, laat staan dat zij optimaal het doel
kunnen dienen waarvoor ze zijn gemaakt. Tel
daarbij op dat we de ambitie hebben om onze
klanten een zo eenvoudig mogelijke zoekmoge
lijkheid aan te bieden. Hoog tijd dus voor een
grondige verandering van het gegevensbeheer en
van de organisatie van het ontsluiten van archie
ven en collecties bij GAA. Een reeks projecten
ging van start. In dit artikel wordt het project
Implementatie ScopeArchive beschreven.
Het project kon pas verantwoord starten nadat
een aantal uitgangspunten was geformuleerd en
de middelen aanwezig waren om de resultaten
te kunnen berei-
Corrpleled
Completed
Completed
1685 1687
Comcfeted
Completed
1681 1685
1685 1686
Compieted
Completed
Comoleted
f
In een boomstructuur zijn zowel de
context als de inhoud van de ontsluitings-
gegevens makkelijk raadpleegbaar.
ken. Het grondbe
ginsel is de norm
van vraaggericht
heid van ontslui
tinggegevens. Zij
moeten de meest
voorkomende zoek
vragen - vragen
naar het wie, wat,
waar en wanneer
(WWWW) - af
doende kunnen be
antwoorden.
Integratie van ont
sluitinggegevens
speelt daarbij een
essentiële rol. Met deze integratie wordt beoogd
dat het publiek in alle archieven en collecties
tegelijk het antwoord op een WWWW-vraag kan
vinden. Standaardisatie is dan uiteraard een
noodzaak. Uitgegaan moet worden van één inte
grale verzameling WWWW-zoekgegevens.
Drie probleemgebieden
De analyse die volgde op de bepaling van de
uitgangspunten leidde tot de vaststelling dat er
drie centrale probleemgebieden waren. Aller
eerst ontbrak zowel een concept als een struc
tuur voor een adequaat informatiemanagement.
Ten tweede waren de gegevens zelf een groot
archievenblad november 2003
probleem: de kwaliteit is zeer divers en ze zijn
aanwezig op zeer verschillende informatiedra
gers. Ten derde ontbraken een goed systeem en
een goede organisatie voor samenstelling en
beheer van de gegevens.
Voor de ontwikkeling van een adequaat concept
voor informatiemanagement was het nodig om
buiten de gebaande paden van de cultureelerf-
goed-wereld te gaan. Geen van de traditionele
disciplines biedt een werkelijk bruikbaar per
spectief op de publieksgerichte integratie van
ontsluitinggegevens. Bestaande informatie
managementconcepten boden uitkomst. GAA
kan worden gezien als één groot Data Ware
house. Dit Historisch Data Warehouse wordt
toegankelijk en beheersbaar gemaakt door meta
data. Formele en inhoudelijke beschrijvingen
zijn metadata. Zij hebben per objectsoort en
ontsluitingsmethode (museaal, archivistisch,
bibliotheek) een verschillend karakter en een
verschillende structuur. Maar de overeenkom
sten zijn veel groter dan de verschillen.
Op basis van dit concept konden een adequate
informatiearchitectuur en een logisch samen
hangend datamodel worden ontwikkeld. Daarin
komen zowel de samenhang als de diversiteit
van de ontsluitinggegevens tot hun recht. Een
centraal thema in de informatiearchitectuur is
de paradox van flexibiliteit en rigiditeit. Het
beheer en de samenstelling moet zo rigide
mogelijk, dat wil zeggen uniform en geïnte
greerd, in één database-omgeving uitgevoerd
worden. De beschikbaarstelling van gegevens
moet echter zo flexibel mogelijk worden ge
maakt. Dit kan door redundantie van metadata
te vermijden. Een gegeven dat in een goede en
geïntegreerde structuur op één plek wordt
bewaard, kan vervolgens op oneindig veel ver
schillende wijzen en in verschillende samen
hangen worden gepresenteerd op bijvoorbeeld
websites en in publicaties. Dit kan bijvoorbeeld
door het gebruiken van standaarden als Dublin
Core, EAD, ISAD(G) en ISAAR(CPF) en met
behulp van bestandsstructuren als XML.
Het tweede grote probleem, de kwaliteit van de
gegevens en de diversiteit van informatiedra
gers, leidde tot de noodzaak van normering van
ontsluitinggegevens en een aantal conversietra
jecten. Het is daarbij nodig erg te letten op haal
baarheid. Soms moet je je zegeningen tellen en
accepteren dat je niet het hele verleden kunt
rechttrekken. Het bleek het meest praktisch om
alle gegevens direct te converteren en kwaliteits
zorg uit te voeren in het nieuwe systeem.
Bovendien moet een goede balans worden
:ti-iT-r-ris
gevonden tussen kwaliteit en kwantiteit.
Je kunt niet alles zo diep mogelijk ont
sluiten als de specialist wel wil (vaak op
goede inhoudelijke gronden overigens).
Het derde probleem was al deels opge
vangen door de reorganisatie van GAA.
Door die reorganisatie werd het ontslui
ten van alle archieven en collecties in
één sectie geconcentreerd zodat alle ont
sluitingsdisciplines onder één dak zijn
gebracht. Een goede geautomatiseerde
ondersteuning van integratie en stan
daardisatie ontbrak echter totaal. Voor
iedere ontsluitingsdiscipline was een
apart systeem aanwezig. De connectivi-
teit van deze systemen was voor een inte
graal beheer van gegevens echter veel te
zwak. Bovendien bleek het databaseplat
form van enkele van deze systemen niet
te voldoen aan eisen met betrekking tot
beveiliging en openheid. Een oplossing
werd gevonden in het Zwitserse systeem
ScopeArchive dat GAA als eerste instel
ling in Nederland aanschafte.
ScopeArchive
Het project Implementatie Scope
Archive heeft als doel om in 2003 en
2004 ontsluitinggegevens over archieven
en collecties te integreren. Conversies en
data-entrytrajecten voor indices vallen
vooralsnog buiten het project. Door de
aanwezigheid van ScopeArchive zijn ech
ter de middelen aanwezig om deze gege
vens in de komende jaren succesvol te
integreren. Parallelle projectdoelen zijn
de samenstelling van procedures voor
het ontsluiten van archieven en collec
ties, de vervaardiging van handleidingen
voor standaardisering van ontsluitings-
gegevens, gebruik en beheer van Scope
Archive, het opleiden van gebruikers en
het opzetten van een goed beheer van
zowel de gegevens als het systeem. Het
project is gefaseerd naar de afschaffing
van bestaande systemen. In het voorjaar
van 2003 zijn archiefontsluitinggegevens
in ScopeArchive geïntegreerd, in de
zomer zijn de gegevens op het niveau
van archiefvormers, collectiesamenstel
lers, archiefblokken en collecties in het
systeem opgenomen en in het najaar zul
len de bibliotheekgegevens worden
geconverteerd. In 2004 wordt het traject
afgesloten door de conversie van ontslui
tinggegevens over beeldmateriaal en
Pfictxós look Spao^IaH-j
Bj Slttl T' |P|> I
ESEuSai
audiovisueel materiaal. In iedere stap
worden de aanwezige WWWW-gegevens
geïntegreerd, gestandaardiseerd en aan
gevuld. En bij iedere stap wordt ervoor
gezorgd dat de beheergegevens van de
betreffende archieven en collecties in
ABS-Archeion volledig gesynchroniseerd
worden met de ontsluitinggegevens in
ScopeArchive (en vice versa). Iedere
geslaagde conversie betekent dat de
betrokken medewerkers voortaan in
ScopeArchive hun ontsluitinggegevens
invoeren, beheren en controleren.
De keuze van een systeem moet nooit het
vertrekpunt zijn voor een veranderings
traject. Het is de consequentie ervan. De
keuze voor ScopeArchive was voor GAA
het logische uitvloeisel van de beleidsbe
paling. Sindsdien is het systeem de kata
lysator voor de realisatie van de verande
ringen. De redenen om voor Scope
Archive te kiezen zijn verlerlei. Allereerst
is het een systeem dat gebaseerd is op een
betrouwbaar en open
databaseplatform
(ORACLE). De object
georiënteerde database
structuur is zeer trans
parant zodat het sys
teem 'onder de motor
kap' goed inzichtelijk
is. Het systeem biedt
de mogelijkheid om
zelf een gegevensstruc
tuur, met gegevensele-
menten en relaties, in
te richten. Wijzigingen
in die structuur kun
nen zelf worden uitge
voerd zonder dat de
leverancier onderhoud aan het systeem
moet plegen. Het is mogelijk om in
archieven en collecties verschillende
invoerformaten te gebruiken voor object
soorten en de context van het archief of
de collectie intact te laten. Het is geen
probleem om invoerformaten te definië
ren die bijvoorbeeld gebaseerd zijn op
archiefstandaarden als ISAD(G) en biblio
theekstandaarden als ISBD. WWWW-
gegevens en andere gestandaardiseerde
ondersteunende gegevens (denk aan bij
voorbeeld thesauri voor objectsoorten,
technieken en materialen) kunnen cen
traal worden onderhouden. Het systeem
valt uitstekend te autoriseren waardoor
de gegevens goed beveiligd worden. Het
doorslaggevende argument was dat
ScopeArchive zeer gebruikersvriendelijk is
en een mooie en herkenbare (grotendeels
zelf te bepalen) interface heeft.
Het integreren van de ontsluitinggegevens
is niet bepaald een snelle sprint langs een
juichende massa. Quick-wins zijn er niet.
Het valt zelfs ten zeerste af te raden daar
naar te streven. Het karakter is meer dat
van een lange mars. Maar dan wel één in
een rechte lijn naar een vastomlijnd doel.
Tijdens die mars doe je allerlei ervaringen
op. Zo is het bijvoorbeeld duidelijk gewor
den dat je een dergelijke route pas kunt
starten als een duidelijk en goed beleid is
vastgesteld. En aan de mars moeten men
sen deelnemen die verschillende experti
ses in één hechte projectgroep integreren.
Archivisten, bibliothecarissen en kunst-
In de descriptormodule is bijvoorbeeld een thesaurus
makkelijk raadpleegbaar.
;j*lèirv_7j gja '\-=M "1<M»I jg|
d
3
d
d
t Oecaptfen I OfceKH Addmnal Into
historici zijn onmisbaar. Even belangrijk is
echter de aanwezigheid van expertise op
het gebied van informatiemanagement,
databasebeheer, applicatiebeheer en gege
vensbeheer. Als die kennisgebieden zijn
verzameld en elkaar aanvullen dan is het
project een succes. De continuïteit van de
projectresultaten is dan bovendien
gewaarborgd. Mijn ervaring is dat zij
samen prima op weg naar de eindstreep
kunnen gaan. Op die eindstreep zijn die
tien miljoen gegevens integraal te door
zoeken.
Frans Smit is hoofd van de sectie Ontsluiting bij het
Gemeentearchief Amsterdam.
november 2003
archievenblad