De Haagse informatieschil en de
OMKERING VAN DE
webzijdelings
Archiefinstellingen zijn tot op zekere
hoogte vergelijkbaar met ijsbergen: 90 pro
cent van hun collectie blijft verborgen.
Alle prestaties op het gebied van ontslui
ting en educatie hebben dat niet kunnen
veranderen. Internet kan dat wel. Archie
ven hebben van alle culturele instellingen
het meest te winnen bij internet. Er zijn
geen culturele instellingen die over verge
lijkbare hoeveelheden 'content' beschik
ken. Met behulp van internet zijn we in
beginsel in staat de ijsbergratio om te
keren: 90 procent wordt zichtbaar. Dat
vergt wel grote investeringen. De Raad
voor Cultuur adviseerde er 200 miljoen
gulden voor uit te trekken. Investeringen
in on-lineontsluiting van bronnen bij
archiefinstellingen leveren dan ook een
formidabel rendement op. In verschillen
de projecten - genealogische en historische
fotodatabases - is het gebruik van archie
ven met meer dan 1000 procent gestegen.
En er is meer winst te halen.
Eén van de sterke punten van archief
instellingen is, dat ze 'content' verenigen
met 'context'. Die context zit deels in de
samenhang van de informatie, maar tege
lijkertijd bouwt de onderzoeker nieuwe
context op door verschillende collecties op
hetzelfde onderwerp te doorzoeken.
Archiefinstellingen verlichten het arbeids
intensieve zoeken van de onderzoeker. In
beginsel zijn daar twee manieren voor: het
verrijken van informatie of het integraal
ontsluiten van de informatie. Het verrij
ken van informatie doen we met bronnen
publicaties, onderzoeksgidsen, brochures,
tentoonstellingen e.d. Een moderne toe
voeging is de educatieve website.
Het integraal ontsluiten van informatie
bleef echter vaak achterwege om techni
sche redenen. Het was onmogelijk om ver
schillende typen informatie als antwoord
op één zoekvraag te geven. De onderzoe
ker moet zijn vraag telkens weer opnieuw
stellen: bij het raadplegen van inventaris
sen, van boeken, van bidprentjes, van
genealogische toegangen, van foto's, van
prenten en tekeningen etc. In kort bestek
is het overbodig maken daarvan de functie
van de informatieschil: de bezoeker kan
met één vraag op honderdduizenden
objecten in meerdere collecties tegelijk
zoeken.
Bij het ontwerp van een zoekmodel
voor de informatieschil is het bekende
stramien 'wie, wat, waar, wanneer' ge
bruikt. In het predigitale tijdperk hanteer
den we in het archiefwezen al dit rijtje,
omdat het de meeste vragen dekte. Het rij
tje zoekvelden is door ons uitgebreid met
'waarover'. Het zoekmodel is 'Archimedes'
gedoopt.
Wie staat voor persoonsnamen. De 'wie'-
vraag kan ingeperkt worden tot uitsluitend
makers (auteurs, fotografen, archiefvor
mers e.d.).
Wat staat voor soort collectie: om te begin
nen foto's, prenten en tekeningen, affi
ches, boeken, tijdschriften, audiovisueel
materiaal en archieven. Het aantal collec
ties zal de komende jaren worden uitge
breid (straatnamen, bouwvergunningen,
genealogie e.d.).
Waar staat voor een geografische aandui
ding (plaatsnaam, straatnaam e.d.).
Wanneer maakt het mogelijk de zoekvraag
in de tijd in te perken.
Waarover staat voor een onderwerpsaan-
duiding.
Als iemand afbeeldingen wil zien van
Willem Drees in de tijd dat hij lid was van
de Haagse gemeenteraad (1913-1941), dan
zal hij in het wie-veld 'Drees' invullen, in
het wat-veld de collecties aanvinken die
afbeeldingen opleveren en in het wanneer-
veld de datumbegrenzing 1912-1942 in
vullen. Wil hij daarentegen alle beschikba
re informatie over Drees uit die periode,
dan kiest hij in het wat-veld voor 'alle col
lecties'.
De zoekresultaten (Eureka!) worden op een
voor internet gebruikelijke wijze gepresen
teerd. De zoekvraag wordt herhaald en per
collectie wordt aangegeven hoeveel gevon
den objecten er zijn. Per collectie kan wor
den gebladerd om snel de relevantie van
de zoekresultaten te kunnen bepalen.
Desgewenst kan men naar een webapplica
tie van een collectie doorklikken. Dat is
een kwaliteitskeuze. De zoekfunctionaliteit
van de afzonderlijke webapplicaties is
namelijk groter dan de zoekfunctionaliteit
van Archimedes.
De informatieschil geeft weliswaar
toegang tot een enorm datawarehouse,
maar het publiek zal ook snel leren dat de
informatieschil niet alles oplost. Wat gele
verd wordt is een selectie uit de beschrij
vingen van objecten (archiefstukken, boe
ken, foto's e.d.). Het uiteindelijke zoekre
sultaat kan dus nooit verder gaan, dan de
informatie in de onderliggende databases
mogelijk maakt. Dat geldt zowel kwantita
tief als kwalitatief. Het aantal objecten is
bij de start van Archimedes - medio 2002 -
als volgt:
110.000 foto's
10.000 prenten en tekeningen
1.100 affiches
70.000 monografieën
2.500 tijdschriften
7.500 audiovisuele objecten
1100 inventarissen (enkele honderddui
zenden beschrijvingen)
Dit bestand zal nog belangrijk worden uit
gebreid. De informatie kan uitsluitend
worden geleverd als objectbeschrijvingen.
Er komt op de zoekvraag over Drees dus
geen beknopte biografie over de periode
1913-1941 als resultaat. Dat resultaat kan
wel bereikt worden door informatie te ver
rijken in een historisch-educatieve websi
te, maar niet door middel van de informa
tieschil.
De collecties waarmee we starten,
bevinden zich in drie basissystemen
(Imagefinder, Vubis en Mais). Imagefinder
en Vubis bevatten elk drie collecties, die
ieder een eigen format hebben. De drie
basissystemen zijn ooit afzonderlijk opge
zet en dat leidt tot beperkingen:
er zijn minder persoonsnaamvelden, geo
grafische velden en onderwerpsvelden in
de basissystemen dan we nu graag zouden
zien. Bijvoorbeeld: de auteur Molenaar
staat vermeld in een persoonsnaamveld.
Deze auteur met de naam Molenaar wordt
feilloos opgediept. Wanneer echter op een
willekeurige mijnheer Molenaar wordt
gezocht, zonder de beperking tot maker/
auteur, wordt deze ook gevonden, maar de
30
webzijdelings
zoekresultaten vermelden ook de beroeps
aanduiding molenaar. Deze 'ruis' in de
zoekresultaten vind je ook bij de 'waar-vra
gen' en de 'waarover-vragen'. Niet alleen
qua presentatie, maar ook qua zoekop-
brengst lijkt het resultatenscherm dus erg
op het normale internetresultaatscherm.
Het op de koop toenemen van deze ruis
was één van de belangrijkste knopen die
moesten worden doorgehakt. Er wordt
nog onderzocht in hoeverre de ruis naar de
achtergrond kan worden gedrukt. Een zeer
vergelijkbaar zoekmodel wordt gehanteerd
in www.scran.ac.uk. Dat ook daar geen
één-op-één-relatie bestaat tussen basissys
temen en zoekmodel valt te constateren
door in het datumveld de zoekopdracht
'London' in te voeren. Verrassenderwijs
leidt dit tot een zoekresultaat.
In beginsel zou misschien met minder
velden volstaan kunnen worden. Eén alge
meen veld - waarop Booleaans kan wor
den gezocht - met een datumveld en de
mogelijkheid voor het kiezen van een col
lectie zou kunnen volstaan. Op de home
page van onze website zullen we het zoe
ken in zo'n enkel algemeen veld mogelijk
maken. Toch is het aanbieden van de
andere velden van Archimedes als uitge
breid zoekscherm nuttig. Allereerst wordt
het zoeken preciezer wanneer de basissys
temen velden bevatten die aansluiten bij
de velden van Archimedes. Bovendien is
het mogelijk om de bestaande basissyste
men nader aan te laten sluiten op het
zoekmodel. De afweging of die inspanning
voldoende rendement oplevert, zal in een
later stadium worden gemaakt. In de twee
de plaats zal bij de opzet van nieuwe data
bases rekening gehouden kunnen worden
met het zoekmodel.
De belangrijkste stap die we als instel
ling moesten maken bij het realiseren van
de informatieschil was het ontwerpen van
het zoekmodel Archimedes, het vaststellen
van de velden in de databases die vanuit
het zoekmodel worden doorzocht en het
vaststellen hoe de zoekresultaten moesten
worden gepresenteerd.
Daarnaast moet er een
enorme berg werk wor
den verzet, wat we uit
eindelijk toch hadden
moeten doen als we geen informatieschil
hadden gewild, maar wat nu versneld
wordt uitgevoerd. Een resumé:
•beschrijven van affiches en prenten en
tekeningen;
ontwerpen format voor ontsluiten van
affiches, prenten en tekeningen in het
basissysteem;
fotograferen, digitaliseren en inlezen van
affiches, prenten en tekeningen;
regelen auteursrechtelijke aspecten van
on-linepresentatie van het beeldmateri
aal;
controle op een oudere conversie van
boeken en tijdschriften;
scannen, ocr'en en in database opnemen
van alle inventarissen;
ontwerpen van rubrieken op inventaris
niveau;
toevoegen institutionele geschiedenis
aan inventarissen;
hercontrole openbaarheid van alle
inventarisnummers;
•regelen technische voorzieningen en
installeren informatieschil.
Maar de meeste werkzaamheden zijn al in
het verleden gebeurd: alle (generaties)
archivarissen die de archieven hebben ont
sloten, die boeken en foto's en andere col
lectieonderdelen hebben beschreven, heb
ben de basis gelegd voor wat we nu op het
gebied van presentatie en toegankelijkheid
van de collecties kunnen realiseren.
We hadden het onszelf stellig gemakkelij
ker kunnen maken, door niet direct zoveel
collecties on line te willen brengen bij de
introductie van Archimedes. Daar staat
tegenover dat op deze wijze het werkpro
ces zeer vereenvoudigd is: het beschrijven
van alle belangrijke collectieonderdelen
sluit naadloos aan op het on line presente
ren ervan.
Het technisch concept achter Archi
medes is het Thematis platform van de
firma DEVENTit. Daarin wordt een relatie
gelegd tussen de informatieschil en de
door ons aangegeven informatie uit vel
den van de basissystemen. Zogenaamde
'adapters' zorgen ervoor dat wanneer van
uit Archimedes een vraag wordt gesteld,
deze wordt vertaald naar zoekvragen voor
de basissystemen en dat het zoekresultaat
voor de informatieschil wordt opgebouwd.
De mogelijkheid om dergelijke informatie-
schillen te bouwen bestaat nog niet zo
lang. Het Thematis platform voegt aan die
technologie innovatieve elementen toe.
De leverancier heeft bij de ontwikkeling
van zijn concept gedacht vanuit de
behoefte van het archiefveld. Er zijn moge
lijkheden in verwerkt voor het zowel op
grote als kleine schaal inzetten van de
oplossing (schaalbaarheid) als het facilite-
ren van kleine archiefdiensten door grote
en voor het op verschillende locaties aan
wezig zijn van informatiebestanden. Meer
informatie over het Thematis platform is
te vinden op de website van de leverancier:
www.deventit.nl.
Dit past met name goed in het con
cept van regionale historische centra. Deze
hebben een regionaal/provinciaal verzor
gingsgebied, maar in veel gevallen is daar
aan nog onvoldoende invulling gegeven.
Dit concept biedt RHC's de mogelijkheid
om in hun verzorginggebied instellingen
de kans te bieden een integrale stap naar
internet te laten maken, ook wanneer deze
niet beschikken over een website. Ze kun
nen organiseren dat informatie van ar
chiefinstellingen en andere erfgoedinstel
lingen in de provincie integraal doorzoek
baar wordt. De RHC's kunnen in dit con
cept een centrale beheerfunctie hebben,
die het voor de kleinere instellingen
gemakkelijk en betrekkelijk goedkoop
maakt om in te stappen. De prestaties van
de informatieschil worden niet geremd
door de hoeveelheid of de kwaliteit van de
databases. Zoekvragen worden 'tegelijk'
uitgevoerd op de basissystemen en de
zoekresultaten worden verzameld in het
tempo waarin de basissystemen deze kun
nen leveren. Terwijl de gevonden objecten
nog aan het binnenkomen zijn kan de
bezoeker de reeds binnengekomen objec
ten raadplegen, zodat de snelheid niet
wordt bepaald door het 'traagste' basissys
teem. De RHC's gezamenlijk moeten in
staat geacht worden dit concept verder uit
te bouwen tot een landelijk platform.
31
Door Charles Noordam*
Het Haags Gemeentearchief werkt aan een
informatieschil, waarmee zeven collecties
tegelijkertijd doorzocht kunnen worden.
Het concept verenigt traditionele en innovatie
ve elementen en biedt mogelijkheden op het
gebied van schaalbaarheid en samenwerking
met andere instellingen. Met name RHC's
biedt het de mogelijkheid invulling te geven
aan hun regionale taak.
Verrijken en integraal ontsluiten van informatie
Archimedes
Er komt uitsluitend uit, wat erin zit
Heterogene databases
archievenblad
april 2002
i;^®1
De dagelijkse groenmarkt in
Den Haag; links de Venestraat;
rechts van het midden
de Vleeshal (de voormalige
st.-Nicolaaskapel) aan de Grote
Halstraat, Paulus Constantijn la
Fargue 1729-1782) XVIIIc.
Waarom al die velden?
De inspanningen
Technisch concept
Stimulans voor het RHC-concept
Charles Noordam is directeur van het Haags
Gemeentearchief.
april 2002
archievenblad