Zoeken naar nieuwe wegen
In dit atelier is nagedacht over mogelijkheden om de discrepan
tie tussen de bestaande toegang tot seriearchieven en het
wenselijk geachte digitaal zoeken en vinden met trefwoorden te
overbruggen. Welke middelen kunnen worden ontwikkeld om
het zoeken en vinden in dergelijke archieven te vereenvoudigen?
Is het antwoord dat er meer uitleg gegeven moet worden over
wat deze archieven bevatten en hoe je te werk moet gaan om
iets te kunnen vinden? Extra metadata toekennen? Of is het
wachten op de techniek die het in de toekomst ongetwijfeld
mogelijk zal maken om handschriften te lezen zoals dit nu al kan
door middel van OCR bij gedrukte en getypte teksten? Binnen
projecten als MONK en Transkribus (voor verdere uitleg hierover
zie de bijdrage van Ceciel Huitema en Nico Vriend in deze
bundel) wordt daar onderzoek naar gedaan en de resultaten
worden geleidelijk steeds beter.
Toch is het de vraag of het digitaal kunnen doorzoeken van
de documenten, te beginnen met de indexen en misschien
ooit ook nog weleens van de series besluiten, ingekomen- en
minuten van uitgaande stukken, de ultieme vervanger is van de
bestaande systematiek die gebaseerd is op het werken met
klappers en indexen die door de administratie zijn aangelegd.
Die twijfel is gebaseerd op het feit dat het zoeken met
trefwoorden in een groot corpus van documenten een
fundamenteel andere manier van bevragen is dan het zoeken
met gebruikmaking van de logica waarmee degenen die
indertijd het informatiesysteem hebben ingericht. Het intikken
van een trefwoord en vervolgens zien wat er op het scherm
verschijnt is eigenlijk een heel onbenullige actie. Als het corpus
documenten dat doorzocht kan worden maar groot genoeg is,
zal iedere zoekactie resultaat opleveren. Wat ongewis blijft is
hoe relevant de getoonde documenten zijn ten opzichte van
de ingevoerde term. Ieder woord dat op die manier wordt
gebruikt om te zoeken is in principe gelijk, waardoor zich
onmiddellijk het probleem van te veel of te weinig (relevante)
resultaten voordoet. Googliaans zoeken met trefwoorden richt
zich op gegevens in de documenten terwijl de bestaande
ontsluitingsmechanismen binnen de seriearchieven zich primair
richten op de documenten en pas in tweede instantie op een
zeer beperkte hoeveelheid inhoudelijke gegevens.
De informatiesystemen die we als seriearchieven aanduiden,
zijn door de toenmalige administratie veelal op een hiërarchische
manier ontsloten. Zo zijn de indexen op de verbalen van het
Ministerie van Koloniën gestructureerd aan de hand van
rubriekshoofden, die vanuit het perspectief van het administra
tieve handelen zijn gekozen. De in de index opgenomen
samenvattingen van besluiten zijn vervolgens geklapperd op de
hierin voorkomende (eigen)namen en voor de administratie
relevante termen. Dit hele systeem van metadata in de vorm van
indexen met hun hoofdenlijsten en het meestal voor langere tijd
stabiele format van data van besluiten, data van ingekomen
brieven met de (veelal afgekorte) naam van afzender, samen
vatting van het besluit, de eventuele opmerkingen enerzijds en
de klappers op deze indexen anderzijds, werden bij het
Ministerie van Koloniën op jaarbasis, en toen de administratie
groeide zelfs per half jaar, vervaardigd. Daarmee vormt dit
bestaande metadatasysteem een verfijnd en fijnmazig stelsel om
toegang te krijgen tot de verbalen, al moeten we de kwaliteit
ervan ook weer niet overdrijven. Die was lang niet altijd en overal
even goed. Een structureel probleem bij doelmatig gebruik van
de klappers en indexen over een langere periode vormde ook
toen al de gebondenheid aan jaarlijkse of zelfs halfjaarlijkse
cesuren veroorzaakt door de aanleg van een nieuw register.
Het verbaalstelsel werd in de negentiende eeuw ook het