Schetsboek | 1 januari 2016 | pagina 57 - Periodiekviewer Koninklijke Vereniging van Archivarissen

Zoeken naar nieuwe wegen In dit atelier is nagedacht over mogelijkheden om de discrepan tie tussen de bestaande toegang tot seriearchieven en het wenselijk geachte digitaal zoeken en vinden met trefwoorden te overbruggen. Welke middelen kunnen worden ontwikkeld om het zoeken en vinden in dergelijke archieven te vereenvoudigen? Is het antwoord dat er meer uitleg gegeven moet worden over wat deze archieven bevatten en hoe je te werk moet gaan om iets te kunnen vinden? Extra metadata toekennen? Of is het wachten op de techniek die het in de toekomst ongetwijfeld mogelijk zal maken om handschriften te lezen zoals dit nu al kan door middel van OCR bij gedrukte en getypte teksten? Binnen projecten als MONK en Transkribus (voor verdere uitleg hierover zie de bijdrage van Ceciel Huitema en Nico Vriend in deze bundel) wordt daar onderzoek naar gedaan en de resultaten worden geleidelijk steeds beter. Toch is het de vraag of het digitaal kunnen doorzoeken van de documenten, te beginnen met de indexen en misschien ooit ook nog weleens van de series besluiten, ingekomen- en minuten van uitgaande stukken, de ultieme vervanger is van de bestaande systematiek die gebaseerd is op het werken met klappers en indexen die door de administratie zijn aangelegd. Die twijfel is gebaseerd op het feit dat het zoeken met trefwoorden in een groot corpus van documenten een fundamenteel andere manier van bevragen is dan het zoeken met gebruikmaking van de logica waarmee degenen die indertijd het informatiesysteem hebben ingericht. Het intikken van een trefwoord en vervolgens zien wat er op het scherm verschijnt is eigenlijk een heel onbenullige actie. Als het corpus documenten dat doorzocht kan worden maar groot genoeg is, zal iedere zoekactie resultaat opleveren. Wat ongewis blijft is hoe relevant de getoonde documenten zijn ten opzichte van de ingevoerde term. Ieder woord dat op die manier wordt gebruikt om te zoeken is in principe gelijk, waardoor zich onmiddellijk het probleem van te veel of te weinig (relevante) resultaten voordoet. Googliaans zoeken met trefwoorden richt zich op gegevens in de documenten terwijl de bestaande ontsluitingsmechanismen binnen de seriearchieven zich primair richten op de documenten en pas in tweede instantie op een zeer beperkte hoeveelheid inhoudelijke gegevens. De informatiesystemen die we als seriearchieven aanduiden, zijn door de toenmalige administratie veelal op een hiërarchische manier ontsloten. Zo zijn de indexen op de verbalen van het Ministerie van Koloniën gestructureerd aan de hand van rubriekshoofden, die vanuit het perspectief van het administra tieve handelen zijn gekozen. De in de index opgenomen samenvattingen van besluiten zijn vervolgens geklapperd op de hierin voorkomende (eigen)namen en voor de administratie relevante termen. Dit hele systeem van metadata in de vorm van indexen met hun hoofdenlijsten en het meestal voor langere tijd stabiele format van data van besluiten, data van ingekomen brieven met de (veelal afgekorte) naam van afzender, samen vatting van het besluit, de eventuele opmerkingen enerzijds en de klappers op deze indexen anderzijds, werden bij het Ministerie van Koloniën op jaarbasis, en toen de administratie groeide zelfs per half jaar, vervaardigd. Daarmee vormt dit bestaande metadatasysteem een verfijnd en fijnmazig stelsel om toegang te krijgen tot de verbalen, al moeten we de kwaliteit ervan ook weer niet overdrijven. Die was lang niet altijd en overal even goed. Een structureel probleem bij doelmatig gebruik van de klappers en indexen over een langere periode vormde ook toen al de gebondenheid aan jaarlijkse of zelfs halfjaarlijkse cesuren veroorzaakt door de aanleg van een nieuw register. Het verbaalstelsel werd in de negentiende eeuw ook het

Vorige Volgende