keiijker dan voor het andere: namen, tijds- en geografische bepalingen zijn met
een grotere objectiviteit en intersubjectiviteit weer te geven dan aanduidingen
van inhoud van competentie, taak en bemoeiing aan de representatiekant; en
van onderzoeksonderwerp aan de vraagkant.
Hier ligt aan beide kanten van elk zoeksysteem (representatie van inhoud en
vraagformulering) de grootste moeilijkheid. Dit is op te vatten als een variant op
het algemene tekort in het menselijk communicatievermogen. Dat tekort is al
lastig genoeg bij het begeleiden van een onderzoeker in levenden lijve, voor de
telefoon of schriftelijk. Daarbij hebben we -in afnemende mate- allerlei subtiele,
half- en non-verbale mogelijkheden om waar te nemen of we het over hetzelfde
hebben; of we elkaar begrijpen; of de vraag voldoende helder geformuleerd is. In
die situaties hebben we bovendien mogelijkheden om met omhaal van woorden,
zo niet in eerste dan in tweede of meerdere instantie, onszelf duidelijk te maken
en te proberen elkaar te verstaan.
In een gedigitaliseerde situatie (bijna) niets van dat alles. Gegevens en vraag
moeten eenduidig worden geformuleerd. Er zijn natuurlijk mogelijkheden
als "klinkt als", truncatie, zoeken met behulp van synoniemen en hiërarchisch
gerelateerde begrippen, (al dan niet door middel van een ingebouwde en voor de
gebruiker misschien wel onzichtbare slimme thesaurus); of combinatie van
termen en andere intelligente zoekhulpen en wat dies meer zij: alle parafernalia
van de moderne methoden en technieken van de information retrieval. Maar de
gebruiker staat er met het systeem alleen voor; bovendien kan het systeem niet
goed overweg met niet-exacte zoektermen. Ten leste krijgt de vrager een
antwoord, waarvan hij/zij maar moet aannemen dat het echt de best mogelijke
relatie heeft met wat hij/zij in zijn/haar hoofd had. Het systeem is voor de
gebruiker een zwarte doos. Daar komt nog bij dat, alle hulpfuncties ten spijt, een
gebruiker soms beter, soms slechter met een systeem om kan gaan. Al valt dat
deels op te lossen door het gebruikersinterface zelflerend te maken en het reke
ning te laten houden met het bekwaamheids- en kennisniveau van de gebruiker.
De kern blijft: gebruiker en systeem staan er samen alleen voor. Het systeem
moet alle functies van de inlichtingenmedewerker(s) overnemen en op termijn
liefst beter uitvoeren, want het zou naar zijn aard kwalitatief steeds beter moeten
worden omdat het quasi zelflerend en kennis accumulerend is. Als we dat niet
bereiken, hoeft het eigenlijk niet gebouwd te worden. Ik noem dat: het systeem
moet gebruikersonafhankelijk zijn, dus goede, passende resultaten leveren onge
acht de kwaliteiten en wensen van de gebruiker. Paradoxaal genoeg betekent
gebruikersonafhankelijk dus: optimaal zich aanpassend bij de individuele gebrui
ker. We kunnen nog een stapje verder gaan: het moet zelfs geheel persoons-
onafhankelijk zijn: want behalve de gebruiker komt er als het goed is niemand
meer aan de afhandeling van de vragen te pas (behalve degenen die de helpdesk
bemannen; maar die willen we toch liefst zoveel mogelijk buiten spel houden,
anders heb je voor je het weet een systeem dat voornamelijk vragen aan de help
desk genereert - en dan hadden we die mensen misschien maar beter meteen
aan de begeleiding van het vraaglustige publiek kunnen zetten
Zoals gezegd: het moeilijkst is de representatie van de inhoud in strikte zin van
de achter de archiefvormers liggende archieven. De projectgroep heeft daarvoor
welbewust een aantal mogelijke elementen gekozen, misschien wel teveel, maar
dat juist om te kunnen spelen met de verschillende mogelijkheden. Al doende
schoven daarbij sommige elementen naar de achtergrond omdat ze minder
doeltreffend leken (daarvan zijn de onderzoekssoort en de systematische rubriek
voorbeelden). Andere werden controversieel (trefwoorden). Eén element schoof
van algemeen instrument op naar voorname zoekmogelijkheid: de korte institu
tionele geschiedenis. Aanvankelijk was dit niet anders dan een kladblok (zo heet
het veld nog steeds), waarin de beschikbare informatie bondig werd samengevat
alvorens er trefwoorden, rubrieken en competenties uit te destilleren. Maar al
spoedig bleken de beknopte teksten een goede gelegenheid te geven om full text
zoeken mogelijk te maken. Een goede illustratie van hoe een systeem zich al
doende ontwikkelt: waren we meteen op dit idee gekomen, dan hadden we zeker
van begin af aan de inhoud van de teksten aan meer formele regels gebonden.
Nu is dat een les voor een volgende fase.
Kader 2
Representerende elementen in de database van het Archiefvormersoverzicht.
DE CONTEXT EN DE GEBRUIKER
224
MAARTEN VAN DRIEL TRADITIE EN DIGITALITEIT
Archiefvormer
Representerende gegevenselementen (met opmerkingen over hun belang als
representatie- en zoekterm).
Voorkeursnaam
Aan de archiefvormer door de archiefdienst waar het archief van de archiefvormer
naar zijn aard zou horen te berusten toe te kennen 'officiële' naam; daarmee stan-
daardnaam. Deze archiefdienst is houder van de authority file voor deze archiefvormer.
Weliswaar het meest 'natuurlijke' representatie-element, maar als zoekmiddel minder
van betekenis. Alleen wanneer een onderzoeker al een archiefvormer heeft geselecteerd
in een eerdere fase van het onderzoek is de naam (of een variantjde zoekterm bij
uitstek. Is dat niet het geval, dan is de naam alleen van belang als zoekterm wanneer zij
min of meer sprekend is, iets zegt over de inhoud van het archief en dus te beschouwen
is als een uiterst beknopte samenvatting daarvan.
Alternatieve namen
Niet elke naamswijziging levert een nieuwe archiefvormer op; bovendien zijn veel
archiefvormers bekend onder naamsvarianten, verkorte namen, acroniemen, of
anderszins. (Voorbeeld: graven en hertogen van Gelre zijn met het oog op het stan-
daardgebruik van de term 'Hertogelijk Archief' ook via die naam te benaderen, al is dat
natuurlijk beslist geen archiefvormersnaam). De koppeling loopt van alternatieve
naam naar voorkeursnaam.
Geografie: vestigingsplaats, ressort, invloedssfeer
Zie bespreking in de tekst. Een zeer belangrijke zoekterm: onderzoek wordt immers
gewoonlijk ingeperkt door een geografische aanduiding.
Samen met looptijd (het chronologisch element) wel het meest objectief uit te
drukken representatie- en zoekelement en daardoor semantisch het gemakkelijkste
punt om een een-op-een-relatie tussen gegevensinvoer en bevraging te verkrijgen.
225