In 1981 verscheen een, eveneens Engelstalige, herziene versie. Genoemde ISO-norm is
ook in ons land erkend, maar er is geen Nederlandstalige versie in druk verschenen.
Wel is er door het ministerie van VRO in 1975 een vertaling gemaakt, in typeschrift, in
1980 gevolgd door een zeer gedetailleerde instructie voor thesaurusbouw, eveneens in
typeschrift. Deze stukken werden door de heer C. P. Pronk aan de projectgroep ter be
schikking gesteld, waarvoor wij hem hier nogmaals dank willen zeggen. Beide geschrif
ten zijn bestemd voor intern gebruik bij het ministerie. De projectgroep is evenwel van
mening dat het archiefwezen moet trachten, wanneer de thesaurusbouw werkelijk ter
hand wordt genomen, beide stukken in druk uitgegeven te krijgen.
4.2 Methoden
Een thesaurus kan op twee manieren worden gebouwd:
1 Volgens de inductieve methode. Men ontleent de begrippen of trefwoorden aan pri
maire bronnen en ordent ze vervolgens tot een bepaald geheel. Het verzamelen van
de begrippen komt eerst, de structuur later. Een andere manier van zeggen is: Men
gaat van het bijzondere naar het algemene.
2 Volgens de deductieve methode. Hierbij gaat men uit van een al aanwezige classifi
catie of van andere bronnen (bijv. studieboeken). De structuur van de thesaurus
staat dan reeds min of meer vast, de descriptoren worden later ingevuld. Deze bena
dering is meer theoretisch. Men gaat van het algemene naar het bijzondere.
In de praktijk wordt bijna altijd gewerkt volgens de inductieve methode. Indien echter
het veld van mogelijke termen te overzien is kan de deductieve methode worden ge
volgd, zoals gedaan is bij de bouw van een onderdeel van de MARDOC-thesaurus dat
betrekking heeft op scheepsmodellen. Bij de bouw van thesauri voor het archiefwezen
kan daarvan geen sprake zijn. Het is zeker dat daarbij alleen de inductieve methode in
aanmerking komt, al kan in de eindfase het resultaat worden aangevuld en verbeterd
via een zekere mate van deductie.
4.3 Werkwijze
Hoewel het in principe mogelijk is thesauri handmatig te bouwen, is onze werkgroep
van mening dat dit in onze tijd niet meer verantwoord is. Thesaurusbouw houdt, naast
creatief werk, een onnoemelijke hoeveelheid routinewerk in dat beter door een compu
ter kan worden opgeknapt. Men hoeft daarbij alleen maar te denken aan het sorteren
op alfabet en het aanbrengen van kruisverwijzingen wanneer er relaties tussen descrip
toren worden gelegd. Maar er zijn nog meer werkzaamheden die een computer beter
doet dan een mens. Men moet er toch niet aan denken dat de systematische en de alfa
betische lijsten handmatig zouden moeten worden uitgetypt. Ook zou het naief zijn te
veronderstellen dat meteen de eerste versie van de thesaurus van zodanige kwaliteit kan
zijn dat er mee gewerkt kan worden. De praktijk heeft bewezen dat er verscheidene her
zieningen nodig zullen zijn voordat van een aanvaardbaar resultaat kan worden gespro
ken. De projectgroep vindt dan ook dat er aan thesaurusbouw niet moet worden be
gonnen als er geen computerfaciliteiten in het vooruitzicht kunnen worden gesteld.
[158]
Of er nu handmatig of met een computer wordt gewerkt, de projectgroep stelt de vol
gende werkwijze voor:
(1) Verzamel de trefwoorden aan de hand van de beschrijvingen in inventarissen van
een aantal archieven, die representatief zijn voor het betreffende deelgebied (zie
paragraaf 4.4). Men kan ze ook of mede verzamelen uit voor het betreffende ge
bied belangrijke gepubliceerde 'bronnen' van terminologie: vakwoordenboeken,
indices op belangrijke studies of archiefinventarissen.
(2) Wanneer men denkt alle min of meer relevante trefwoorden verzameld te hebben,
dan gaat men die systematisch ordenen. Daarvoor kan men gebruik maken van
een systematische aanduiding, ontleend aan bijv. een systematische catalogus of
classificatie op het betreffende gebied. Met name willen wij hier noemen de Uni
versele Decimale Classificatie (UDC). Deze heeft voor vele speciale onderwerpen
ook meer uitgewerkte versies. De keuze van het hoofdgetal wordt hierbij bepaald
door de 'gemiddelde waarde' van de archivalia.
De bedoeling van Jiet per trefwoord aanbrengen van een systematische code is om
deze trefwoorden volgens die code te ordenen. Dan komen de trefwoorden bijeen
die bijeen horen of verwant met elkaar zijn.
(3) Vervolgens gaat men bepalen welk trefwoord uit het groepje trefwoorden die sy
noniem zijn (bijv. fiets of rijwiel) of half-synoniem taalkundig niet synoniem,
maar in deze context voor retrievaldoeleinden als zodanig beschouwd, b.v. reuk
en geur) als descriptor gebruikt gaat worden. De overige trefwoorden uit zo'n
groepje krijgen dan de status van verwijstermen (termen in de zoekleiding) die het
vinden van de betreffende descriptor vergemakkelijken. In deze fase kan men ook
de 'zie ook'-verwijzingen aanbrengen en de verwijzingen naar de ruimere en enge
re termen (bijv. fiets, zie vervoermiddel; fiets, zie sportfiets, tandem, kinderfiets).
In deze fase kan men ook ontdekken of bepaalde onderdelen van het betreffende
veld nog 'wit' zijn, dus vergeten of te zwak 'ontwikkeld' zijn en waarvoor men
kennelijk geen of nauwelijks trefwoorden gevonden heeft.
(4) De volgende fase is dat men alle trefwoorden weer in alfabetische volgorde zet. Bij
elke descriptor (te onderscheiden van de termen in de zoekleiding door een ander
lettertype of door ze in hoofdletters te zetten) worden de verschillende verwijzin
gen opgegeven. Bij de termen in de zoekleiding wordt altijd terugverwezen naar de
descriptor.
(5) Het is gewenst, ten gerieve van de gebruiker (indiceerder en vraagsteller) ook een
systematisch overzicht (bijv. volgens de eerder vermelde code) van de descriptoren
te geven, zonder zoekleidingstermen.
(6) Richtlijnen voor de werkzaamheden moeten zijn de ISO-norm 2788 en de Neder
landse vertaling daarvan, alsmede de handleiding voor thesaurusbouw van het mi
nisterie van VRO.
Verschillende malen is in de projectgroep gediscussieerd over de specificiteit van de te
ontwerpen thesauri, en, in samenhang daarmee, de gedetailleerdheid van de inventaris
beschrijvingen en het niveau van de gebruikers.
Om met het laatste te beginnen: de projectgroep meent dat de te gebruiken termen
[159]