Uitgelezen
Herkomstbeginsel en ordening
Junte Zhang, System Evaluation of
Archival Description and Access
Universiteit van Amsterdam (2011) ISBN
9789081448567, 158 pp.
Op 30 september promoveerde, onder
begeleiding van Jaap Kamps, Junte
Zhang op een proefschrift over het
zoeken in archiefbeschrijvingen, met als
titel System Evaluation of Archival
Description and Access. Daarbij oefende
Theo Thomassen voor het eerst zijn ius
promovendi uit. Dr. Junte Zhang
(inderdaad: van oorsprong uit China)
maakte daarbij gebruik van de
archiefinventarissen vastgelegd in
Encoded Archival Description (EAD) en
de registratie van het zoek- en
klikgedrag van de gebruikers in de
zoekmachine voor archiefinventarissen
op de website van het Nationaal Archief
(sinds de introductie van GahetNA.nl de
vorige zoekmachine). Dankzij het
gebruik van de eXtensible Markup
Language (XML) waarop EAD is
gebaseerd, kon hij gebruik maken van
reeds beschikbare kennis over het
doorzoekbaar aanbieden van XML.
Daarnaast gebruikte hij diverse Open
Source software pakketten om
experimenten uit te voeren. Ook de
logbestanden waarin het zoek- en
klikgedrag van de gebruikers is
opgeslagen, werden aangeleverd in een
gestandaardiseerde vorm, zodat hij
binnen korte tijd aan de slag kon.
Aan mij de moeilijke taak het werk van
Zhang samen te vatten in deze beknopte
tekst. De vraag is of het daaraan
rechtdoet. Hopelijk leidt het ertoe dat u
(onderdelen van) het proefschrift zelf
gaat bekijken. Zhang ontwikkelde een
databestand met gegevens over
gebruik, onderzocht het belang van
herkomst en ordening, bepaalde het
surfgedrag binnen één toegang en
maakte onderscheid tussen
verschillende gebruikers.
Een databestand voor het zoeken in
archiefinventarissen kon worden
samengesteld door de EAD documenten
en de logbestanden te combineren.
Aangenomen wordt dat als een
gebruiker klikt op een resultaat in de
resultaatlijst, hij deze toegang selecteert
omdat deze voldoet aan zijn zoekvraag.
Dit zal niet in alle gevallen een juiste
aanname zijn, maar met behulp van
statistiek kan toch van deze aanname
gebruik worden gemaakt. Van het
databestand wordt vastgesteld dat de
bepaling van de relevantie (hoe hoog
het resultaat in de resultaatlijst staat)
met behulp van andere formules beter
wordt bepaald dan de zoekmachine van
het NA zelf deed. Hopelijk zijn deze
resultaten meegenomen in de
ontwikkeling van de nieuwe
zoekmachine.
Als het herkomstbeginsel helpt bij het
zoeken van materiaal, zou dat te zien
moeten zijn aan het gedrag van de
gebruiker. Aangenomen wordt dat alle
gebruikers steeds bij dezelfde toegang
uitkomen voor dezelfde zoekvraag. Dat
blijkt inderdaad het geval te zijn. De
ordening vindt in de toegang haar
weerslag in het overerven van
informatie over bovenliggende
archiefbestanddelen. Als deze overerfde
informatie door de zoekmachine wordt
meegenomen, leidt dat tot betere
zoekresultaten. Zhang omschrijft hoe dat
kan worden gedaan.
Nadat de gebruiker een toegang heeft
gevonden, navigeert hij naar het
inventarisnummer dat het meest
relevant is voor zijn zoekvraag. Zhang
ontwikkelde daarvoor een model,
SyKtcm J-1 iihiiitiim <if
Archival Description
and VcCtSS
JunM ,/feaap
waarbij gebruikers langs de
verschillende onderdelen van de
toegang komen. Hij stelt vast welke
paden het meeste worden gebruikt. De
logbestanden maakten het mogelijk
onderscheid te maken tussen ervaren en
onervaren gebruikers. Door deze te
combineren met de databestanden die
eerder waren samengesteld, kon
worden vastgesteld dat het zoeken in
het systeem voor beide doelgroepen
even goed werkte.
Gevoel dat blijft - ook na de
beantwoording van kritische vragen
hierover van de promotiecommissie - is
in hoeverre Zhang heeft onderzocht hoe
het zoeken in archiefbeschrijvingen
verloopt in het algemeen, of dat hij het
zoeken door de archiefbeschrijvingen
van het Nationaal Archief heeft
onderzocht. De manier waarop het
zoeksysteem was ingericht, heeft vast
effect gehad op de resultaten.
Vergelijking van de uitkomsten met
andere omgevingen, bijvoorbeeld het
IISG, is wenselijk. Dat neemt niet weg
dat er wel inzichten zijn over te nemen
over hoe een zoekmachine voor
archiefbeschrijvingen beter kan worden
ingericht dan nu vaak het geval is.
Ivo Zandhuis redacteur Archievenblad
en zelfstandig adviseur/projectleider
(www.zandhuis.nl).
nummer 9 2011 31