resultaten van het onderzoek. Duff en Johnson trekken bijvoorbeeld aan het eind
van hun artikel de conclusie, dat mensen in hun vraagstelling namen, plaatsen,
data, onderwerp en gebeurtenis vermelden. Inderdaad is dit nu wetenschappelijk
bewezen, maar een echte eye opener is deze constatering niet. Meer differentiatie
in het gebruik van termen is naar mijn mening aan te bevelen, om meer zicht te
krijgen in de vraagstelling van gebruikers.
Resultaten van het onderzoek
Met deze kanttekeningen in het achterhoofd beoordeelde ik de 116 vragen. Ik wil
nogmaals benadrukken, dat het aantal van 116 veel te laag is om het trekken van
statistisch verantwoorde conclusies mogelijk te maken. Daarbij komt dat de
vraagcategorie service request onderbelicht is, waardoor bij het overzicht van het
relatieve aandeel van de verschillende categorieën de opmerking moet worden
geplaatst, dat door gebrek aan informatie over het aantal reserveringen en repro
ductieopdrachten er geen zekerheid kan worden gegeven over het relatieve
aandeel van de vraagcategorie service request en dus ook niet over het relatieve
aandeel van de andere categorieën. Overigens werden Duff en Johnson met het
zelfde probleem van onderbelichting c.q. overbelichting van vraagcategorieën
geconfronteerd, doordat de deelnemende archiefinstellingen vooraf een selectie
op de e-mails hadden toegepast. Hierdoor en door het feit dat er geen sprake is
van een eenduidig gebruik van termen, is het maken van een vergelijking tussen
de resultaten van mijn onderzoek en de resultaten uit het onderzoek van Duff en
Johnson slechts onder voorbehoud mogelijk. Het belangrijkste doel van het toe
passen van de classificatie van Duff en Johnson is echter na te gaan of deze
aanpak nu ondanks de gemaakte kanttekeningen vruchtbaar is. In deze paragraaf
zijn de percentages in de tabellen en de tekst afgerond.
Uit overzicht 1 blijkt dat op de categorieën service request, administrative/ direc
tional en consultation na, de resultaten uit het onderzoek van Duff en Johnson
en mijn onderzoek elkaar verrassend genoeg niet veel ontlopen. De samengestel
de categorie resource discovery questions heeft in mijn onderzoek een aandeel van
27% en in het onderzoek van Duff en Johnson 29%. Door het probleem met
service request kan hier echter geen definitieve conclusie uit worden getrokken.
Het verschil in het relatieve aandeel van de administrative/directional categorie
springt wel in het oog. Deoorzaak hiervan kan gelegen zijn in het feit dat er bij
het Nationaal Archief meer vragen van deze aard binnenkwamen, maar ook in de
subjectieve beoordeling van de vragen. Zo heb ik e-mails waarin opdracht werd
gegeven tot het doen van onderzoek of het maken van reproducties, maar waarin
tevens werd gevraagd naar de kosten die daaraan verbonden waren, gesplitst in
twee vragen. De vragen naar kosten voor onderzoek en reproductie heb ik onder
de term offertebij de categorie administrative/directional ondergebracht. Ik had
dit echter ook kunnen beschouwen als een onderdeel van de reproductie- of
onderzoeksopdracht en bij de categorie service request kunnen onderbrengen. Dit
had dan tot andere uitkomsten geleid. Hoe Duff en Johnson in dezen handelden
is onbekend.
Na de classificatie van de vragen ging ik per vraagcategorie na welke informatie
een verzoeker wilde (wanteds'). De wanteds bracht ik onder in verzameltermen.
Binnen de vraagcategorieën ontstonden zo subcategorieën. Alleen de grootste
subcategorieën analyseerde ik op givens, omdat de andere subcategorieën slechts
enkele vragen bevatten en het daardoor zinloos was om ze statistisch te verwer
ken. Om deze reden is de categorie fact finding niet in de analyse meegenomen.
De service request categorie is om eerder aangegeven redenen buiten beschouwing
gelaten. Per subcategorie, of zo men wil per wanted, worden de 4 meest gebruikte
givens weergegeven.
Van de categorie resource discovery questions analyseerde ik twee subcategorieën,
namelijk waarin de vraagstellers vroegen om respectievelijk archiefstukken en
biografische informatie. Niet verrassend is, dat mensen die biografische infor
matie zochten in hun vraagstelling het meest de termen, naam, datum, plaats en
gebeurtenis noemden. Deze givens kwamen elk 7 van de 9 keer voor. In iedere
vraag kwam minimaal 1 van de genoemde givens voor. Zoals overzicht 2 laat zien,
werd in 92% van de vragen waar de vraagsteller informeerde naar een archief
stuk of archiefbestand, een naam genoemd. Plaats behoorde hier niet tot de
meest gebruikte givens. Duff en Johnson hebben bij deze subcategorie zowel bij
wanted als bij given de term form (bij mij archiefstuk) vermeld en er vervolgens
een te verwachten 100% score bij gevonden. Ik heb als criterium gebruikt dat
termen die als wanted geregistreerd worden, in dezelfde vraag niet ook nog eens
als given konden voorkomen. Dit verklaart waarom archiefstukken in deze
subcategorie als given een score van 0% hebben. Wel heb ik in de wantecikolom
van de database achter de archiefstukken vermeld om welke archiefstukken of
archiefbestanden het ging. In 10 van de 12 vraagstellingen werd naar een
specifiek document of naar specifieke documenttypen gevraagd.
ONDERZOEKERS IN EEN DIGITALE ONDERZOEKSOMGEVING
186
SANDRA SACHER-FLAAT DE ONTSLUITING VAN ARCHIEVEN EN DE COMPETENTIE VAN DE GEBRUIKER
Overzicht 1
Vraagcategorieën N=116
Categorie
Aantal
Relatief
Onderzoek Duff en Johnson
Administrative/
34
29%
11%
directional
Material finding
19
16%
17%
Consultation
19
16%
10%
User education
15
13%
13%
Service request
9
8%
27%
Fact finding
8
7%
10%
Known item
7
6%
4%
Specific form
5
4%
8%
187