Zoeken Navigeren Vinden!
Over zoekers, zoekgedrag, zoekmachines en hun interfaces
bij het zoeken naar audiovisuele content
Hoe gaan gebruikers om met zoeksystemen en hoe kan men die systemen ver
beteren? Dat is een belangrijke vraag die (audiovisuele) archieven en systeem
ontwikkelaars zich steeds opnieuw weer stellen. Ze willen zo dicht mogelijk
aansluiten bij de behoeften van hun klanten. Hieronder kijken we naar de stand
van zaken op het terrein van onderzoek naar geschikte zoekmachines en zoek
interfaces. Wat zijn de ontwikkelingen van dit moment, waar liggen de uitdagin
gen en waar de valkuilen? Zeker is dat de mogelijkheden om audiovisueel
materiaal en de bijbehorende metadata via geautomatiseerde systemen op te
vragen almaar toenemen. Het onderzoek naar de zoekinterfaces van de multi-
mediacatalogus iMMix van het Nederlands Instituut voor Beeld en Geluid is
hier een goed voorbeeld van.
Zoekers en zoekgedrag
De laatste jaren hebben leveranciers en exploitanten van zoekmachines en ICT-
onderzoeksbureaus, zoals Gartner, IDC en Ovum, regelmatig onderzoek gedaan
naar verschillende soorten zoekers en hun zoekgedrag. Dergelijke onderzoeken
zijn vaak generiek van karakter. Ze leveren dan ook niet direct de specificaties
voor de implementatie van nieuwe zoekmachines op, maar ze geven wel een rich
ting aan. Uit de resultaten zijn conclusies te trekken die in elk geval iets over
zoekgedrag in het algemeen zeggen. Daarbij moet in het achterhoofd worden
gehouden dat deze onderzoeken bijna altijd betrekking hebben op zoekmachines
van internetsites en intranetsystemen, waar gezocht kan worden naar met name
tekstuele informatie. Ze gaan dus niet over zoekmachines voor multimedia-
archieven; daar is nog geen grootschalig praktijkonderzoek naar gedaan.
Nagenoeg alle onderzochte web-zoekmachines kennen wel grote gebruikers
aantallen en verwerken grote hoeveelheden zoekvragen per dag.
De onderzoeksresultaten laten allereerst zien dat de meeste zoeksessies uit meer
dan één zoekvraag bestaan. Gemiddeld stelt de bezoeker van een website 1,56
zoekvragen per sessie. Hieruit valt af te leiden dat gebruikers bereid zijn om hun
benadering te wijzigen om de informatie te krijgen die zij wensen. Opvallend is
daarnaast dat 52% van de zoekvragen uit niet meer dan één term blijkt te
bestaan, terwijl slechts 12% drie woorden of meer omvat - niet veel tekst voor
een zoekmachine om te interpreteren. En dat terwijl zoekmachines, net als
mensen, in principe zoveel mogelijk aanwijzingen willen om een vraag werkelijk
te kunnen begrijpen. Een vraag die uit één enkel woord bestaat, is hetzelfde als
tegen iemand 'bank' te zeggen en er vervolgens van uit gaan dat de ander begrijpt
of je een zitbank of een financiële instelling bedoelt.
Verder laten de onderzoeken zien dat slechts één op de twintig gebruikers naar de
tweede pagina van de getoonde zoekresultaten gaat. Dit geeft de noodzaak aan
om te zorgen voor een hoge relevantie van de eerste tien documenten die worden
getoond. Door het succes van de eigenlijke zoekactie te meten in termen van
doorklikken, bleek slechts 58,8% van de zoekacties succesvol. In 22% van de
gevallen leverden de zoekvragen zelfs helemaal geen resultaat op. Door daarop
juist deze mislukte zoekacties te onderzoeken vonden de onderzoekers als belang
rijkste probleem dat daar geen informatie te vinden was die bij de vraag paste.
Met andere woorden, de gebruikers realiseerden zich niet dat zij om informatie
vroegen die niet bestond, althans niet op die plaats. Ze hadden op een andere
plaats om die informatie moeten vragen. Blijkbaar denken gebruikers vaak dat op
een willekeurige plaats op het web letterlijk alles te vinden is. Een laatste reden
voor het uitblijven van resultaten bij zoeken op het internet is gelegen in verwar
ring over taal en begrippen. De gebruiker die 'hoge bloeddruk' zoekt kan ook
documenten over 'hypertensie' krijgen. Dat moet hij maar begrijpen. En als hij
spelfouten maakt, dan levert dat meestal weer helemaal niets op.
Uit de beschreven onderzoeksresultaten kan ten minste worden opgemaakt dat
een groot deel van de zoekers nogal wat moeite heeft met het gebruik van zoek
machines. Om dat probleem te ondervangen moet in de eerste plaats de inter
face van die zoekmachines beter gaan aansluiten op het gedrag van de
gebruikers. Om dat te bereiken moet eerst weer in kaart worden gebracht welke
verschillende gebruikersgroepen zijn te onderscheiden, wat hun specifieke
behoeften zijn en hoe het daarbij behorende zoekgedrag in elkaar zit. Dat kan
eruit zien als in dit voorbeeld:
TIMO KOUWENHOVEN
116
TIMO KOUWENHOVEN/ ZOEKEN NAVIGEREN
VINDEN
doelgroep
informatie
behoefte
WAT
zoekgedrag
HOE
bronnen
WAAR
zoekvraag
formulering
eisen
resultaatlijst
Analisten
Hoog
Hoog
Hoog
Gebruikt domein
jargon en query-taal
Mogen niets missen
(high recall)
Onderwerp
specialisten
Hoog
Laag
Gemiddeld
Gebruikt domeinjargon,
meestal geen query-taal
(gebrek aan kennis)
Kan relevante1 resultaten
herkennen, zelfs uit
beknopte beschrijvingen
Informatie
specialisten
Laag
Hoog
Hoog
Heeft moeite met
domeinjargon. Kan
complexe queries
formuleren
Heeft precies gerangschikte
resultaatlijst nodig met
lange beschrijvingen om
keuze moeilijkheid te
beperken
'De massa'
Laag
Laag
Laag
Gebruikt 'onduidelijk'
jargon. Formuleert
queries van 1 a 2 termen
Heeft gedetailleerde resul
taten nodig om relevante
resultaten te selecteren
Tabel 1. Doelgroepen en zoekmachinegebruik
1 Relevantie van een ontsloten document betekent in dit perspectief: hoe goed het document
beantwoordt aan de informatiebehoefte (of vraag).
117