De Haagse informatieschil en de OMKERING VAN DE webzijdelings Archiefinstellingen zijn tot op zekere hoogte vergelijkbaar met ijsbergen: 90 pro cent van hun collectie blijft verborgen. Alle prestaties op het gebied van ontslui ting en educatie hebben dat niet kunnen veranderen. Internet kan dat wel. Archie ven hebben van alle culturele instellingen het meest te winnen bij internet. Er zijn geen culturele instellingen die over verge lijkbare hoeveelheden 'content' beschik ken. Met behulp van internet zijn we in beginsel in staat de ijsbergratio om te keren: 90 procent wordt zichtbaar. Dat vergt wel grote investeringen. De Raad voor Cultuur adviseerde er 200 miljoen gulden voor uit te trekken. Investeringen in on-lineontsluiting van bronnen bij archiefinstellingen leveren dan ook een formidabel rendement op. In verschillen de projecten - genealogische en historische fotodatabases - is het gebruik van archie ven met meer dan 1000 procent gestegen. En er is meer winst te halen. Eén van de sterke punten van archief instellingen is, dat ze 'content' verenigen met 'context'. Die context zit deels in de samenhang van de informatie, maar tege lijkertijd bouwt de onderzoeker nieuwe context op door verschillende collecties op hetzelfde onderwerp te doorzoeken. Archiefinstellingen verlichten het arbeids intensieve zoeken van de onderzoeker. In beginsel zijn daar twee manieren voor: het verrijken van informatie of het integraal ontsluiten van de informatie. Het verrij ken van informatie doen we met bronnen publicaties, onderzoeksgidsen, brochures, tentoonstellingen e.d. Een moderne toe voeging is de educatieve website. Het integraal ontsluiten van informatie bleef echter vaak achterwege om techni sche redenen. Het was onmogelijk om ver schillende typen informatie als antwoord op één zoekvraag te geven. De onderzoe ker moet zijn vraag telkens weer opnieuw stellen: bij het raadplegen van inventaris sen, van boeken, van bidprentjes, van genealogische toegangen, van foto's, van prenten en tekeningen etc. In kort bestek is het overbodig maken daarvan de functie van de informatieschil: de bezoeker kan met één vraag op honderdduizenden objecten in meerdere collecties tegelijk zoeken. Bij het ontwerp van een zoekmodel voor de informatieschil is het bekende stramien 'wie, wat, waar, wanneer' ge bruikt. In het predigitale tijdperk hanteer den we in het archiefwezen al dit rijtje, omdat het de meeste vragen dekte. Het rij tje zoekvelden is door ons uitgebreid met 'waarover'. Het zoekmodel is 'Archimedes' gedoopt. Wie staat voor persoonsnamen. De 'wie'- vraag kan ingeperkt worden tot uitsluitend makers (auteurs, fotografen, archiefvor mers e.d.). Wat staat voor soort collectie: om te begin nen foto's, prenten en tekeningen, affi ches, boeken, tijdschriften, audiovisueel materiaal en archieven. Het aantal collec ties zal de komende jaren worden uitge breid (straatnamen, bouwvergunningen, genealogie e.d.). Waar staat voor een geografische aandui ding (plaatsnaam, straatnaam e.d.). Wanneer maakt het mogelijk de zoekvraag in de tijd in te perken. Waarover staat voor een onderwerpsaan- duiding. Als iemand afbeeldingen wil zien van Willem Drees in de tijd dat hij lid was van de Haagse gemeenteraad (1913-1941), dan zal hij in het wie-veld 'Drees' invullen, in het wat-veld de collecties aanvinken die afbeeldingen opleveren en in het wanneer- veld de datumbegrenzing 1912-1942 in vullen. Wil hij daarentegen alle beschikba re informatie over Drees uit die periode, dan kiest hij in het wat-veld voor 'alle col lecties'. De zoekresultaten (Eureka!) worden op een voor internet gebruikelijke wijze gepresen teerd. De zoekvraag wordt herhaald en per collectie wordt aangegeven hoeveel gevon den objecten er zijn. Per collectie kan wor den gebladerd om snel de relevantie van de zoekresultaten te kunnen bepalen. Desgewenst kan men naar een webapplica tie van een collectie doorklikken. Dat is een kwaliteitskeuze. De zoekfunctionaliteit van de afzonderlijke webapplicaties is namelijk groter dan de zoekfunctionaliteit van Archimedes. De informatieschil geeft weliswaar toegang tot een enorm datawarehouse, maar het publiek zal ook snel leren dat de informatieschil niet alles oplost. Wat gele verd wordt is een selectie uit de beschrij vingen van objecten (archiefstukken, boe ken, foto's e.d.). Het uiteindelijke zoekre sultaat kan dus nooit verder gaan, dan de informatie in de onderliggende databases mogelijk maakt. Dat geldt zowel kwantita tief als kwalitatief. Het aantal objecten is bij de start van Archimedes - medio 2002 - als volgt: 110.000 foto's 10.000 prenten en tekeningen 1.100 affiches 70.000 monografieën 2.500 tijdschriften 7.500 audiovisuele objecten 1100 inventarissen (enkele honderddui zenden beschrijvingen) Dit bestand zal nog belangrijk worden uit gebreid. De informatie kan uitsluitend worden geleverd als objectbeschrijvingen. Er komt op de zoekvraag over Drees dus geen beknopte biografie over de periode 1913-1941 als resultaat. Dat resultaat kan wel bereikt worden door informatie te ver rijken in een historisch-educatieve websi te, maar niet door middel van de informa tieschil. De collecties waarmee we starten, bevinden zich in drie basissystemen (Imagefinder, Vubis en Mais). Imagefinder en Vubis bevatten elk drie collecties, die ieder een eigen format hebben. De drie basissystemen zijn ooit afzonderlijk opge zet en dat leidt tot beperkingen: er zijn minder persoonsnaamvelden, geo grafische velden en onderwerpsvelden in de basissystemen dan we nu graag zouden zien. Bijvoorbeeld: de auteur Molenaar staat vermeld in een persoonsnaamveld. Deze auteur met de naam Molenaar wordt feilloos opgediept. Wanneer echter op een willekeurige mijnheer Molenaar wordt gezocht, zonder de beperking tot maker/ auteur, wordt deze ook gevonden, maar de 30 webzijdelings zoekresultaten vermelden ook de beroeps aanduiding molenaar. Deze 'ruis' in de zoekresultaten vind je ook bij de 'waar-vra gen' en de 'waarover-vragen'. Niet alleen qua presentatie, maar ook qua zoekop- brengst lijkt het resultatenscherm dus erg op het normale internetresultaatscherm. Het op de koop toenemen van deze ruis was één van de belangrijkste knopen die moesten worden doorgehakt. Er wordt nog onderzocht in hoeverre de ruis naar de achtergrond kan worden gedrukt. Een zeer vergelijkbaar zoekmodel wordt gehanteerd in www.scran.ac.uk. Dat ook daar geen één-op-één-relatie bestaat tussen basissys temen en zoekmodel valt te constateren door in het datumveld de zoekopdracht 'London' in te voeren. Verrassenderwijs leidt dit tot een zoekresultaat. In beginsel zou misschien met minder velden volstaan kunnen worden. Eén alge meen veld - waarop Booleaans kan wor den gezocht - met een datumveld en de mogelijkheid voor het kiezen van een col lectie zou kunnen volstaan. Op de home page van onze website zullen we het zoe ken in zo'n enkel algemeen veld mogelijk maken. Toch is het aanbieden van de andere velden van Archimedes als uitge breid zoekscherm nuttig. Allereerst wordt het zoeken preciezer wanneer de basissys temen velden bevatten die aansluiten bij de velden van Archimedes. Bovendien is het mogelijk om de bestaande basissyste men nader aan te laten sluiten op het zoekmodel. De afweging of die inspanning voldoende rendement oplevert, zal in een later stadium worden gemaakt. In de twee de plaats zal bij de opzet van nieuwe data bases rekening gehouden kunnen worden met het zoekmodel. De belangrijkste stap die we als instel ling moesten maken bij het realiseren van de informatieschil was het ontwerpen van het zoekmodel Archimedes, het vaststellen van de velden in de databases die vanuit het zoekmodel worden doorzocht en het vaststellen hoe de zoekresultaten moesten worden gepresenteerd. Daarnaast moet er een enorme berg werk wor den verzet, wat we uit eindelijk toch hadden moeten doen als we geen informatieschil hadden gewild, maar wat nu versneld wordt uitgevoerd. Een resumé: •beschrijven van affiches en prenten en tekeningen; ontwerpen format voor ontsluiten van affiches, prenten en tekeningen in het basissysteem; fotograferen, digitaliseren en inlezen van affiches, prenten en tekeningen; regelen auteursrechtelijke aspecten van on-linepresentatie van het beeldmateri aal; controle op een oudere conversie van boeken en tijdschriften; scannen, ocr'en en in database opnemen van alle inventarissen; ontwerpen van rubrieken op inventaris niveau; toevoegen institutionele geschiedenis aan inventarissen; hercontrole openbaarheid van alle inventarisnummers; •regelen technische voorzieningen en installeren informatieschil. Maar de meeste werkzaamheden zijn al in het verleden gebeurd: alle (generaties) archivarissen die de archieven hebben ont sloten, die boeken en foto's en andere col lectieonderdelen hebben beschreven, heb ben de basis gelegd voor wat we nu op het gebied van presentatie en toegankelijkheid van de collecties kunnen realiseren. We hadden het onszelf stellig gemakkelij ker kunnen maken, door niet direct zoveel collecties on line te willen brengen bij de introductie van Archimedes. Daar staat tegenover dat op deze wijze het werkpro ces zeer vereenvoudigd is: het beschrijven van alle belangrijke collectieonderdelen sluit naadloos aan op het on line presente ren ervan. Het technisch concept achter Archi medes is het Thematis platform van de firma DEVENTit. Daarin wordt een relatie gelegd tussen de informatieschil en de door ons aangegeven informatie uit vel den van de basissystemen. Zogenaamde 'adapters' zorgen ervoor dat wanneer van uit Archimedes een vraag wordt gesteld, deze wordt vertaald naar zoekvragen voor de basissystemen en dat het zoekresultaat voor de informatieschil wordt opgebouwd. De mogelijkheid om dergelijke informatie- schillen te bouwen bestaat nog niet zo lang. Het Thematis platform voegt aan die technologie innovatieve elementen toe. De leverancier heeft bij de ontwikkeling van zijn concept gedacht vanuit de behoefte van het archiefveld. Er zijn moge lijkheden in verwerkt voor het zowel op grote als kleine schaal inzetten van de oplossing (schaalbaarheid) als het facilite- ren van kleine archiefdiensten door grote en voor het op verschillende locaties aan wezig zijn van informatiebestanden. Meer informatie over het Thematis platform is te vinden op de website van de leverancier: www.deventit.nl. Dit past met name goed in het con cept van regionale historische centra. Deze hebben een regionaal/provinciaal verzor gingsgebied, maar in veel gevallen is daar aan nog onvoldoende invulling gegeven. Dit concept biedt RHC's de mogelijkheid om in hun verzorginggebied instellingen de kans te bieden een integrale stap naar internet te laten maken, ook wanneer deze niet beschikken over een website. Ze kun nen organiseren dat informatie van ar chiefinstellingen en andere erfgoedinstel lingen in de provincie integraal doorzoek baar wordt. De RHC's kunnen in dit con cept een centrale beheerfunctie hebben, die het voor de kleinere instellingen gemakkelijk en betrekkelijk goedkoop maakt om in te stappen. De prestaties van de informatieschil worden niet geremd door de hoeveelheid of de kwaliteit van de databases. Zoekvragen worden 'tegelijk' uitgevoerd op de basissystemen en de zoekresultaten worden verzameld in het tempo waarin de basissystemen deze kun nen leveren. Terwijl de gevonden objecten nog aan het binnenkomen zijn kan de bezoeker de reeds binnengekomen objec ten raadplegen, zodat de snelheid niet wordt bepaald door het 'traagste' basissys teem. De RHC's gezamenlijk moeten in staat geacht worden dit concept verder uit te bouwen tot een landelijk platform. 31 Door Charles Noordam* Het Haags Gemeentearchief werkt aan een informatieschil, waarmee zeven collecties tegelijkertijd doorzocht kunnen worden. Het concept verenigt traditionele en innovatie ve elementen en biedt mogelijkheden op het gebied van schaalbaarheid en samenwerking met andere instellingen. Met name RHC's biedt het de mogelijkheid invulling te geven aan hun regionale taak. Verrijken en integraal ontsluiten van informatie Archimedes Er komt uitsluitend uit, wat erin zit Heterogene databases archievenblad april 2002 i;^®1 De dagelijkse groenmarkt in Den Haag; links de Venestraat; rechts van het midden de Vleeshal (de voormalige st.-Nicolaaskapel) aan de Grote Halstraat, Paulus Constantijn la Fargue 1729-1782) XVIIIc. Waarom al die velden? De inspanningen Technisch concept Stimulans voor het RHC-concept Charles Noordam is directeur van het Haags Gemeentearchief. april 2002 archievenblad

Periodiekviewer Koninklijke Vereniging van Archivarissen

Archievenblad | 2002 | | pagina 15