audiovisueel gebruiker lezen in het eerder genoemde 'order procedure statement'. Vervolgens kan de gebrui ker naam en adres invoeren. Wederom maakt het EVA-systeem gebruik van standaard-inter- netgereedschap, in dit geval e-mail, om de details van de bestelling af te leveren bij het archief. Het archief is vervolgens zelf verant woordelijk voor de verdere afhandeling van de bestelling. Uiteraard is hierover al goed nage dacht bij het opzetten van de digitaliseringsketen, zoals deze hierboven is beschreven. Hoe een en ander momenteel werkt in het prototype van het EVA-systeem, kan bekeken worden op het web. opgenomen zijn in het EVA-systeem. Twee aspecten van het EVA-systeem wil ik Deze images zijn afgeleid van de'digital nader toelichten: de specificaties van de images masters'die de archieven zelf bewaren. en de beschrijvingen die deel uitmaken van het EVA-systeem. Archieven creëren op basis van beschikbare kennis, middelen en de staat en omvang van de te converteren fotocollectie 'digital masters' en leiden van deze basisbestan den zogenaamde thumbnails en referentie ima ges af die worden aangeboden in het EVA-sys teem. Dit kan met een beeldbewerkingspro gramma automatisch gedaan worden. Binnen het EVA-project is vastgesteld welke kenmerken deze images dienen te hebben. De specificaties zijn weergegeven in tabel 1. Er is een flexibel protocol opgesteld waarin is vastgelegd aan welke voorwaarden de bestands namen van de images moeten voldoen. Dit pro tocol zorgt ervoor dat elk image een unieke naam krijgt en voorkomt dat verschillende archieven dezelfde bestandsnamen gebruiken. Tijdens het EVA-project is een aantal relevante documentatiestandaarden bestudeerd. Deze 26 I standaarden zijn afkomstig uit diverse professio nele gemeenschappen, zoals de archief- en bibli otheekwereld, fotohistorici en digitale beeldver werkers. Er ontstond een overzicht van beschrij vingselementen die een complete en duurzame documentatie van zowel de originele historische foto, alsmede de digitale representatie als de archiefcontext omvatten4. Voor de vaststelling van de beschrijvingsele menten van het EVA-systeem heeft het project zich laten inspireren door de zogenaamde 'Dublin Core-standaard' die specifiek bedoeld is voor het verschaffen van toegang tot elektroni sche informatiebronnen5. De Dublin Core-stan daard bestaat uit vijftien beschrijvingselemen ten. Tabel 2 bevat de Dublin Core-elementen. Tevens wordt beschreven op welke manier ze in de huidige versie van het EVA-systeem worden geïnterpreteerd. Uit tabel 2 blijkt dat de beschrijvingselementen betrekking hebben op óf de originele foto (bij voorbeeld 'relation') óf het digitale beeld (bij voorbeeld 'identifier'). Daarnaast worden de ele menten gebruikt om te beschrijven wat te zien is op het beeld ongeacht de drager, bijvoorbeeld 'title'. Documentatie van zowel alle analoge vor men van de foto (bijvoorbeeld afdruk en nega tief) als alle digitale images (bijvoorbeeld 'digital master' en 'referentie-image') zou een meer complete en eenduidige beschrijving opleveren, maar valt buiten de doelstelling van het EVA- systeem. Deze volledige beschrijving zou uitge voerd kunnen worden in het lokale, uitgebreide informatiesysteem. De beschrijvingselementen die archieven gebruiken, zijn vaak onderling zeer verschillend. Ook is een breed scala aan databasemanagement-systemen in gebruik. Daarom dient een archief zijn beschrijvingen in een applicatieonafhankelijke gegevensstructuur aan te leveren aan het EVA-systeem, namelijk in XML (extendable markup language). Een XML- bestand is zowel door mensen als computerpro gramma's te interpreteren en wordt door steeds meer computerprogramma's als standaardop slag- en uitwisselingsformaat gezien. Een XML- bestand bevat speciale tekens die 'tags' worden genoemd. Deze 'tags' omsluiten inhoudelijke informatie en spelen een rol bij de verwerking van de informatie, bijvoorbeeld in een websys teem. De XML-bestanden die het EVA-systeem kan interpreteren hebben 'tags' die overeenko men met de Dublin Core-elementen (zie tabel 2)6. Het element 'date' wordt in het XML- bestand specifieker omschreven door gebruik te maken van de labels 'timeperiod', waarin zowel plaats is voor een exacte datum als voor een audiovisueel Hoewel er ge bruik kon wor den gemaakt van geautomatiseerde hulpmiddelen (bij voorbeeld 'auto matische term extractie' uit de beschrijvingen), was er nog veel handwerk nodig. Op basis van het lexicon is een zo genaamde expan- sielijst gemaakt, waarmee een hiër archie in de ter tijdsperiode. Ook de Dublin Core qualifier 'coverage' krijgt een duidelijker label, namelijk 'geography'. Voor elke beschrijving van een foto wordt een apart XML-bestand gemaakt. Onderdeel van het EVA-systeem is een pro totype van een zoekfunctie waarmee het moge lijk is in meerdere talen te zoeken in de beschrij vingen. De beschrijvingen in het EVA-systeem zijn thans beschikbaar in het Nederlands en Engels. De Nederlandse beschrijvingen zijn afkomstig van het Stadsarchief Antwerpen en de Engelse beschrijvingen zijn gemaakt door London Metropolitan Archives. De derde taal waarin gezocht kan worden in het EVA-systeem, is het Duits; van deze taal zijn echter geen beschrijvingen aanwezig in het EVA-systeem. De realisering van de 'multilinguale zoekfunc tionaliteit' bleek niet eenvoudig te zijn. Als men afgaat op de optimistische signalen die de IT-sec- tor geeft, zou men kunnen denken dat automa tische vertaling van beschrijvingen en zoekter men geen enkel probleem is. Veel zoekmachines op het web hebben bijvoorbeeld een vertaal functie. Niets is minder waar. Nog steeds moet specifieke, semantische domeinkennis gemaakt worden waaruit het automatische vertaalalgorit me kan putten. Voor de 'grote' Europese talen zijn er inmiddels wel standaard elektronische woordenboeken beschikbaar, maar voor het klei ne Nederlandse taalgebied ligt dat toch wat moeilijker. Daarnaast zijn beschrijvingen van historische foto's in een publiek archief erg spe cifiek. Daarom is uiteindelijk besloten om een lexicon te maken van termen die voorkomen in de Nederlandse en Engelse beschrijvingen van de foto's die opgenomen zijn in het EVA-sys- teem. Dit lexicon bevat 6000 termen en is beschikbaar in het Nederlands, Duits en Engels. men kan worden aangegeven. De term 'kerk' kan zodoende als expansie van 'gebouw' worden gespecificeerd. Ook de creatie van de expansie- lijst is mensenwerk. Het EVA-project heeft een softwarecomponent opgeleverd waarmee zoeken in en tussen verschil lende talen mogelijk is. Deze component, de QTE (Query Translation and Expansion) maakt gebruik van externe taalspecifieke lexica en expansielijsten. De component analyseert de zoekvraag van een gebruiker en probeert deze te vertalen. Hierbij wordt gebruik gemaakt van taal kundige informatie, waardoor bijvoorbeeld het onderscheid tussen enkelvoud en meervoud weg valt. In principe kan het EVA-systeem uitgebreid worden met alle andere Europese talen, maar dan moet voor elke taal een lexicon worden gemaakt. Meer informatie over het zoeken in meerdere talen kan gevonden worden op de EVA-website. Het EVA-project heeft een prototype informa tiesysteem opgeleverd dat gemeenschappelijke toegang via internet tot meerdere historische foto collecties mogelijk maakt. Door gebruik te maken van documentatiestandaarden als Dublin Core en XML wordt gepoogd de drempel tot deelname van andere collecties aan het systeem laag te hou den. Richtlijnen voor de specificaties van de ima ges zijn vastgesteld om het systeem een uniforme uitstraling te geven. Het consortium dat het EVA- project heeft uitgevoerd en het EVA-systeem heeft ontwikkeld, onderzoekt op welke manier het EVA- systeem verbeterd en uitgebreid kan worden. 27 Image type Thumbnail image Referentie image Doel Zeer globale verwijzing naar origineel. Geeft goede indruk van details en dynamiek van de originele foto op een standaard beeldscherm (beeldraster: 800 x 600). De kijkafstand is ca. 20 cm. Een goede afdruk op papier is niet mogelijk. Aantal beeldpunten (pixels) 50 beeldpunten in de langste dimensie (horizontaal of verticaal) 400 beeldpunten in de langste dimensie. Beelddynamiek 256 grijswaarden (8 bits per beeldpunt) 256 grijswaarden Bestandsformaat Ipeg Ipeg Opmerkingen Een zichtbaar watermerk aan de onderzijde van het image bevat een auteursrechtvermelding en toont het webadres van het systeem waar het image van afkomstig is. Tabel ISpecificaties van images die lmag6S 6n beschrijvingen archievenblad juni 2001 Dublin Core- beschrijvingselement Interpretatie van het Dublin Core- beschrijvingselement door het EVA-project Title Korte beschrijving van hetgeen zichtbaar is op de foto. Een datum kan deel uitmaken van de titel. Creator Naam van de fotograaf die de originele foto gemaakt heeft. Subject/Keyword Beschrijvende termen (trefwoorden bijvoorbeeld) die betrekking hebben op hetgeen zichtbaar is op de foto. De termen worden niet aangepast aan een bepaalde autoriteitslijst. Description 'Vrije tekst'-beschrijving van hetgeen te zien is op de foto. Publisher Naam van de organisatie (het archief) dat het betreffende image aanbiedt aan het EVA-systeem. Date Tijdsaanduiding die betrekking heeft op hetgeen te zien is op de 'originele' foto. Er zijn twee mogelijkheden: exacte datum (dag, maand, jaar) of periode (begin jaar, eind jaar). Identifier De naam van het referentie-image en de 'thumbnail' (zie tabel 1). Language De taal waarin de beschrijvingen beschikbaar zijn. Relation Referentie naar de originele foto, bijvoorbeeld het inventarisnummer. Coverage Alle geografische termen, in de eigen taal, die verbonden zijn aan de inhoud van de foto. De termen worden niet aangepast aan een bepaalde autoriteitslijst. Type Wordt niet gebruikt. Format Wordt niet gebruikt. Source Wordt niet gebruikt. Rights Wordt niet gebruikt (NB: er wordt een apart, losstaand 'copyright statement' gemaakt door de archieven. Dit heeft betrekking op alle foto's die in de on-linecollectie zijn opgenomen). Contributor Wordt niet gebruikt. Tabel 2: Interpretatie van de Dublin Core-beschrijvingselemen- ten door het EVA-systeem. Zoeken in vele talen Tot slot René van Horik is werkzaam als projectleider en onderzoeker bij het Nederlands Instituut voor Wetenschappelijke Infor matiediensten (NIWI). Ostrow, S.E. (1998) Digitizing Historical Pictorial Collections for the Internet (Washington Amsterdam) URL: http://www.dir.org/pubs/ reports/ostrow/pub7i.html Uitkomsten van het door ECPA uitgevoerd onderzoek zijn te vin den in: Klijn, E. en De Lusenet, Y. (2000) In the picture. Preservation and digitisation of European photographic collections (Amsterdam) URL: http://www.knaw.nl/ecpa/sepia Er wordt gebruik gemaakt van het FTP-protocol (File Transfer Protocol). Archieven krijgen een gebruikersnaam en wachtwoord en kunnen zelfstandig images en beschrijvingen verwijderen, toe voegen of aanpassen. Het NIWI heeft samen met het Stadsarchief Antwerpen een uitge breid datamodel opgesteld dat aansluit bij een aantal relevante standaarden. Op basis van dit datamodel is een invoerapplicatie ontwikkeld die door het Stadsarchief wordt gebruikt om de inhoud voor het EVA-systeem te genereren en te onderhouden. Meer informatie over Dublin Core kan gevonden worden op URL: httpj//www.dublincore.org De structuur waaraan een XML- bestand t.b.v. het EVA-systeem dient te voldoen is vastgelegd in een zogenaamde 'document type definition' (DTD). Deze DTD heet 'EVOIite.dtd' (in de eerste regel van een XML-bestand wordt ver wezen naar deze DTD). 'EVO' staat voor 'EVA visueel object'. Een visueel object kan bestaan uit drie onderdelen: een analoge drager (de 'echte' foto), het digitale beeld (dat al dan niet gebaseerd is op een 'echte' foto) en hetgeen te zien is in het beeld, ongeacht de drager. De toevoeging 'lite' suggereert dat de huidige DTD een beperkte, 'lichte' versie is, die slechts een beperkte functie heeft (namelijk het toegang verschaffen tot de beelden via internet). juni 2001 archievenblad

Periodiekviewer Koninklijke Vereniging van Archivarissen

Archievenblad | 2001 | | pagina 13