audiovisueel
gebruiker lezen in het eerder genoemde 'order
procedure statement'. Vervolgens kan de gebrui
ker naam en adres invoeren. Wederom maakt
het EVA-systeem gebruik van standaard-inter-
netgereedschap, in dit geval e-mail, om de
details van de bestelling af te leveren bij het
archief. Het archief is vervolgens zelf verant
woordelijk voor de verdere afhandeling van de
bestelling. Uiteraard is hierover al goed nage
dacht bij het opzetten van de digitaliseringsketen,
zoals deze hierboven is beschreven. Hoe een en
ander momenteel werkt in het prototype van het
EVA-systeem, kan bekeken worden op het web.
opgenomen zijn in het EVA-systeem. Twee aspecten van het EVA-systeem wil ik
Deze images zijn afgeleid van de'digital nader toelichten: de specificaties van de images
masters'die de archieven zelf bewaren. en de beschrijvingen die deel uitmaken van het
EVA-systeem. Archieven creëren op basis van
beschikbare kennis, middelen en de staat en
omvang van de te converteren fotocollectie
'digital masters' en leiden van deze basisbestan
den zogenaamde thumbnails en referentie ima
ges af die worden aangeboden in het EVA-sys
teem. Dit kan met een beeldbewerkingspro
gramma automatisch gedaan worden. Binnen
het EVA-project is vastgesteld welke kenmerken
deze images dienen te hebben. De specificaties
zijn weergegeven in tabel 1.
Er is een flexibel protocol opgesteld waarin is
vastgelegd aan welke voorwaarden de bestands
namen van de images moeten voldoen. Dit pro
tocol zorgt ervoor dat elk image een unieke
naam krijgt en voorkomt dat verschillende
archieven dezelfde bestandsnamen gebruiken.
Tijdens het EVA-project is een aantal relevante
documentatiestandaarden bestudeerd. Deze
26 I
standaarden zijn afkomstig uit diverse professio
nele gemeenschappen, zoals de archief- en bibli
otheekwereld, fotohistorici en digitale beeldver
werkers. Er ontstond een overzicht van beschrij
vingselementen die een complete en duurzame
documentatie van zowel de originele historische
foto, alsmede de digitale representatie als de
archiefcontext omvatten4.
Voor de vaststelling van de beschrijvingsele
menten van het EVA-systeem heeft het project
zich laten inspireren door de zogenaamde
'Dublin Core-standaard' die specifiek bedoeld is
voor het verschaffen van toegang tot elektroni
sche informatiebronnen5. De Dublin Core-stan
daard bestaat uit vijftien beschrijvingselemen
ten. Tabel 2 bevat de Dublin Core-elementen.
Tevens wordt beschreven op welke manier ze in
de huidige versie van het EVA-systeem worden
geïnterpreteerd.
Uit tabel 2 blijkt dat de beschrijvingselementen
betrekking hebben op óf de originele foto (bij
voorbeeld 'relation') óf het digitale beeld (bij
voorbeeld 'identifier'). Daarnaast worden de ele
menten gebruikt om te beschrijven wat te zien is
op het beeld ongeacht de drager, bijvoorbeeld
'title'. Documentatie van zowel alle analoge vor
men van de foto (bijvoorbeeld afdruk en nega
tief) als alle digitale images (bijvoorbeeld 'digital
master' en 'referentie-image') zou een meer
complete en eenduidige beschrijving opleveren,
maar valt buiten de doelstelling van het EVA-
systeem. Deze volledige beschrijving zou uitge
voerd kunnen worden in het lokale, uitgebreide
informatiesysteem. De beschrijvingselementen
die archieven gebruiken, zijn vaak onderling
zeer verschillend. Ook is een breed scala aan
databasemanagement-systemen in gebruik.
Daarom dient een archief zijn beschrijvingen in
een applicatieonafhankelijke gegevensstructuur
aan te leveren aan het EVA-systeem, namelijk in
XML (extendable markup language). Een XML-
bestand is zowel door mensen als computerpro
gramma's te interpreteren en wordt door steeds
meer computerprogramma's als standaardop
slag- en uitwisselingsformaat gezien. Een XML-
bestand bevat speciale tekens die 'tags' worden
genoemd. Deze 'tags' omsluiten inhoudelijke
informatie en spelen een rol bij de verwerking
van de informatie, bijvoorbeeld in een websys
teem. De XML-bestanden die het EVA-systeem
kan interpreteren hebben 'tags' die overeenko
men met de Dublin Core-elementen (zie tabel
2)6. Het element 'date' wordt in het XML-
bestand specifieker omschreven door gebruik te
maken van de labels 'timeperiod', waarin zowel
plaats is voor een exacte datum als voor een
audiovisueel
Hoewel er ge
bruik kon wor
den gemaakt van
geautomatiseerde
hulpmiddelen (bij
voorbeeld 'auto
matische term
extractie' uit de
beschrijvingen),
was er nog veel
handwerk nodig.
Op basis van het
lexicon is een zo
genaamde expan-
sielijst gemaakt,
waarmee een hiër
archie in de ter
tijdsperiode. Ook de Dublin Core qualifier
'coverage' krijgt een duidelijker label, namelijk
'geography'. Voor elke beschrijving van een foto
wordt een apart XML-bestand gemaakt.
Onderdeel van het EVA-systeem is een pro
totype van een zoekfunctie waarmee het moge
lijk is in meerdere talen te zoeken in de beschrij
vingen. De beschrijvingen in het EVA-systeem
zijn thans beschikbaar in het Nederlands en
Engels. De Nederlandse beschrijvingen zijn
afkomstig van het Stadsarchief Antwerpen en de
Engelse beschrijvingen zijn gemaakt door
London Metropolitan Archives. De derde taal
waarin gezocht kan worden in het EVA-systeem,
is het Duits; van deze taal zijn echter geen
beschrijvingen aanwezig in het EVA-systeem.
De realisering van de 'multilinguale zoekfunc
tionaliteit' bleek niet eenvoudig te zijn. Als men
afgaat op de optimistische signalen die de IT-sec-
tor geeft, zou men kunnen denken dat automa
tische vertaling van beschrijvingen en zoekter
men geen enkel probleem is. Veel zoekmachines
op het web hebben bijvoorbeeld een vertaal
functie. Niets is minder waar. Nog steeds moet
specifieke, semantische domeinkennis gemaakt
worden waaruit het automatische vertaalalgorit
me kan putten. Voor de 'grote' Europese talen
zijn er inmiddels wel standaard elektronische
woordenboeken beschikbaar, maar voor het klei
ne Nederlandse taalgebied ligt dat toch wat
moeilijker. Daarnaast zijn beschrijvingen van
historische foto's in een publiek archief erg spe
cifiek. Daarom is uiteindelijk besloten om een
lexicon te maken van termen die voorkomen in
de Nederlandse en Engelse beschrijvingen van
de foto's die opgenomen zijn in het EVA-sys-
teem. Dit lexicon bevat 6000 termen en is
beschikbaar in het Nederlands, Duits en Engels.
men kan worden aangegeven. De term 'kerk' kan
zodoende als expansie van 'gebouw' worden
gespecificeerd. Ook de creatie van de expansie-
lijst is mensenwerk.
Het EVA-project heeft een softwarecomponent
opgeleverd waarmee zoeken in en tussen verschil
lende talen mogelijk is. Deze component, de QTE
(Query Translation and Expansion) maakt
gebruik van externe taalspecifieke lexica en
expansielijsten. De component analyseert de
zoekvraag van een gebruiker en probeert deze te
vertalen. Hierbij wordt gebruik gemaakt van taal
kundige informatie, waardoor bijvoorbeeld het
onderscheid tussen enkelvoud en meervoud weg
valt. In principe kan het EVA-systeem uitgebreid
worden met alle andere Europese talen, maar dan
moet voor elke taal een lexicon worden gemaakt.
Meer informatie over het zoeken in meerdere
talen kan gevonden worden op de EVA-website.
Het EVA-project heeft een prototype informa
tiesysteem opgeleverd dat gemeenschappelijke
toegang via internet tot meerdere historische foto
collecties mogelijk maakt. Door gebruik te maken
van documentatiestandaarden als Dublin Core en
XML wordt gepoogd de drempel tot deelname
van andere collecties aan het systeem laag te hou
den. Richtlijnen voor de specificaties van de ima
ges zijn vastgesteld om het systeem een uniforme
uitstraling te geven. Het consortium dat het EVA-
project heeft uitgevoerd en het EVA-systeem heeft
ontwikkeld, onderzoekt op welke manier het EVA-
systeem verbeterd en uitgebreid kan worden.
27
Image type Thumbnail image Referentie image
Doel
Zeer globale verwijzing naar origineel.
Geeft goede indruk van details en
dynamiek van de originele foto op een
standaard beeldscherm
(beeldraster: 800 x 600).
De kijkafstand is ca. 20 cm. Een goede
afdruk op papier is niet mogelijk.
Aantal beeldpunten
(pixels)
50 beeldpunten in de langste
dimensie (horizontaal of verticaal)
400 beeldpunten in de langste
dimensie.
Beelddynamiek
256 grijswaarden (8 bits per beeldpunt)
256 grijswaarden
Bestandsformaat
Ipeg
Ipeg
Opmerkingen
Een zichtbaar watermerk aan de
onderzijde van het image bevat een
auteursrechtvermelding en toont het
webadres van het systeem waar het
image van afkomstig is.
Tabel ISpecificaties van images die lmag6S 6n beschrijvingen
archievenblad
juni 2001
Dublin Core-
beschrijvingselement
Interpretatie van het Dublin Core-
beschrijvingselement door het EVA-project
Title
Korte beschrijving van hetgeen zichtbaar is op de foto. Een datum kan
deel uitmaken van de titel.
Creator
Naam van de fotograaf die de originele foto gemaakt heeft.
Subject/Keyword
Beschrijvende termen (trefwoorden bijvoorbeeld) die betrekking hebben
op hetgeen zichtbaar is op de foto. De termen worden niet aangepast
aan een bepaalde autoriteitslijst.
Description
'Vrije tekst'-beschrijving van hetgeen te zien is op de foto.
Publisher
Naam van de organisatie (het archief) dat het betreffende image
aanbiedt aan het EVA-systeem.
Date
Tijdsaanduiding die betrekking heeft op hetgeen te zien is op de
'originele' foto. Er zijn twee mogelijkheden: exacte datum
(dag, maand, jaar) of periode (begin jaar, eind jaar).
Identifier
De naam van het referentie-image en de 'thumbnail' (zie tabel 1).
Language
De taal waarin de beschrijvingen beschikbaar zijn.
Relation
Referentie naar de originele foto, bijvoorbeeld het inventarisnummer.
Coverage
Alle geografische termen, in de eigen taal, die verbonden zijn aan de
inhoud van de foto. De termen worden niet aangepast aan een
bepaalde autoriteitslijst.
Type
Wordt niet gebruikt.
Format
Wordt niet gebruikt.
Source
Wordt niet gebruikt.
Rights
Wordt niet gebruikt (NB: er wordt een apart, losstaand 'copyright
statement' gemaakt door de archieven. Dit heeft betrekking op alle
foto's die in de on-linecollectie zijn opgenomen).
Contributor
Wordt niet gebruikt.
Tabel 2: Interpretatie van de
Dublin Core-beschrijvingselemen-
ten door het EVA-systeem.
Zoeken in vele talen
Tot slot
René van Horik is werkzaam als projectleider en onderzoeker
bij het Nederlands Instituut voor Wetenschappelijke Infor
matiediensten (NIWI).
Ostrow, S.E. (1998) Digitizing
Historical Pictorial Collections for
the Internet (Washington
Amsterdam)
URL: http://www.dir.org/pubs/
reports/ostrow/pub7i.html
Uitkomsten van het door ECPA
uitgevoerd onderzoek zijn te vin
den in: Klijn, E. en De Lusenet,
Y. (2000) In the picture.
Preservation and digitisation of
European photographic collections
(Amsterdam) URL:
http://www.knaw.nl/ecpa/sepia
Er wordt gebruik gemaakt van het
FTP-protocol (File Transfer
Protocol). Archieven krijgen een
gebruikersnaam en wachtwoord
en kunnen zelfstandig images en
beschrijvingen verwijderen, toe
voegen of aanpassen.
Het NIWI heeft samen met het
Stadsarchief Antwerpen een uitge
breid datamodel opgesteld dat
aansluit bij een aantal relevante
standaarden. Op basis van dit
datamodel is een invoerapplicatie
ontwikkeld die door het
Stadsarchief wordt gebruikt om de
inhoud voor het EVA-systeem te
genereren en te onderhouden.
Meer informatie over Dublin Core
kan gevonden worden op URL:
httpj//www.dublincore.org
De structuur waaraan een XML-
bestand t.b.v. het EVA-systeem
dient te voldoen is vastgelegd in
een zogenaamde 'document type
definition' (DTD). Deze DTD heet
'EVOIite.dtd' (in de eerste regel
van een XML-bestand wordt ver
wezen naar deze DTD). 'EVO' staat
voor 'EVA visueel object'. Een
visueel object kan bestaan uit drie
onderdelen: een analoge drager
(de 'echte' foto), het digitale
beeld (dat al dan niet gebaseerd
is op een 'echte' foto) en hetgeen
te zien is in het beeld, ongeacht
de drager. De toevoeging 'lite'
suggereert dat de huidige DTD
een beperkte, 'lichte' versie is, die
slechts een beperkte functie heeft
(namelijk het toegang verschaffen
tot de beelden via internet).
juni 2001
archievenblad