en -documentatie
de en stimulerende rol te vervullen bij het toepassen
van de computer door historici in hun vakgebied.
Het nhda adviseert omtrent te gebruiken software,
aan te wenden technieken voor data-invoer, -opslag
en -analyse, en over de beschikbaarheid van en toe
gang tot bestaande databanken, die relevant zijn
voor de historische wetenschap. Daarbij moet zo
wel gedacht worden aan via netwerken raadpleeg
bare bestanden als aan bestanden op diskette of cd-
rom. Op deze wijze levert het nhda een bijdrage
tot de verbetering van de data-infrastructuur voor
onderzoek in de geschiedwetenschap.
2.2 Data-archivering
Het nhda archiveert en ontsluit op verschillende
manieren historische computerbestanden. Het
aanleggen van bestanden voor wetenschappelijk
onderzoek is doorgaans zeer arbeidsintensief. In ve
le historische onderzoeksprojecten wordt maan
den-, soms jarenlang gewerkt aan de invoer van ge
gevens, die vervolgens worden geordend, bewerkt
en geanalyseerd. Nadat een onderzoek is afgelopen
en een boek of artikel is gepubliceerd, wordt er aan
de met zoveel moeite verzamelde gegevens vaak
weinig aandacht meer besteed. Nu bestaat de moge
lijkheid deze bestanden te deponeren bij het nhda,
zodat ze ook voor toekomstig onderzoek beschik-
baarblijven.3
Op verschillende wijzen wordt bekendheid gege
ven aan de beschikbare historische databases om de
doelgroep op de hoogte te houden van recente ont
wikkelingen en nieuwe aanwinsten. Zowel op na
tionaal als internationaal niveau houdt het nhda
zoveel mogelijk voeling met de ontwikkelingen op
het gebied van 'geschiedenis en computers'. Daar
naast houdt de sectie data-documentatie zich bezig
met dienstverlening met betrekking tot historische
informatiekunde.
Het nhda participeert in het onlangs opgerich
te Gammanet, waarin verschillende dataverschaf-
fende instanties op het gebied van de mens- en
maatschappijwetenschappen samenwerken. Op
initiatief van het nhda is in 1992 een platform van
historische databanken op sociaal- en economisch-
historisch en historisch-demografisch terrein opge
richt. Het betreft de Historische Steekproef Neder
landse bevolking (hsn), de Databank Noord-Bra
bant (dnb), de Historisch-Ecologische Databank
(hed), de kartografische database van gemeente
grenswijzigingen, nlkaart, en de 'Hofstee-be
standen' ondergebracht bij het Nederlands Inter
disciplinair Demografisch Instituut (nidi). Door
nauwere samenwerking, uitwisseling, standaardise
ring en gezamenlijke projecten wordt getracht de
uitbouw en ontsluiting van deze databanken te be
vorderen.
De documentatie en catalogisering van de data
sets gebeurt met behulp van een bij het nhda ont
wikkelde standaard, het Historical Data Descrip
tion Scheme (hdds). Het hdds bouwt voort op
het Standard Study Description Scheme zoals dat
bij sociaal-wetenschappelijke data-archieven wordt
gebruikt. Om specifiek historische datasets te be
schrijven is het nodig dat het HDDS rekening houdt
met de speciale eigenschappen daarvan. In het bij
zonder moet aan de bronnen, die aan de betreffende
dataset ten grondslag hebben gelegen, uitgebreid
aandacht besteed worden.
De datasetdocumentatie wordt bijgehouden met
de zelf ontwikkelde applicatie docusys. Dit pro
gramma vormt de dataset catalogus waarin in een
flexibele relationele database de gegevens worden
opgeslagen. Verder wordt momenteel een invoer-
module ontwikkeld die bedoeld is voor zogenaam
de 'Do It Yourself' documentatie-invoer door on
derzoekers. In de praktijk blijken onderzoekers hun
bestanden namelijk slecht te documenteren, waar
door ze moeilijk te doorgronden zijn voor derden.
De invoermodule zal als losstaand programma op
diskette worden verspreid. Omdat de archivering
van databestanden zeer arbeidsintensief is, is het
noodzakelijk dat de bestanden goed gedocumen
teerd door de onderzoekers worden aangeleverd.
De data-documentatie zal uiteindelijk worden ver
spreid in de vorm van een catalogus, die zowel op
papier als in elektronische vorm beschikbaar zal ko
men onder de naam Data Historica.
Een selectie van historische bestanden is via net
werken (zoals suRF-net) interactief toegankelijk.
Hiervoor wordt gebruik gemaakt van het chro-
nos Historical Data Archive System op de mainfra
me-computer van de Rijksuniversiteit Leiden. In de
nabije toekomst zal in samenwerking met de Leidse
[156]
UB de toegang tot historische bestanden worden
vergroot.4
Naast de gearchiveerde datasets is het voor de
functie van het nhda van groot belang dat diverse
moderne software-toepassingen en applicaties aan
de gebruiker getoond kunnen worden, cd-rom da
tacollecties als de 'United States History on cd-
rom', de 'Iconclass Dutch Printers Devices' en het
Spaanse incunabelenarchief 'Admyte' geven een
waardevolle indruk van de nieuwe opslag- en retrie-
valmedia. Ook de MultiMedia-applicatie'De Voor
compagnieën', die de vroege geschiedenis van de
voc beschrijft met tekst, afbeeldingen, bewegende
beelden en geluid is te raadplegen bij het nh da. cd-
rom uitgeverijen worden gevolgd op het punt van
nieuw te verschijnen cd-rom's en ook specifiek
historische software wordt geregistreerd en indien
mogelijk aangeschaft.
Het n h da verzamelt ook 'non-data' materiaal op
het gebied van de historische informatiekunde, be
staande uit boeken, tijdschriften, nieuwsbrieven en
dergelijke. Doel is om altijd voldoende informatie
voorhanden te hebben om de gebruiker te kunnen
doorverwijzen als zijn informatiebehoefte niet bij
het nhda kan worden vervuld. Zo draagt het nh
da bij tot de moderne infrastructuur van data-do-
cumentatie-instellingen en elektronische archie
ven.
2.3 Scanning
en optische tekenherkenning
Omdat de invoer van historische archiefgegevens in
decomputerzo arbeidsintensief is, begon het nhda
enkele jaren geleden met een proefonderzoek naar
de mogelijkheden van scanning en optische teken
herkenning (ocr). Door het inzetten van optische
leesapparatuur kan de invoer van beelden en tek
sten versneld worden. Voor de omzetting van plaat
jes tot beeldbestanden kan volstaan worden met
scanning, maar voor de conversie van gedrukt
schrift tot elektronisch bevraagbare tekst zijn com
puterprogramma's nodig die kunnen 'lezen'. Deze
programma's zijn in staat getallen en letters op pa
pier om te zetten in computercodes die in informa
tie-ontsluitingssystemen opgeslagen kunnen wor
den.5
Het nhda biedt specialistische kennis en dien
sten op het gebied van scanning en ocr. Het nhda
beschikt over een scan/ocR lab met een breed scala
aan leessystemen en voert onder andere onderzoek
uit naar de meest efficiënte methoden van conver
sie. Document-kenmerken die het ocR-proces be
moeilijken zijn vlekken, doordrukken van de ach
terzijde, gebroken tekens, elkaar rakende tekens en
scheeflopende regels. Het nhda specialiseert zich
in de oplossing van dergelijke problemen.
2.4 Cursussen
In 1991 is door de Rijksuniversiteit Leiden en het
nhda, in samenwerking met Leicester University,
een postdoctorale opleiding voor historische infor
matieverwerking opgezet. De opleiding, speciaal
bestemd voor werkloze afgestudeerden in de ge
schiedenis en andere humaniora, is full-time en
duurt één jaar. Gedurende het jaar vindt een uitwis
seling met Leicester plaats en wordt een automatise-
ringsstage gelopen bij een archief, bibliotheek of
documentatie-instelling, of bij een bedrijf dat actief
is op het terrein van de documentaire informatie
voorziening. De opleiding wordt mede gefinan
cierd door het Europees Sociaal Fonds.
Centraal in het programma staat de toepassing
van informatietechnologie op historisch bronnen
materiaal. De zestien deelnemers, die de status van
stagiair hebben, leren een breed scala aan compu
tertechnieken kennen, die zij gebruiken voor de
verwerking van uiteenlopende historische bron
nen. Alle fasen van dataverwerking passeren de re
vue, zoals het ontwerpen en opbouwen van databa
ses, data-invoer met behulp van scanning en ocr,
digitaliseren van historisch kaartmateriaal, statisti
sche en tekstanalyse, data-documentatie en netwer
ken, opslag en ontsluiting van bestanden. Over de
toepassing van deze technieken in een eigen deel
project wordt mondeling en schriftelijk gerappor
teerd. De stagewerkzaamheden monden uit in de
opbouw van een Data Bank for Urban and Regional
History (daburh). Dat de opleiding in een maat
schappelijke behoefte voorziet blijkt uit het feit dat
de meeste afgestudeerden van de opleiding inmid
dels werk hebben gevonden op het gebied van de
documentaire informatievoorziening en weten
schappelijke dataverwerking.
[157]