en -documentatie de en stimulerende rol te vervullen bij het toepassen van de computer door historici in hun vakgebied. Het nhda adviseert omtrent te gebruiken software, aan te wenden technieken voor data-invoer, -opslag en -analyse, en over de beschikbaarheid van en toe gang tot bestaande databanken, die relevant zijn voor de historische wetenschap. Daarbij moet zo wel gedacht worden aan via netwerken raadpleeg bare bestanden als aan bestanden op diskette of cd- rom. Op deze wijze levert het nhda een bijdrage tot de verbetering van de data-infrastructuur voor onderzoek in de geschiedwetenschap. 2.2 Data-archivering Het nhda archiveert en ontsluit op verschillende manieren historische computerbestanden. Het aanleggen van bestanden voor wetenschappelijk onderzoek is doorgaans zeer arbeidsintensief. In ve le historische onderzoeksprojecten wordt maan den-, soms jarenlang gewerkt aan de invoer van ge gevens, die vervolgens worden geordend, bewerkt en geanalyseerd. Nadat een onderzoek is afgelopen en een boek of artikel is gepubliceerd, wordt er aan de met zoveel moeite verzamelde gegevens vaak weinig aandacht meer besteed. Nu bestaat de moge lijkheid deze bestanden te deponeren bij het nhda, zodat ze ook voor toekomstig onderzoek beschik- baarblijven.3 Op verschillende wijzen wordt bekendheid gege ven aan de beschikbare historische databases om de doelgroep op de hoogte te houden van recente ont wikkelingen en nieuwe aanwinsten. Zowel op na tionaal als internationaal niveau houdt het nhda zoveel mogelijk voeling met de ontwikkelingen op het gebied van 'geschiedenis en computers'. Daar naast houdt de sectie data-documentatie zich bezig met dienstverlening met betrekking tot historische informatiekunde. Het nhda participeert in het onlangs opgerich te Gammanet, waarin verschillende dataverschaf- fende instanties op het gebied van de mens- en maatschappijwetenschappen samenwerken. Op initiatief van het nhda is in 1992 een platform van historische databanken op sociaal- en economisch- historisch en historisch-demografisch terrein opge richt. Het betreft de Historische Steekproef Neder landse bevolking (hsn), de Databank Noord-Bra bant (dnb), de Historisch-Ecologische Databank (hed), de kartografische database van gemeente grenswijzigingen, nlkaart, en de 'Hofstee-be standen' ondergebracht bij het Nederlands Inter disciplinair Demografisch Instituut (nidi). Door nauwere samenwerking, uitwisseling, standaardise ring en gezamenlijke projecten wordt getracht de uitbouw en ontsluiting van deze databanken te be vorderen. De documentatie en catalogisering van de data sets gebeurt met behulp van een bij het nhda ont wikkelde standaard, het Historical Data Descrip tion Scheme (hdds). Het hdds bouwt voort op het Standard Study Description Scheme zoals dat bij sociaal-wetenschappelijke data-archieven wordt gebruikt. Om specifiek historische datasets te be schrijven is het nodig dat het HDDS rekening houdt met de speciale eigenschappen daarvan. In het bij zonder moet aan de bronnen, die aan de betreffende dataset ten grondslag hebben gelegen, uitgebreid aandacht besteed worden. De datasetdocumentatie wordt bijgehouden met de zelf ontwikkelde applicatie docusys. Dit pro gramma vormt de dataset catalogus waarin in een flexibele relationele database de gegevens worden opgeslagen. Verder wordt momenteel een invoer- module ontwikkeld die bedoeld is voor zogenaam de 'Do It Yourself' documentatie-invoer door on derzoekers. In de praktijk blijken onderzoekers hun bestanden namelijk slecht te documenteren, waar door ze moeilijk te doorgronden zijn voor derden. De invoermodule zal als losstaand programma op diskette worden verspreid. Omdat de archivering van databestanden zeer arbeidsintensief is, is het noodzakelijk dat de bestanden goed gedocumen teerd door de onderzoekers worden aangeleverd. De data-documentatie zal uiteindelijk worden ver spreid in de vorm van een catalogus, die zowel op papier als in elektronische vorm beschikbaar zal ko men onder de naam Data Historica. Een selectie van historische bestanden is via net werken (zoals suRF-net) interactief toegankelijk. Hiervoor wordt gebruik gemaakt van het chro- nos Historical Data Archive System op de mainfra me-computer van de Rijksuniversiteit Leiden. In de nabije toekomst zal in samenwerking met de Leidse [156] UB de toegang tot historische bestanden worden vergroot.4 Naast de gearchiveerde datasets is het voor de functie van het nhda van groot belang dat diverse moderne software-toepassingen en applicaties aan de gebruiker getoond kunnen worden, cd-rom da tacollecties als de 'United States History on cd- rom', de 'Iconclass Dutch Printers Devices' en het Spaanse incunabelenarchief 'Admyte' geven een waardevolle indruk van de nieuwe opslag- en retrie- valmedia. Ook de MultiMedia-applicatie'De Voor compagnieën', die de vroege geschiedenis van de voc beschrijft met tekst, afbeeldingen, bewegende beelden en geluid is te raadplegen bij het nh da. cd- rom uitgeverijen worden gevolgd op het punt van nieuw te verschijnen cd-rom's en ook specifiek historische software wordt geregistreerd en indien mogelijk aangeschaft. Het n h da verzamelt ook 'non-data' materiaal op het gebied van de historische informatiekunde, be staande uit boeken, tijdschriften, nieuwsbrieven en dergelijke. Doel is om altijd voldoende informatie voorhanden te hebben om de gebruiker te kunnen doorverwijzen als zijn informatiebehoefte niet bij het nhda kan worden vervuld. Zo draagt het nh da bij tot de moderne infrastructuur van data-do- cumentatie-instellingen en elektronische archie ven. 2.3 Scanning en optische tekenherkenning Omdat de invoer van historische archiefgegevens in decomputerzo arbeidsintensief is, begon het nhda enkele jaren geleden met een proefonderzoek naar de mogelijkheden van scanning en optische teken herkenning (ocr). Door het inzetten van optische leesapparatuur kan de invoer van beelden en tek sten versneld worden. Voor de omzetting van plaat jes tot beeldbestanden kan volstaan worden met scanning, maar voor de conversie van gedrukt schrift tot elektronisch bevraagbare tekst zijn com puterprogramma's nodig die kunnen 'lezen'. Deze programma's zijn in staat getallen en letters op pa pier om te zetten in computercodes die in informa tie-ontsluitingssystemen opgeslagen kunnen wor den.5 Het nhda biedt specialistische kennis en dien sten op het gebied van scanning en ocr. Het nhda beschikt over een scan/ocR lab met een breed scala aan leessystemen en voert onder andere onderzoek uit naar de meest efficiënte methoden van conver sie. Document-kenmerken die het ocR-proces be moeilijken zijn vlekken, doordrukken van de ach terzijde, gebroken tekens, elkaar rakende tekens en scheeflopende regels. Het nhda specialiseert zich in de oplossing van dergelijke problemen. 2.4 Cursussen In 1991 is door de Rijksuniversiteit Leiden en het nhda, in samenwerking met Leicester University, een postdoctorale opleiding voor historische infor matieverwerking opgezet. De opleiding, speciaal bestemd voor werkloze afgestudeerden in de ge schiedenis en andere humaniora, is full-time en duurt één jaar. Gedurende het jaar vindt een uitwis seling met Leicester plaats en wordt een automatise- ringsstage gelopen bij een archief, bibliotheek of documentatie-instelling, of bij een bedrijf dat actief is op het terrein van de documentaire informatie voorziening. De opleiding wordt mede gefinan cierd door het Europees Sociaal Fonds. Centraal in het programma staat de toepassing van informatietechnologie op historisch bronnen materiaal. De zestien deelnemers, die de status van stagiair hebben, leren een breed scala aan compu tertechnieken kennen, die zij gebruiken voor de verwerking van uiteenlopende historische bron nen. Alle fasen van dataverwerking passeren de re vue, zoals het ontwerpen en opbouwen van databa ses, data-invoer met behulp van scanning en ocr, digitaliseren van historisch kaartmateriaal, statisti sche en tekstanalyse, data-documentatie en netwer ken, opslag en ontsluiting van bestanden. Over de toepassing van deze technieken in een eigen deel project wordt mondeling en schriftelijk gerappor teerd. De stagewerkzaamheden monden uit in de opbouw van een Data Bank for Urban and Regional History (daburh). Dat de opleiding in een maat schappelijke behoefte voorziet blijkt uit het feit dat de meeste afgestudeerden van de opleiding inmid dels werk hebben gevonden op het gebied van de documentaire informatievoorziening en weten schappelijke dataverwerking. [157]

Periodiekviewer Koninklijke Vereniging van Archivarissen

Nederlandsch Archievenblad | 1993 | | pagina 3