4.12 De werkwijze In de eerste fase is door medewerkers van het iisg vastgesteld welk materiaal bij het proefproject be trokken zou worden. Criterium voor de selectie was in de eerste plaats of de geselecteerde bronnen re presentatief zijn voor het totale bezit van het iisg. In de tweede plaats was van belang dat digitalisering van het materiaal zou leiden tot een betere ontslui ting en dienstverlening. De bronnen zijn voorts ge kozen vanwege de technische problemen die ze zou den veroorzaken bij de conversie als gevolg van de aard van het materiaal. Hierbij valt te denken aan: het voorkomen van niet-Latijnse tekens, het for maat, de omvang, de kwetsbaarheid, en de druk kwaliteit. In de tweede fase is door het nhda een informa tie-analyse uitgevoerd waarin de collectie van het iisg en de computerinfrastructuur zijn beschreven. Verder is in deze fase het materiaal geanalyseerd. Hierbij zijn per materiaalsoort de informatie-ele menten beschreven. Dit zijn specifieke kenmerken van een publikatie die bij conversie van belang (kunnen) zijn. Er zijn twee soorten informatie-ele menten. In de eerste plaats zijn er de uiterlijke ken merken, die bepalen hoe de conversie zal verlopen (bindwijze, het gehanteerde lettertype, pagina-op maak en de papier- en drukkwaliteit). Daarnaast zijn er de 'intrinsieke' kenmerken, zoals het orde ningsprincipe (bijvoorbeeld alfabetisch of chro nologisch) en de informatievelden (bijvoorbeeld trefwoord, naam) die een bron bevat. Ook is per materiaalsoort globaal beschreven welke ontslui tingssystemen gebruikt kunnen worden. In de der de fase van het project zijn door middel van scan ning en optische tekenherkenning conversieproe- ven uitgevoerd met de geselecteerde bronnen. Vastgesteld is bijvoorbeeld welke handelingen (eventueel) noodzakelijk zijn om het scan-resultaat te controleren en te structureren. Verder is bepaald hoeveeel tijd de conversie van de verschillende ma teriaalsoorten in beslag neemt. In de laatste plaats is in deze fase onderzoek verricht naar alternatieven voor de ontsluiting van de geselecteerde bronnen. In de laatste ('productie')-fase is de conversie uit gevoerd van: P.J. Meertens e.a., red., Biografisch woordenboek van het socialisme en de arbeidersbewe ging in Nederland. Deel i (Amsterdam, 1986) en (een deel van) Josef Stammhammer, Bibliographie der Sozial-Politik (Jena 1897 en 1912) Voor het eerstgenoemde werk is een voorbeeld-ontsluiting gemaakt met het Hypertext-systeem 'Freebase'. Het scan-resultaat van laatsgenoemd werk is op auto matische wijze zodanig gestructureerd dat het kan worden opgenomen in een informatiesysteem van het iisg. In deze fase is ook het onderzoek naar de conversie van de krantencollectie afgerond. Hieronder zal nader worden ingegaan op de con versie van de genoemde bibliografie en het onder zoek naar de mogelijkheid van conversie van een deel van de krantencollectie. 4.13 Ttaree voorbeelden Conversie van een bibliografie De conversie van 'Stammhammer' heeft plaatsgevon den met behulp van het patroonherkenningspro gramma ProLector. Dit programma is, zoals al eerder vermeld, in staat verschillende lettertypes te onder scheiden en deze 'fonts' in de uitvoer te markeren. In het origineel worden de lemma's niet geschei den door een witregel. Het begin van een lemma, dat gevormd wordt door de naam van een auteur of het eerste woord van een titel, is vet gedrukt. Voor de structurering van de lemma's is dit een belangrijk informatie-element. De titel is in normaal letterty pe gedrukt. In een enkel geval wordt de inhoud van een beschreven titel kort vermeld; dit is in een klein lettertype weergegeven. Er komen sporadisch ook tekens in superschrift voor. Hoewel de tekst er ogenschijnlijk goed uitziet, blijkt bijvoorbeeld dat de druk niet erg consequent is uitgevoerd. Titels van tijdschriften staan tussen haakjes, maar het komt voor dat het 'haakje sluiten' ontbreekt. Bij de structurering leidt dit tot proble men. Specifieke 'ocR-problemen' ontstaan doordat de teksttekens erg dicht op elkaar staan gedrukt. Letters 'kleven' daardoor aan elkaar en de software is minder goed in staat de karakters te herkennen. Ook het voorkomen van gebroken karakters stelt de software voor problemen. Moeilijkheden ontstaan verder door de verwarring van tekens (bijv. de 'h' en de 'b' of'e' en 'c') uit één font en de verwisseling van karakters uit verschillende fonts. Hierdoor komen de fontmarkeringen op de verkeerde plaats te staan. [166] J Pagina ly van Stammhammers Bibliographie derSozial Politik Deocv.-uitvoervan dezelfde pagina uit Stamm hammer Arbuthnot, F. F., Free trade in land. 8°. London 1885. Arcere, Louis Étienne, Mémoire sur la necessité de diminuer le nombre des fêtes. 12°. 1763. Archbold, J. F., Poor law cases, abriged. 8°. London, Shaw and Sons, 184258. Archer, Thom., The pauper, the thief and the convict; sketches of some of their homes, hunts and habits. 8°. London, Groombridge and Sons, 1865. Archiv des deutschen Landwirtschaftsrats. Im Auftrage des Vorstandes hrsg. von Traug. Müller. 1. Jhrg. 1877. 12 Hefte. gr. 8°. Berlin, Parev. 17. Jbrg. 1893. Archiv für soziale Gesetzgebung u. Statistik. Vierteljahresschrift zur Erforschung der gesellschaftlichen Zustande aller Lander. In Verbindung mit einer Reihe namhafter Fachmanner des In- u. Auslandes hrsg. v. Dr. Heinrich Braun. 1.—3. Jhrg. 1888—90. gr. 8°. h 4 Hefte. TÜ- biingen, Lanpp'sche B. 4.-6. Jhrg. 1891—93. gr. 8°. Berlin, J. Gnt- tentag. 7—8. Jhrg. 1894—95. gr. 8° Berlin, C'. Hey- mann's Verl. Archives du paupérisme et de la charité chrétienne. Recueil destine indiquer les moyens de détruire ou d' adoucir les misères sociales, etc. Sous la direct, de M. Amand Saintes. 6 nrs. Lex.-8°. Ham burg, Herold, 1848. Ardant, G., Vide: Meyer, R. ArdiUaux, Eugene, La question sociale. Le paupérisme atténué. 8°. Paris, Re- noult, 1885. Arendt, Herm., Was thut das deutsche Volk für Kunst und Handwerk? gr. 8°. Berlin, C. Skopnik, 1892. Arendt, Dr. Otto, 1. Die Erhöhung der Getreidezölle. 1. u. 2. Aufl. gr. 8°. Berlin, Walther u. Apolant, 1888. De gestructureerde versie van Stammhammer, p. iy, na bewerking met een macro <2>Arbuthnot, <1>F. F., Free trade in land. 8°. London 1885. <2>Arcère<l>Louis Étienne. Mémoire sur la nécessité de diminuer le nombre des fêtes 12°. 1763. <2>Archbold, <1>J. F., Poor law cases, abriged. 8°. London, Shaw and Sons, 1842-58. <2>Archer<l>Thom., The pauper, the thief and the convict sketches of some of their homes, hunts and habits. 8°. London Groombridge and Sons, 18 65. <2>Archiv des deutschen Landwirtschaftsrats. Im Auftrage des Vorstandes hrsg. von TraugMüller <3>1Jhrg 1877. 12 Hefte gr8 Berlin, Parey17 Jhrg. 1893. <na>ArbuthnotF. F. <bt>Free trade in land. <ref>8°London 1885. <na>Arcère Louis Étienne. <bt>Mémoire sur la nécessité de diminuer le nombre des fêtes <ref>12 0 1763. <na>ArchboldJ. F. <bt>Poor law cases, abriged. <ref>8°. London, Shaw and Sons, 1842-58 <na>ArcherThom <bt>The pauper, the thief and the convict; sketches of some of their homeshunts and habits <ref>8°London, Groombridge and Sons, 1865. <ga><bt>Archiv des deutschen Landwirtschaftsrats. Im Auftrage des Vorstandes hrsg. von TraugMüller <com>lJhrg 1877. 12 Hefte gr 8 Berlin, Parey. 17 Jhrg. 1893. [167]

Periodiekviewer Koninklijke Vereniging van Archivarissen

Nederlandsch Archievenblad | 1993 | | pagina 8