4.12 De werkwijze
In de eerste fase is door medewerkers van het iisg
vastgesteld welk materiaal bij het proefproject be
trokken zou worden. Criterium voor de selectie was
in de eerste plaats of de geselecteerde bronnen re
presentatief zijn voor het totale bezit van het iisg.
In de tweede plaats was van belang dat digitalisering
van het materiaal zou leiden tot een betere ontslui
ting en dienstverlening. De bronnen zijn voorts ge
kozen vanwege de technische problemen die ze zou
den veroorzaken bij de conversie als gevolg van de
aard van het materiaal. Hierbij valt te denken aan:
het voorkomen van niet-Latijnse tekens, het for
maat, de omvang, de kwetsbaarheid, en de druk
kwaliteit.
In de tweede fase is door het nhda een informa
tie-analyse uitgevoerd waarin de collectie van het
iisg en de computerinfrastructuur zijn beschreven.
Verder is in deze fase het materiaal geanalyseerd.
Hierbij zijn per materiaalsoort de informatie-ele
menten beschreven. Dit zijn specifieke kenmerken
van een publikatie die bij conversie van belang
(kunnen) zijn. Er zijn twee soorten informatie-ele
menten. In de eerste plaats zijn er de uiterlijke ken
merken, die bepalen hoe de conversie zal verlopen
(bindwijze, het gehanteerde lettertype, pagina-op
maak en de papier- en drukkwaliteit). Daarnaast
zijn er de 'intrinsieke' kenmerken, zoals het orde
ningsprincipe (bijvoorbeeld alfabetisch of chro
nologisch) en de informatievelden (bijvoorbeeld
trefwoord, naam) die een bron bevat. Ook is per
materiaalsoort globaal beschreven welke ontslui
tingssystemen gebruikt kunnen worden. In de der
de fase van het project zijn door middel van scan
ning en optische tekenherkenning conversieproe-
ven uitgevoerd met de geselecteerde bronnen.
Vastgesteld is bijvoorbeeld welke handelingen
(eventueel) noodzakelijk zijn om het scan-resultaat
te controleren en te structureren. Verder is bepaald
hoeveeel tijd de conversie van de verschillende ma
teriaalsoorten in beslag neemt. In de laatste plaats is
in deze fase onderzoek verricht naar alternatieven
voor de ontsluiting van de geselecteerde bronnen.
In de laatste ('productie')-fase is de conversie uit
gevoerd van: P.J. Meertens e.a., red., Biografisch
woordenboek van het socialisme en de arbeidersbewe
ging in Nederland. Deel i (Amsterdam, 1986) en
(een deel van) Josef Stammhammer, Bibliographie
der Sozial-Politik (Jena 1897 en 1912) Voor het
eerstgenoemde werk is een voorbeeld-ontsluiting
gemaakt met het Hypertext-systeem 'Freebase'. Het
scan-resultaat van laatsgenoemd werk is op auto
matische wijze zodanig gestructureerd dat het kan
worden opgenomen in een informatiesysteem van
het iisg. In deze fase is ook het onderzoek naar de
conversie van de krantencollectie afgerond.
Hieronder zal nader worden ingegaan op de con
versie van de genoemde bibliografie en het onder
zoek naar de mogelijkheid van conversie van een
deel van de krantencollectie.
4.13 Ttaree voorbeelden
Conversie van een bibliografie De
conversie van 'Stammhammer' heeft plaatsgevon
den met behulp van het patroonherkenningspro
gramma ProLector. Dit programma is, zoals al eerder
vermeld, in staat verschillende lettertypes te onder
scheiden en deze 'fonts' in de uitvoer te markeren.
In het origineel worden de lemma's niet geschei
den door een witregel. Het begin van een lemma,
dat gevormd wordt door de naam van een auteur of
het eerste woord van een titel, is vet gedrukt. Voor
de structurering van de lemma's is dit een belangrijk
informatie-element. De titel is in normaal letterty
pe gedrukt. In een enkel geval wordt de inhoud van
een beschreven titel kort vermeld; dit is in een klein
lettertype weergegeven. Er komen sporadisch ook
tekens in superschrift voor.
Hoewel de tekst er ogenschijnlijk goed uitziet,
blijkt bijvoorbeeld dat de druk niet erg consequent
is uitgevoerd. Titels van tijdschriften staan tussen
haakjes, maar het komt voor dat het 'haakje sluiten'
ontbreekt. Bij de structurering leidt dit tot proble
men. Specifieke 'ocR-problemen' ontstaan doordat
de teksttekens erg dicht op elkaar staan gedrukt.
Letters 'kleven' daardoor aan elkaar en de software
is minder goed in staat de karakters te herkennen.
Ook het voorkomen van gebroken karakters stelt de
software voor problemen. Moeilijkheden ontstaan
verder door de verwarring van tekens (bijv. de 'h' en
de 'b' of'e' en 'c') uit één font en de verwisseling van
karakters uit verschillende fonts. Hierdoor komen
de fontmarkeringen op de verkeerde plaats te staan.
[166]
J Pagina ly van Stammhammers Bibliographie
derSozial Politik
Deocv.-uitvoervan dezelfde pagina uit Stamm
hammer
Arbuthnot, F. F., Free trade in land. 8°.
London 1885.
Arcere, Louis Étienne, Mémoire sur la
necessité de diminuer le nombre des
fêtes. 12°. 1763.
Archbold, J. F., Poor law cases, abriged.
8°. London, Shaw and Sons, 184258.
Archer, Thom., The pauper, the thief and
the convict; sketches of some of their
homes, hunts and habits. 8°. London,
Groombridge and Sons, 1865.
Archiv des deutschen Landwirtschaftsrats.
Im Auftrage des Vorstandes hrsg. von
Traug. Müller.
1. Jhrg. 1877. 12 Hefte. gr. 8°. Berlin, Parev.
17. Jbrg. 1893.
Archiv für soziale Gesetzgebung u. Statistik.
Vierteljahresschrift zur Erforschung der
gesellschaftlichen Zustande aller Lander.
In Verbindung mit einer Reihe namhafter
Fachmanner des In- u. Auslandes hrsg.
v. Dr. Heinrich Braun.
1.—3. Jhrg. 1888—90. gr. 8°. h 4 Hefte. TÜ-
biingen, Lanpp'sche B.
4.-6. Jhrg. 1891—93. gr. 8°. Berlin, J. Gnt-
tentag.
7—8. Jhrg. 1894—95. gr. 8° Berlin, C'. Hey-
mann's Verl.
Archives du paupérisme et de la charité
chrétienne. Recueil destine indiquer
les moyens de détruire ou d' adoucir les
misères sociales, etc. Sous la direct, de
M. Amand Saintes. 6 nrs. Lex.-8°. Ham
burg, Herold, 1848.
Ardant, G., Vide: Meyer, R.
ArdiUaux, Eugene, La question sociale.
Le paupérisme atténué. 8°. Paris, Re-
noult, 1885.
Arendt, Herm., Was thut das deutsche
Volk für Kunst und Handwerk? gr. 8°.
Berlin, C. Skopnik, 1892.
Arendt, Dr. Otto, 1. Die Erhöhung der
Getreidezölle. 1. u. 2. Aufl. gr. 8°. Berlin,
Walther u. Apolant, 1888.
De gestructureerde versie van Stammhammer,
p. iy, na bewerking met een macro
<2>Arbuthnot, <1>F. F., Free
trade in land. 8°. London
1885.
<2>Arcère<l>Louis Étienne.
Mémoire sur la nécessité de
diminuer le nombre des fêtes
12°. 1763.
<2>Archbold, <1>J. F., Poor law
cases, abriged. 8°. London,
Shaw and Sons, 1842-58.
<2>Archer<l>Thom., The
pauper, the thief and the
convict
sketches of some of their
homes, hunts and habits. 8°.
London
Groombridge and Sons, 18 65.
<2>Archiv des deutschen
Landwirtschaftsrats. Im
Auftrage des
Vorstandes hrsg. von
TraugMüller
<3>1Jhrg 1877. 12 Hefte gr8
Berlin, Parey17 Jhrg. 1893.
<na>ArbuthnotF. F.
<bt>Free trade in land.
<ref>8°London 1885.
<na>Arcère Louis Étienne.
<bt>Mémoire sur la nécessité de
diminuer le nombre des fêtes
<ref>12 0 1763.
<na>ArchboldJ. F.
<bt>Poor law cases, abriged.
<ref>8°. London, Shaw and Sons,
1842-58
<na>ArcherThom
<bt>The pauper, the thief and
the convict; sketches of some
of their homeshunts and
habits
<ref>8°London, Groombridge
and Sons, 1865.
<ga><bt>Archiv des deutschen
Landwirtschaftsrats. Im
Auftrage des Vorstandes hrsg.
von TraugMüller
<com>lJhrg 1877. 12 Hefte gr
8 Berlin, Parey. 17 Jhrg. 1893.
[167]