n? KLEURRIJK VERSUS GRIJSWAARDEN Op zoek naar een compromUwor compnmeren sT K Het streven is een zo goed mogelij ke digitale reproductie van het gescande origineel. Het doel is niet om mooie plaat jes te verkrijgen, maar zo exact mogelijk het origineel. Daarom is structurele soft warematige verbetering ongewenst. Te meer, omdat verwacht mag worden dat in de toekomst de benodigde software ver beterd zal worden. Voor een optimaal resultaat moet de scan ner een grote kleurruimte en een hoog oplossend vermogen hebben om alle kleuren en nuances waar te nemen en is van de gebruikte scanner een goed ICC- profiel nodig om de relatie vast te leggen tussen de waarden van pixels in RGB en de werkelijke kleuren. Originele kleur De originele kleur is belangrijk, omdat we een reproductie conform origineel willen, zodat generaties na ons digitaal materiaal krijgen dat maximaal overeenkomt met het origineel. De toege stane afwijkingen zullen overigens voor standaard archiefmateriaal wel groter zijn dan voor museaal materiaal. Wat is een grote kleurruimte en een hoog oplossend vermogen? Het kleurbereik van een scanner wordt bepaald door het aan tal nuances dat de scanner kan waarne men en het totale bereik waarbinnen die scanner nog kleurverschillen kan onder scheiden. Deze moet groter zijn dan de kleurruimte van elk te scannen document om alle kleuren vast te kunnen leggen. Matige scanners registreren bij het scan nen van een akte bijvoorbeeld 2000 ver schillende kleuren. Een goede scanner registreert dan bijvoorbeeld wel 5000 verschillende kleuren. In combinatie met een ICC-profiei is hieruit veel nauwkeuri ger het origineel te herleiden. Eenzelfde origineel levert op ver schillende scanners verschillende RGB- waarden op; dat wil zeggen dat er voor dezelfde origineelkleuren verschillende kleurwaarden worden opgeslagen. Zonder profielen zal dit ook verschillende kleu ren op het scherm veroorza ken. Door metingen kan per scanner een ICC-profiel worden vastgelegd. Dit ICC- profiel legt de koppeling tussen de RGB-waarden van de pixels en de werkelijke kleuren, geme ten in golflengten. Daarmee worden de kleuren van verschillende scanners weer gelijk gemaakt. Ook bij beeldschermen werkt dat zo. Momenteel is het voorgeschreven dat compressie geen verlies in kwaliteit mag opleveren1. Wat daarmee exact bedoeld wordt is niet geheel duidelijk: zichtbaar verlies of meetbaar verlies? Daarom is in dit artikel een aantal opties op een rijtje gezet om zo de pro's en contra's kwanti tatief te kunnen afwegen. Voor de goede orde: één AE is precies het kleinste kleur verschil dat het menselijk oog kan waar nemen. En om een praktische relatie uit de praktijk aan te geven: volgens de ISO- norm 12647-5 mag drukwerk niet meer dan 5 AE afwijken. Vergelijkingsbestanden Om de verschillende bestandsforma ten en parameters te kunnen vergelijken, is een archiefstuk gescand in het Tiff- bestandsformaat op een kwalitatief goede scanner. Dit bestand is omgezet naar de bestandsformaten die we willen vergelij ken. Dit bestand is gekozen omdat het kleur bevat, zodat het ten minste het gemid delde document (archiefstukken zoals bouwtekeningen, realisatietekeningen en vergunningen) goed representeert. Het bestand is bijgesneden tot een grootte van 100 MB om de vergelijking te verge makkelijken. De resultaten van de omzetting zijn opge nomen in de onderstaande tabel: oktober 2009 De 90%-norm wordt algemeen gebruikt om de gemiddelde kwaliteit van een scan aan te duiden, waarbij piekwaarden het resultaat niet onevenredig mogen beïnvloeden. De slechtste 10% worden genegeerd. Lees verder op pagina 25 oktober 2009 23 digitaliseringen informatisering Door Guido Dorssers en Johan Kerver Het is verbijsterend dat beperkt kwaliteits verlies door lossy compressie, zoals bijvoor beeld JPEG, onacceptabel is volgens richtlij nen en ministeriële regelingen, en dat grijs waarden en zelfs bitonale conversie zonder compressie wel geaccepteerd worden. Beide opties worden ingegeven door de behoefte de bestanden zo klein mogelijk te houden in verband met de kosten van data-opslag. Of dat werkelijk relevant is, moet worden bezien omdat elke twee jaar de capaciteit van opslag verdubbeld, maar de kosten perGB halve ren. Daarom heeft het Regionaal Historisch Centrum Eindhoven een normatief onderzoek gedaan om te bepalen wat mogelijke alterna tieven zijn. In dit artikel treft u de resultaten en de conclusie van dit onderzoek aan. Wat doet een ICC-profiel? Basisscan archiefstuk Tiff ongecomprimeerd, ingezoomd tot op pixelniveau. Grootte Type Gemiddeld AE Max. AE 90% binnen AE 100 MB Tiff ongecomprimeerd 0 0 0 64.7 MB Tiff LZW-gecomprimeerd 0 0 0 (verliesvrij) 48.9 MB JPEG2000 lossless 0 0 0 48.9 MB JPEG2000 maximaal (kwaliteit 100 op schaal van 1-100) 0 0 O 48.0 MB JPEG2000 hoog (kwaliteit 95) 0.26 1.73 1-73 31.9 MB JPEG2000 hoog (kwaliteit 65) 2-53 15.00 4.69 25.1 MB JPEG2000 gemiddeld (kwaliteit 50) 3.30 21.19 5-74 5.1 MB JPEG2000 minimum (kwaliteit 10) 7.87 45-99 13-75 32.6 MB JPEG maximale 2.07 11.06 3.32 (kwaliteit 12 op schaal van 1-12) 10.1 MB JPEG hoge kwaliteit (kwaliteit 10) 5-25 21.24 8.60 3.6 MB JPEG medium kwaliteit 7.64 41.09 12.96 (kwaliteit 6) 20.9 MB Tiff LZW-gecomprimeerd 218.47 286.07 262.48 Grijswaarden 22 archievenblad Grafische weergave van de verschillen JPEG2000 kwaliteit hoog (65): de gele pixels zijn buiten de 90%-norm, AE >4.69. JPEG2000 kwaliteit minimum 10): de gele pixels zijn buiten de 90%-norm, AE >6.65. JPEG kwaliteit maximaal (12): de gele pixels zijn buiten de 90%-norm, AE >3.32. JPEG kwaliteit hoog 10): de gele pixels zijn buiten de 90%-norm, AE >8.60. JPEG kwaliteit medium (6), de gele pixels zijn buiten de 90%-norm, AE 12.96 Grijswaarden Tiff, verliesvrij gecompri meerd. Geen gele pixels omdat alle pixels een AE hebben 218.47, vrijwel het hele plaatje zou geel zijn. Merk op dat de rode informatie niet meer te onderscheiden valt als later toegevoegd. archievenblad l!Ni

Periodiekviewer Koninklijke Vereniging van Archivarissen

Archievenblad | 2009 | | pagina 11