n? KLEURRIJK VERSUS GRIJSWAARDEN
Op zoek naar een compromUwor compnmeren
sT
K
Het streven is een zo goed mogelij
ke digitale reproductie van het gescande
origineel. Het doel is niet om mooie plaat
jes te verkrijgen, maar zo exact mogelijk
het origineel. Daarom is structurele soft
warematige verbetering ongewenst. Te
meer, omdat verwacht mag worden dat in
de toekomst de benodigde software ver
beterd zal worden.
Voor een optimaal resultaat moet de scan
ner een grote kleurruimte en een hoog
oplossend vermogen hebben om alle
kleuren en nuances waar te nemen en is
van de gebruikte scanner een goed ICC-
profiel nodig om de relatie vast te leggen
tussen de waarden van pixels in RGB en
de werkelijke kleuren.
Originele kleur
De originele kleur is belangrijk,
omdat we een reproductie conform
origineel willen, zodat generaties na ons
digitaal materiaal krijgen dat maximaal
overeenkomt met het origineel. De toege
stane afwijkingen zullen overigens voor
standaard archiefmateriaal wel groter zijn
dan voor museaal materiaal.
Wat is een grote kleurruimte en een hoog
oplossend vermogen? Het kleurbereik van
een scanner wordt bepaald door het aan
tal nuances dat de scanner kan waarne
men en het totale bereik waarbinnen die
scanner nog kleurverschillen kan onder
scheiden. Deze moet groter zijn dan de
kleurruimte van elk te scannen document
om alle kleuren vast te kunnen leggen.
Matige scanners registreren bij het scan
nen van een akte bijvoorbeeld 2000 ver
schillende kleuren. Een goede scanner
registreert dan bijvoorbeeld wel 5000
verschillende kleuren. In combinatie met
een ICC-profiei is hieruit veel nauwkeuri
ger het origineel te herleiden.
Eenzelfde origineel levert op ver
schillende scanners verschillende RGB-
waarden op; dat wil zeggen dat er voor
dezelfde origineelkleuren verschillende
kleurwaarden worden opgeslagen. Zonder
profielen zal dit ook verschillende kleu
ren op het scherm veroorza
ken.
Door metingen kan per
scanner een ICC-profiel
worden vastgelegd. Dit ICC-
profiel legt de koppeling
tussen de RGB-waarden van
de pixels en de werkelijke kleuren, geme
ten in golflengten. Daarmee worden de
kleuren van verschillende scanners weer
gelijk gemaakt. Ook bij beeldschermen
werkt dat zo.
Momenteel is het voorgeschreven dat
compressie geen verlies in kwaliteit mag
opleveren1. Wat daarmee exact bedoeld
wordt is niet geheel duidelijk: zichtbaar
verlies of meetbaar verlies? Daarom is in
dit artikel een aantal opties op een rijtje
gezet om zo de pro's en contra's kwanti
tatief te kunnen afwegen. Voor de goede
orde: één AE is precies het kleinste kleur
verschil dat het menselijk oog kan waar
nemen. En om een praktische relatie uit
de praktijk aan te geven: volgens de ISO-
norm 12647-5 mag drukwerk niet meer
dan 5 AE afwijken.
Vergelijkingsbestanden
Om de verschillende bestandsforma
ten en parameters te kunnen vergelijken,
is een archiefstuk gescand in het Tiff-
bestandsformaat op een kwalitatief goede
scanner. Dit bestand is omgezet naar de
bestandsformaten die we willen vergelij
ken.
Dit bestand is gekozen omdat het kleur
bevat, zodat het ten minste het gemid
delde document (archiefstukken zoals
bouwtekeningen, realisatietekeningen en
vergunningen) goed representeert. Het
bestand is bijgesneden tot een grootte
van 100 MB om de vergelijking te verge
makkelijken.
De resultaten van de omzetting zijn opge
nomen in de onderstaande tabel:
oktober 2009
De 90%-norm wordt algemeen gebruikt om
de gemiddelde kwaliteit van een scan aan te
duiden, waarbij piekwaarden het resultaat niet
onevenredig mogen beïnvloeden. De slechtste
10% worden genegeerd.
Lees verder op pagina 25
oktober 2009
23
digitaliseringen informatisering
Door Guido Dorssers en Johan Kerver
Het is verbijsterend dat beperkt kwaliteits
verlies door lossy compressie, zoals bijvoor
beeld JPEG, onacceptabel is volgens richtlij
nen en ministeriële regelingen, en dat grijs
waarden en zelfs bitonale conversie zonder
compressie wel geaccepteerd worden. Beide
opties worden ingegeven door de behoefte
de bestanden zo klein mogelijk te houden in
verband met de kosten van data-opslag. Of
dat werkelijk relevant is, moet worden bezien
omdat elke twee jaar de capaciteit van opslag
verdubbeld, maar de kosten perGB halve
ren. Daarom heeft het Regionaal Historisch
Centrum Eindhoven een normatief onderzoek
gedaan om te bepalen wat mogelijke alterna
tieven zijn. In dit artikel treft u de resultaten
en de conclusie van dit onderzoek aan.
Wat doet een ICC-profiel?
Basisscan archiefstuk Tiff ongecomprimeerd, ingezoomd
tot op pixelniveau.
Grootte
Type
Gemiddeld AE
Max. AE
90% binnen AE
100 MB
Tiff ongecomprimeerd
0
0
0
64.7 MB
Tiff LZW-gecomprimeerd
0
0
0
(verliesvrij)
48.9 MB
JPEG2000 lossless
0
0
0
48.9 MB
JPEG2000 maximaal
(kwaliteit 100 op schaal van 1-100)
0
0
O
48.0 MB
JPEG2000 hoog (kwaliteit 95)
0.26
1.73
1-73
31.9 MB
JPEG2000 hoog (kwaliteit 65)
2-53
15.00
4.69
25.1 MB
JPEG2000 gemiddeld (kwaliteit 50)
3.30
21.19
5-74
5.1 MB
JPEG2000 minimum (kwaliteit 10)
7.87
45-99
13-75
32.6 MB
JPEG maximale
2.07
11.06
3.32
(kwaliteit 12 op schaal van 1-12)
10.1 MB
JPEG hoge kwaliteit (kwaliteit 10)
5-25
21.24
8.60
3.6 MB
JPEG medium kwaliteit
7.64
41.09
12.96
(kwaliteit 6)
20.9 MB
Tiff LZW-gecomprimeerd
218.47
286.07
262.48
Grijswaarden
22
archievenblad
Grafische weergave van de verschillen
JPEG2000 kwaliteit hoog (65):
de gele pixels zijn buiten de 90%-norm,
AE >4.69.
JPEG2000 kwaliteit minimum 10): de gele
pixels zijn buiten de 90%-norm, AE >6.65.
JPEG kwaliteit maximaal (12): de gele
pixels zijn buiten de 90%-norm, AE >3.32.
JPEG kwaliteit hoog 10): de gele pixels
zijn buiten de 90%-norm, AE >8.60.
JPEG kwaliteit medium (6), de gele pixels
zijn buiten de 90%-norm, AE 12.96
Grijswaarden Tiff, verliesvrij gecompri
meerd. Geen gele pixels omdat alle pixels
een AE hebben 218.47, vrijwel het hele
plaatje zou geel zijn. Merk op dat de rode
informatie niet meer te onderscheiden
valt als later toegevoegd.
archievenblad
l!Ni