Wie slim is, selecteert.
Ook digitaal!
1. Selectie is nodig!
filip boudrez
Het waarderen en selecteren van digitale archieven zorgt al meer dan een decennium
voor een geanimeerd debat. Een debat dat al lang geen interne discussie onder archi
varissen meer is, maar een waarbij archivarissen steeds meer met andere professies
in dialoog gaan. Niet alleen de vraag over het nut of de noodzaak staat hierbij cen
traal, ook de wijze van uitvoering in het digitale tijdperk geeft volop stof tot discussie.
Deze bijdrage wil dieper ingaan op beide dialoog door te motiveren waarom
selectie nog steeds nodig is en door aan te geven hoe digitale archieven kunnen
worden geselecteerd. Het archiveren van dossiers en documenten uit digitale infor
matiesystemen wordt hierbij gebruikt als illustratiemateriaal. Diverse casussen
komen aan bod.
De voorbije decennia is over de noodzaak van het selecteren van digitale archieven
al heel wat discussie gevoerd. Het selecteren van archieven is altijd al een onderwerp
van discussie geweest, maar met betrekking tot digitale archieven wordt de selectie-
noodzaak steeds meer in twijfel getrokken. Traditioneel verdedigen archivarissen de
noodzaak aan selectie met als voornaamste argumenten de kosten en onhaalbaar
heid om alles te bewaren en toegankelijk te maken. Deze argumenten worden in het
digitale tijdperk openlijk in vraag gesteld. De meest aangehaalde tegenargumenten
zijn de almaar dalende opslagkosten voor digitale informatie en het snel terugvinden
dankzij goede zoekmachines.
1.1. Kosten
1.1.1. Opslagkosten
De opslagkosten voor digitale data kennen een dalende evolutie en deze trend zal
zich de komende jaren nog verder zetten. Digitale gegevensdragers worden almaar
goedkoper en stockeren steeds grotere volumes aan data.1 Hierdoor ontstaat al snel
het beeld dat digitale opslag goedkoop is en dat alles blijvend bewaren goedkoper is
dan het uitvoeren van archiefselecties. Het kostenbeeld wordt hierbij voornamelijk
1 A. Klein, 'Hard Drive Cost Per Gigabyte', 11 juli 2017, https://www.backblaze.com/blog/hard-drive-cost-per-
gigabyte.
2 'Statistic Brain, Average Cost of Hard Drive Storage', 2 september 2016, http://www.statisticbrain.com/
average-cost-of-hard-drive-storage.
3 T. Hessling, De kosten van duurzame digitale toegankelijkheid (Amsterdam 2010); Nationale Coalitie Digitale
Duurzaamheid, Onderzoek naar de kosten digitale duurzaamheid (2017); L. Rommers, Wat kost duurzame
digitale opslag? (Rijswijk 2017).
68
filip boudrez wie slim is, selecteert. ook digitaal!
bepaald door wat gewone consumenten betalen voor de aanschaf van hun externe
harde schijven of particuliere NAS-boxen. Een harde schijf met 200 MB opslag
capaciteit kostte in 2005 ongeveer 140 dollar.2 Voor hetzelfde bedrag heb je 10 jaar
later een schijf met minstens 2 TB aan opslagcapaciteit.
Dit beeld strookt niet met de werkelijke kosten voor het opnemen, het beheren en
het toegankelijk maken van digitaal archief (zie verder). Opslag van de data is slechts
één kostenpost in de totale cost-of ownership van digitaal archief. Bovendien zijn aan
professionele en veilige opslag van data veel meer kosten verbonden dan het aan
schaffen van schijven alleen: back-up, redundantie in de gegevensopslag, mirroring
over meerdere sites, investeringen in opslagrobots of -racks, disaster recovery,
systeembeheer, beveiliging, energie, koeling, support, enz. Deze kosten overstijgen al
snel het aankopen en het vervangen van schijven alleen. En bij digitaal archiveren
gaat het vanzelfsprekend niet alleen over kosten op korte termijn.
Het berekenen en het voorspellen van de opslagkosten op middellange en lange
termijn is geen evidente oefening. Hier bestaan verschillende kostenmodellen voor.3
Niet alleen is het moeilijk in te schatten wat het verwachte datavolume zal zijn, de
prijsberekeningen en de economische modellen zijn volop voer voor discussie.
De Amerikaanse ICT'er David Rosenthal wijdt hier een blog aan.4 Uit zijn vele blog-
posts blijkt in ieder geval dat de voorspelling van een lineaire en exponentiële stijging
in schijfcapaciteit, en bijgevolg een daling in opslagkosten ('Kryder's law'), niet
overeenstemt met de werkelijke prijsevolutie van de voorbije jaren.5 Schijven blijken
vele malen duurder te zijn dan de voorspellingen aangaven. Rosenthal besluit dan
ook met: 'The real cost of a commitment to store data for the long term is much
greater than most people believe, and there is no realistic prospect of a technological
discontinuity that would change this'.6
1.1.2. Licentiekosten
Niet selecteren houdt ook in dat alle informatie verder moet beheerd en geraad
pleegd kunnen worden. Hiervoor zijn softwareapplicaties nodig. Dit kunnen proces-
of vakapplicaties, datawarehouses, documentmanagement- of zaaksystemen,
records management applicaties of e-depots zijn. Elke organisatie beschikt al snel
over enkele tientallen, zo niet honderden, verschillende applicaties, alle inspannin
gen inzake enterprise architectuur en optimalisaties ten spijt. Het gebruik van deze
applicaties houdt licentiekosten in, kosten die dikwijls aanzienlijk zijn,7 en vergt
daarnaast ook functioneel en technisch beheer. Het hoeft dan ook geen verwonde
ring te wekken dat instellingen ernaar streven om het aantal applicaties te beperken
en af te bouwen om zo de kosten te drukken. Alles bijhouden gaat hier lijnrecht tegen
in.
Softwareapplicaties hebben bovendien een beperkte houdbaarheidstermijn.
De bewaartermijn van archiefdocumenten en hun metadata overstijgt doorgaans de
levensduur van de applicatie waarbinnen ze werden gevormd. Niet selecteren en
alles bijhouden houdt bijgevolg in dat:
4 http://blog.dshr.org.
5 D. Rosenthal, 'Storage will be much less free than it used to be', 14 mei 2014, http://blog.dshr.org/2014/05/
talk-at-seagate.html.
6 D. Rosenthal, 'Patting myself on the back', 20 juli 2017, http://blog.dshr.org/2017/07/patting-myself-on-
back.html.
7 Licentiekosten zijn afhankelijk van het licentiemodel: site-licentie, kostprijs per volume, aantal gebruikers,
enz. Een licentiekost per gebruiker bijvoorbeeld kan variëren van enkele tientallen euro's per jaar tot enkele
duizenden euro's per jaar al naargelang het pakket.
69