Alles digitaal opslaan en op grote schaal bewaren gebeurt de-facto om ons heen.
Big Data platforms en Big Data analytics werpen nieuw licht op het belang van het
verzamelen en bewaren van zoveel mogelijk data. Data zijn de belangrijkste grond
stof voor de digitale economie en kennissamenleving, goedkoop om op te slaan en
waarschijnlijk de commodity van de nabije toekomst. Bedrijfsleven, wetenschap en
publieke sector - allemaal richten ze zich op hergebruik van data als grondstof ten
einde informatie met toegevoegde waarde te produceren voor consumenten, onder
zoekers en burgers. Aan de basis van iedere verandering of vooruitgang in de geschie
denis van de mens staat zijn inventiviteit met betrekking tot het verzamelen,
bewaren, distribueren en bewerken van grondstoffen. In de oudheid was graan de
grondstof die het mogelijk maakte om zich op een willekeurige plaats en gedurende
het hele jaar door te voeden. De ontwikkeling van een landbouwcultuur met veel
aandacht voor het bewaren en bewerken van graan leidde tot een veelheid aan van
graan afgeleide voedselproducten die ook nu nog dagelijks en wereldwijd worden
geconsumeerd. De industriële revolutie is ondenkbaar zonder de beschikbaarheid
van fossiele brandstoffen. Ook hier was de creativiteit van de mens de motor achter
het verzamelen en bewaren van de grondstof en het ontwikkelen van innovatieve
technologie, waarmee nieuwe producten vervaardigd konden worden. Data als
grondstof voor de digitale informatiesamenleving en kenniseconomie hebben een
vergelijkbaar of zelfs hoger potentieel om de commodity van de nabije toekomst te
zijn. Net als graan en fossiele brandstoffen moeten we data efficiënt op kunnen
slaan om ze op een later moment beschikbaar te maken voor bewerking. Vanuit een
markt-perspectief vormen producenten en bewaarders van data het aanbod.
Gebruik en bewerking bepalen de toegevoegde waarde en de potentie ervan. Van de
praktijk met traditionele grondstoffen leren we dat 'afval' een relatief begrip is.
Grondstofonderdelen en bijproducten van grondstofverwerking die waardeloos
werden geacht blijken later geschikt te zijn voor het maken van nieuwe producten,
zoals plastic uit aardolie. Maar in tegenstelling tot traditionele grondstoffen kunnen
data oneindig gebruikt en hergebruikt worden zonder dat de inhoud vervliegt of de
integriteit en structuur wijzigt; eens temeer een reden om data zoveel mogelijk in
hun originele staat in depot te houden. Afgeleiden en transformaties kunnen altijd
vervaardigd worden, zolang het origineel bewaard is. Een ander bijzonder kenmerk
van databewerking is dat eindproducten op hun beurt weer als grondstof kunnen
dienen. Zo kan er een oneindige keten van informatieproducten ontstaan die
gekoppeld en hergebruikt kunnen worden. Het gaat niet alleen om de grote data
banken met gestructureerde data zoals die van het Kadaster of van het KNMI.
Het gaat ook steeds meer om (semi-)ongestructureerde data, zoals: kranten, wet
teksten, en andere grote tekstcorpora; e-mail en Twitter-archieven.
Er vormt zich een stratificatie van data en informatiebronnen die bij elkaar genomen
de grondstof voor de informatiemaatschappij vormen. Overheidsdata en overheids
informatie hebben hierin een zeer belangrijk aandeel. Er zijn bij digitale informatie
eigenlijk geen overtuigende fysieke of financiële argumenten voor het vernietigen
van data of informatiebronnen die wij nu als overtollig of overbodig beoordelen.
De kans dat we het kind met het badwater weggooien is reëel aanwezig, zeker als we
dat op grote schaal zouden doen.
Het is mogelijk om grote hoeveelheden overheidsdata en overheidsinformatie voor
de lange termijn kosteneffectief op te slaan. Dat vergt alleen een grootschalige
aanpak. De overheid, de zelfstandige bestuursorganen, publiek-gefinancierde instel
lingen voor bijvoorbeeld onderwijs, gezondheid, waterhuishouding, archiefbewaar
plaatsen en andere publieke erfgoedinstellingen hebben allen behoefte aan exact
dezelfde beheersbare en betaalbare lange termijn opslag van digitale overheidsdata
en informatie. Weliswaar stellen de Wob, de Archiefwet, de Who en de informatie
behoefte van burgers, wetenschap en bedrijfsleven, allemaal verschillende eisen aan
de toegankelijkheid en herbruikbaarheid van de data, maar die staan los van de
behoefte aan lange termijn opslag. Dit aspect, de ontkoppeling van verzamelen/
produceren, bewaren, distribueren en gebruiken, zoals we dat zien in de grondstof-
fenindustrie, is cruciaal voor de efficiëntie. Technologie voor een dienst die alleen tot
doel heeft een grootschalig landelijk digitaal overheidsdepot te zijn, kan veel makke
lijker en beter beheersbaar ingekocht worden dan momenteel het geval is met de
veelheid aan digitale depots en data-centra. De verdeling van het opslagbudget over
verschillende organisaties die op hun beurt onder verschillende ministeries vallen,
leidt tot het cultiveren van fictieve verschillen, met als gevolg versnippering en wild
groei aan relatief dure, op maat gemaakte, kleinschalige, sector-specifieke, bewaar-
oplossingen.
Waaruit bestaat die uniforme behoefte aan lange termijn bewaring? Het gaat om
massaopslag van (historische) overheidsgegevens en -informatie van twintig jaar of
ouder waarvan het beheer overgedragen is aan een archiefinstelling.12 Het moet
opschaalbaar en betaalbaar zijn. Directe en snelle toegang is niet vereist omdat er
geen onmiddellijke bestuurlijke, economische, juridische of medische belangen mee
gemoeid zijn. De informatie hoeft niet via het Internet toegankelijk te zijn. Er zit een
dag of meer tussen aanvraag en levering. De bestanden worden bewaard zoals ze
geleverd worden en er worden standaard controles en handelingen uitgevoerd om te
zorgen dat ze machine-leesbaar en kopieerbaar blijven. Dit alles past binnen de
standaard service levels die een data center kan leveren en komt in de buurt van een
back-up diensten niveau. De huidige opslagtechnologieën voor dit type opslag (opti
sche schijven, tapes, de cloud) zijn toereikend voor de hierboven geschetste behoefte.
De ongekende en ongelimiteerde vraag naar data is de impuls voor de industrie om
te zoeken naar nieuwe en goedkopere manieren om data voor langere tijd te kunnen
bewaren. Deze mega opslagtechnologieën zullen het ook in de toekomst onnodig
maken om met financiële argumenten data te vernietigen. Eternal 5D data storage
(Universiteit van Southampton) of Data Storage in DNA (Universiteit van
Washington en Microsoft) zijn voorbeelden van potentiële technologieën die in de
groeiende vraag naar duurzame en langdurige massaopslag zouden kunnen
voldoen.13
91
theorie
90
titia en bram van der werf papieren tijgers in de digitale jungle:
over het bewaren van overheidsinformatie
12 De overbrengingstermijn van archiefbescheiden naar een archiefbewaarplaats is vastgesteld in de
Archiefwet. Met de inwerkingtreding van de Archiefwet 1995 is de termijn verkort van 50 naar 20 jaar.
Momenteel is er opnieuw, in het licht van de digitale overheid, discussie over een sterke reductie van deze
termijn. In dit essay gebruiken we de vigerende termijn van 20 jaar, maar het feit dat het historisch materiaal
betreft onder verantwoordelijkheid van archieven is van groter belang dan hoe oud het materiaal is.
13 Zie: P.G. Kazansky, A. Cerkauskaite, R. Drevinskas en J. Zhang, 'Eternal 5D optical data storage in glass', in:
Conference Proceedings of The international society for optics and photonics (SPIE 9959:Optical Data Storage
2016), 99590D (2 november 2016), DOI:10.1117/12.2240594, http://dx.doi.org/10.1117/12.2240594; A.
Regalado, 'Microsoft Has a Plan to Add DNA Data Storage to Its Cloud', MIT Technology Review (22 mei
2017), https://www.technologyreview.com/sZ607880/microsoft-has-a-plan-to-add-dna-data-storage-to-its-
cloud/.