Alles digitaal opslaan en op grote schaal bewaren gebeurt de-facto om ons heen. Big Data platforms en Big Data analytics werpen nieuw licht op het belang van het verzamelen en bewaren van zoveel mogelijk data. Data zijn de belangrijkste grond stof voor de digitale economie en kennissamenleving, goedkoop om op te slaan en waarschijnlijk de commodity van de nabije toekomst. Bedrijfsleven, wetenschap en publieke sector - allemaal richten ze zich op hergebruik van data als grondstof ten einde informatie met toegevoegde waarde te produceren voor consumenten, onder zoekers en burgers. Aan de basis van iedere verandering of vooruitgang in de geschie denis van de mens staat zijn inventiviteit met betrekking tot het verzamelen, bewaren, distribueren en bewerken van grondstoffen. In de oudheid was graan de grondstof die het mogelijk maakte om zich op een willekeurige plaats en gedurende het hele jaar door te voeden. De ontwikkeling van een landbouwcultuur met veel aandacht voor het bewaren en bewerken van graan leidde tot een veelheid aan van graan afgeleide voedselproducten die ook nu nog dagelijks en wereldwijd worden geconsumeerd. De industriële revolutie is ondenkbaar zonder de beschikbaarheid van fossiele brandstoffen. Ook hier was de creativiteit van de mens de motor achter het verzamelen en bewaren van de grondstof en het ontwikkelen van innovatieve technologie, waarmee nieuwe producten vervaardigd konden worden. Data als grondstof voor de digitale informatiesamenleving en kenniseconomie hebben een vergelijkbaar of zelfs hoger potentieel om de commodity van de nabije toekomst te zijn. Net als graan en fossiele brandstoffen moeten we data efficiënt op kunnen slaan om ze op een later moment beschikbaar te maken voor bewerking. Vanuit een markt-perspectief vormen producenten en bewaarders van data het aanbod. Gebruik en bewerking bepalen de toegevoegde waarde en de potentie ervan. Van de praktijk met traditionele grondstoffen leren we dat 'afval' een relatief begrip is. Grondstofonderdelen en bijproducten van grondstofverwerking die waardeloos werden geacht blijken later geschikt te zijn voor het maken van nieuwe producten, zoals plastic uit aardolie. Maar in tegenstelling tot traditionele grondstoffen kunnen data oneindig gebruikt en hergebruikt worden zonder dat de inhoud vervliegt of de integriteit en structuur wijzigt; eens temeer een reden om data zoveel mogelijk in hun originele staat in depot te houden. Afgeleiden en transformaties kunnen altijd vervaardigd worden, zolang het origineel bewaard is. Een ander bijzonder kenmerk van databewerking is dat eindproducten op hun beurt weer als grondstof kunnen dienen. Zo kan er een oneindige keten van informatieproducten ontstaan die gekoppeld en hergebruikt kunnen worden. Het gaat niet alleen om de grote data banken met gestructureerde data zoals die van het Kadaster of van het KNMI. Het gaat ook steeds meer om (semi-)ongestructureerde data, zoals: kranten, wet teksten, en andere grote tekstcorpora; e-mail en Twitter-archieven. Er vormt zich een stratificatie van data en informatiebronnen die bij elkaar genomen de grondstof voor de informatiemaatschappij vormen. Overheidsdata en overheids informatie hebben hierin een zeer belangrijk aandeel. Er zijn bij digitale informatie eigenlijk geen overtuigende fysieke of financiële argumenten voor het vernietigen van data of informatiebronnen die wij nu als overtollig of overbodig beoordelen. De kans dat we het kind met het badwater weggooien is reëel aanwezig, zeker als we dat op grote schaal zouden doen. Het is mogelijk om grote hoeveelheden overheidsdata en overheidsinformatie voor de lange termijn kosteneffectief op te slaan. Dat vergt alleen een grootschalige aanpak. De overheid, de zelfstandige bestuursorganen, publiek-gefinancierde instel lingen voor bijvoorbeeld onderwijs, gezondheid, waterhuishouding, archiefbewaar plaatsen en andere publieke erfgoedinstellingen hebben allen behoefte aan exact dezelfde beheersbare en betaalbare lange termijn opslag van digitale overheidsdata en informatie. Weliswaar stellen de Wob, de Archiefwet, de Who en de informatie behoefte van burgers, wetenschap en bedrijfsleven, allemaal verschillende eisen aan de toegankelijkheid en herbruikbaarheid van de data, maar die staan los van de behoefte aan lange termijn opslag. Dit aspect, de ontkoppeling van verzamelen/ produceren, bewaren, distribueren en gebruiken, zoals we dat zien in de grondstof- fenindustrie, is cruciaal voor de efficiëntie. Technologie voor een dienst die alleen tot doel heeft een grootschalig landelijk digitaal overheidsdepot te zijn, kan veel makke lijker en beter beheersbaar ingekocht worden dan momenteel het geval is met de veelheid aan digitale depots en data-centra. De verdeling van het opslagbudget over verschillende organisaties die op hun beurt onder verschillende ministeries vallen, leidt tot het cultiveren van fictieve verschillen, met als gevolg versnippering en wild groei aan relatief dure, op maat gemaakte, kleinschalige, sector-specifieke, bewaar- oplossingen. Waaruit bestaat die uniforme behoefte aan lange termijn bewaring? Het gaat om massaopslag van (historische) overheidsgegevens en -informatie van twintig jaar of ouder waarvan het beheer overgedragen is aan een archiefinstelling.12 Het moet opschaalbaar en betaalbaar zijn. Directe en snelle toegang is niet vereist omdat er geen onmiddellijke bestuurlijke, economische, juridische of medische belangen mee gemoeid zijn. De informatie hoeft niet via het Internet toegankelijk te zijn. Er zit een dag of meer tussen aanvraag en levering. De bestanden worden bewaard zoals ze geleverd worden en er worden standaard controles en handelingen uitgevoerd om te zorgen dat ze machine-leesbaar en kopieerbaar blijven. Dit alles past binnen de standaard service levels die een data center kan leveren en komt in de buurt van een back-up diensten niveau. De huidige opslagtechnologieën voor dit type opslag (opti sche schijven, tapes, de cloud) zijn toereikend voor de hierboven geschetste behoefte. De ongekende en ongelimiteerde vraag naar data is de impuls voor de industrie om te zoeken naar nieuwe en goedkopere manieren om data voor langere tijd te kunnen bewaren. Deze mega opslagtechnologieën zullen het ook in de toekomst onnodig maken om met financiële argumenten data te vernietigen. Eternal 5D data storage (Universiteit van Southampton) of Data Storage in DNA (Universiteit van Washington en Microsoft) zijn voorbeelden van potentiële technologieën die in de groeiende vraag naar duurzame en langdurige massaopslag zouden kunnen voldoen.13 91 theorie 90 titia en bram van der werf papieren tijgers in de digitale jungle: over het bewaren van overheidsinformatie 12 De overbrengingstermijn van archiefbescheiden naar een archiefbewaarplaats is vastgesteld in de Archiefwet. Met de inwerkingtreding van de Archiefwet 1995 is de termijn verkort van 50 naar 20 jaar. Momenteel is er opnieuw, in het licht van de digitale overheid, discussie over een sterke reductie van deze termijn. In dit essay gebruiken we de vigerende termijn van 20 jaar, maar het feit dat het historisch materiaal betreft onder verantwoordelijkheid van archieven is van groter belang dan hoe oud het materiaal is. 13 Zie: P.G. Kazansky, A. Cerkauskaite, R. Drevinskas en J. Zhang, 'Eternal 5D optical data storage in glass', in: Conference Proceedings of The international society for optics and photonics (SPIE 9959:Optical Data Storage 2016), 99590D (2 november 2016), DOI:10.1117/12.2240594, http://dx.doi.org/10.1117/12.2240594; A. Regalado, 'Microsoft Has a Plan to Add DNA Data Storage to Its Cloud', MIT Technology Review (22 mei 2017), https://www.technologyreview.com/sZ607880/microsoft-has-a-plan-to-add-dna-data-storage-to-its- cloud/.

Periodiekviewer Koninklijke Vereniging van Archivarissen

Jaarboeken Stichting Archiefpublicaties | 2018 | | pagina 47