De a-selecte methode voor
steekproeven
[36]
teria) voor blijvende bewaring aangewezen. Wij
moeten echter kiezen of wij (a) alles bewaren - 'niet
alle informatie is geanalyseerd of samengevat' - ;(b)
alles vernietigen - 'wat niet gebruikt is, is routine,
en dat bewaren wij nu eenmaal niet' - of (c) een
steekproef bewaren. Het is opmerkelijk dat deze
vragen slechts gesteld worden bij dossiers die op
mensen betrekking hebben. Hebben routinemati
ge bestanden van een waterstaatsdienst een grotere
informatieve waarde dan die van de sociale dienst?
Men kan toch evengoed stellen, dat bouwdossieis
vernietigbaar zijn en die van de sociale dienst niet:
de gebouwen blijven staan, en mensen zijn sterfe
lijk. Niettemin, zowel in Nederland als in het bui
tenland worden bouwdossiers en dergelijke zonder
vorm van discussie bewaard en is slechts de eventu
ele vernietiging van persoonsdossiers aan discussie
onderhevig.
Op grond van vernietigingslijsten worden vaak
dossiers van precedentvormende gevallen en van
personen die op enig gebied van bijzondere bete
kenis zijn geweest van vernietiging uitgezonderd.
Precedentvorming is een enigszins objectief argu
ment (hogere juridische waarde), maar bijzondere
personen' is subjectief; de toepassing is afhankelijk
van de kennis van de selecteur en van de aard van
het materiaal. Soms worden daarbij zelfs profeti
sche eisen gesteld aan de selecteur: uit een school
administratie met een vernietigingstermijn van
drie tot vijf jaar kan men de gegevens - dossiers zijn
het meestal niet eens - betreffende één later be
roemde leerling materieel niet van vernietiging
uitzonderen. Voor zover redelijkerwijze mogelijk
kan de selecteur dus in ieder geval de psychiatri
sche dossiers van Van Gogh, Achterberg en Vest
dijk van vernietiging uit te zonderen, als hij de rest
van dat bestand wil vernietigen of steekproefsge
wijs bewaren. Ook kunnen extra beduimelde dos
siers worden gecontroleerd op bijzondere waarde.
Dit blijft dus subjectief.
De objectieve steekproef kan op verschillende ma
nieren gemaakt worden, namelijk een chronologi
sche, een alfabetische (op persoonsnaam), een nu
merieke (op eindcijfer(s)) en een reeks gevonden
door gebruikmaking van at random-getallenreek-
sen, die in ieder leerboek statistiek te vinden zijn.
Men kan met alle vier technieken een steekproef
van iedere gewenste omvang maken van i%o tot
50%. F. Huil5 toont overtuigend aan dat de chro
nologische en de alfabetische methoden en de nu
merieke, gebaseerd op (een vaste combinatie van)
eindcijfers, geen valide resultaten kunnen geven.
Bij de keuze van bepaalde letters of lettercombina
ties mist men veranderingen in de samenstelling
van de bevolking en bij een chronologische mist of
overbenadrukt men de veranderingen die in een
organisatie in de respectievelijk niet en wel be
waarde jaren heeft plaatsgehad.
De eindcijfers kunnen een psychologische invloed
hebben gehad op degene die het dossier heeft ge
vormd of ermee heeft gewerkt; ze kunnen bij voor
beeld aan bij voorbaat als interessant beschouwde
gevallen zijn toegekend. Als valide methode blijft
slechts over de objectiviteit van de statistische ge
tallenreeks, in het vervolg de a-selecte steekproef
genoemd. Deze kan men ook op bestaande eind
cijfers toepassen.
Er worden twee argumenten genoemd voor de
a-selecte steekproef:
1 de methode biedt de mogelijkheid om het dage
lijkse normale functioneren van een organisatie te
reconstrueren;
2 de methode biedt de historicus, speciaal de soci
aal-economische historicus, een onderzoeksmoge-
lijkheid in op zichzelf om formele en/of inhoude
lijke reden vernietigbaar materiaal.
Tegenover het eerste argument, het kunnen beoor
delen van het dagelijkse, gewone functioneren, stel
ik, dat men dat functioneren ook kan beoordelen
uit de subjectieve steekproef en de eventuele prece
dentvormende gevallen en verder uit jaarverslagen,
samenvattingen en beleidsdossiers. Men heeft dit
argument gebruikt in de discussies rond de per
soonsdossiers in het BVD-archief. Men overweegt
een a-selecte selectie die antwoord moet geven op
de vragen, of de dienst in de periode 1945-1983
zich aan de wet heeft gehouden of zich al dan niet
aan de democratische controle heeft onttrokken?
Hoe ging de bvd om met de samenleving en hoe
de samenleving met de bvd?6 Het is mijns inziens
zeer de vraag of men dergelijke vragen kan beant
woorden met steekproefsgewijze bewaring, onge
acht of het een subjectieve of een objectieve steek
proef betreft. De dienst interesseerde zich namelijk
niet voor de samenleving (en had dat ook niet als
taak), maar voor individuen, en het bestanddeel in
discussie (persoonsdossiers) is ook volgens indivi
duen geordend. Ook de vraag hoe de samenleving
omging met de bvd, laat zich niet met de per
soonsdossiers beantwoorden, omdat de inhoud
van de dossiers is afgeschermd van de bron waar de
inlichtingen vandaan komen. Die vraag is dan ook
alleen uit beleidsdossiers en parlementaire stukken
te beantwoorden.
Tegenover het tweede argument, dat van de onder
zoeksmogelijkheden, voer ik zowel theoretische als
praktische bedenkingen aan.
Ook F. Huil heeft niet aangegeven op welke wij
ze men de omvang van de steekproef (quote) be
paalt. Daarvoor gelden de regels van de statistiek
theorie:
1 Bij een relatief klein aantal dossiers moet de
steekproef een hoger percentage omvatten;
2 als een onderzoeker slechts een deel van een be
stand nodig heeft, bij voorbeeld gezinnen met
twee schoolgaande kinderen, of personen die in
een bepaald gebied wonen, dan moet men voor ge
lijkwaardige resultaten een veel grotere steekproef
nemen. Achteraf, als het merendeel al vernietigd is,
kan dat natuurlijk niet meer;
3 wanneer een hogere graad van nauwkeurigheid
in het onderzoeksresultaat vereist is, vergt dat een
grotere quote;
4 en ten slotte moet men een deel van zijn bestand
reserveren als controlebestand.
Er zijn dus minstens vier redenen waarom een
steekproef achteraf en onherroepelijk te klein zal
kunnen blijken.
De quote is te berekenen met statistische formules.
Men moet echter van te voren weten, welke onder
zoekers welke vragen stellen en welke graad van
nauwkeurigheid enerzijds en betrouwbaarheid an
derzijds is vereist: iedere variabele binnen een dos
sier leidt bij iedere quote tot een aan die variabele
gebonden standaardfout, en een dossier heeft tal
loze variabelen. In de statistiek wordt veiligheid
duur gekocht'.7 Met deze formules kan men zelfs
uitrekenen dat een compleet bestand, dus 100%,
of zelfs tot 200% bewaard moet worden. Met an
dere woorden, de onderzoeker moet van elders
aanvullende gegevens verwerven. Dat is uiteraard
niet de taak van de archiefbeheerder.
Een goed voorbeeld voor het bepalen van de quote
is het volgende. De binnengekomen formulieren
van de volkstelling van 1971 zijn gerangschikt vol
gens woonadres, 4-5 miljoen pakjes formulieren.
Om geldige conclusies over de Nederlandse bevol
king als geheel te kunnen formuleren was daarvoor
een steekproef van 1% toereikend geweest. Men
wilde echter ook per regio gedifferentieerde resul
taten hebben, en dat bracht de benodigde quote op
10% van 4-5 miljoen adressen (en 13 tot 14 mil
joen namen). De studies zijn nog niet afgerond en
het gehele bestand wordt, voor zover mij bekend,
nog steeds bewaard.
Volgens een andere stroming in de statistiekweten
schap zou in alle gevallen een steekproef van 1000-
1 500 dossiers voldoende zijn. Op het eerste gezicht
zou dat een aanmerkelijke verlichting van de be-
waarlast inhouden (voor de volkstelling zou dat
betekenen 10 x 1500 adressen, dus 1 5 000 in plaats
van 400000 a 500000). Ik ben echter zo vrij aan te
nemen dat men bij het cbs wel weet waarom voor
een percentage is gekozen en niet voor een abso
luut aantal. Het verschil tussen beide methoden
van steekproef trekken is bij de veel meer voorko
mende kleinere en gedifferentieerde bestanden
veel minder groot: een steekproef uit 1 5 000 dos
siers leidt bij beide methoden (5% of 10% of 1000
a 1500) tot een zelfde hoeveelheid bewaarde dos
siers.
Een eerste vereiste voor het trekken van een steek
proef uit een bestand is namelijk dat de dossiers
formeel en inhoudelijk uniform zijn. Om die re
den is er door het ministerie van justitie in de Ver
enigde Staten een categorieënindeling gemaakt uit
[37]