Disclaimer: deze transcriptie is geautomatiseerd omgezet vanuit audio en dus geen officieel verslag. Om de transcripties verder te verbeteren wordt constant gewerkt aan optimalisatie van de techniek en het intrainen van namen, afkortingen en termen. Suggesties hiervoor kunnen worden gemaild naar info@1848.nl.
Werking van digitale datakluizen
[0:00:02] Goedenavond, dames en heren. Welkom bij de technische briefing voor de vaste commissie voor de Financiën met als onderwerp werking van digitale datakluizen.
[0:00:11] We gaan zo beginnen met een aantal sheets, elf stuks, waarin de ambtenaren ons gaan uitleggen wat het precies allemaal inhoudt.
[0:00:18] En daarna kunnen de aanwezige leden van de commissie vragen stellen.
[0:00:23] De bedoeling is dat jullie allemaal één vraag stellen met eventuele verduidelijkingsvraag.
[0:00:27] En als we dat snel doen, dan kunnen we het met z'n allen meerdere rondes gaan noemen.
[0:00:31] Dat betreft dus, ik kijk naar mijn rechterzijde.
[0:00:33] Wie kan ik het eerst het woord geven om aan te trappen?
[0:00:36] De heer Vlot, oh sorry, ik vrat er nog.
[0:00:38] Aan mijn rechterzijde, de heer Vlot, de heer Schuurs, mevrouw Wissink en de heer Stavers.
[0:00:43] Dat heb ik ze allemaal netjes voorgesteld.
[0:00:45] Ik wil dus aan de heer Vlot, ga u gaan.
[0:00:47] Dank u wel, voorzitter.
[0:00:48] En dank dat wij hier weer uitgenodigd zijn om te mogen toelichten wat wij aan het doen zijn met de datacluis.
[0:00:56] Maar voordat ik het wil doen, even nog iets meer toelichting op wie u voor u ziet.
[0:00:59] Dus ik ben Thuis en Vlop, directeur bestuurlijke en politieke zaken bij de Belastingdienst.
[0:01:04] Naast mij zit collega...
[0:01:06] Goedemorgen, Harry Schuurs, hier in de rol van plaatsvervangend CIO en vooral belast met de technische voorbereiding van de datacluis op dit moment, zodat we hem kunnen gaan onderzoeken.
[0:01:19] Ik ben Annemiek Wissink, ik ben afdelingshoofd openbaarheid bij de Belastingdienst en de programmamanager van de datacluis.
[0:01:28] En mijn naam is Aron Stavers, ik ben MT-lid bij de dienst toeslagen en voornamelijk betrokken bij de hersteloperatie van de toeslagenaffaire.
[0:01:39] Ja, dat zijn de collega's die vandaag u verder zullen meenemen in de datakluis.
[0:01:46] Ik heb behoefte om even twee vooropmerkingen te maken.
[0:01:48] De eerste is een algemene, die kent u ook, maar ik maak hem toch even, is van dat wij hier natuurlijk zitten vanuit onze ambtelijke rol.
[0:01:54] En op het moment dat meer politiek getinte vragen komen, dan kan het zijn dat wij zeggen dat we die vraag niet beantwoorden en overlaten aan onze staatssecretarissen.
[0:02:03] Het tweede is misschien nog wel belangrijker, is dat, zoals u ook heeft kunnen lezen in de Kamerbrieven, er een onafhankelijk extern onderzoek is aangekondigd.
[0:02:11] Naar alles wat er met de datacluis is gebeurd door de beide staatssecretarissen.
[0:02:15] De aanbesteding voor een partij die nog nooit bij de belastingdienst gewerkt heeft is bijna afgerond.
[0:02:20] Maar dat betekent dus ook, dat staat ook in de tijdlijn die meegestuurd is met de Kamerbrief afgelopen vrijdag,
[0:02:25] is dat die nog niet gevalideerd is.
[0:02:26] Dus dit is naar ons best te weten als ambtenaren de tijdlijn zoals wij die hebben kunnen reconstrueren.
[0:02:33] Maar er gaan externe onderzoekers nu bij ons de dienst in om met allerlei mensen,
[0:02:36] onder andere met mij, maar ook met anderen, interviews te houden en te kijken van of alles wat hier staat klopt.
[0:02:45] Ik bedoel, het is ook duidelijk dat de hoofdlijn zal ongetwijfeld overeind blijven
[0:02:49] Maar het is goed om te melden dat we hier een niet gevalideerd verhaal vertellen
[0:02:54] Wat nog wel op verzoek van onze beide staatssecretarissen wordt gevalideerd door een externe onderzoeker
[0:02:59] Ik begin met een aantal historische sheets
[0:03:04] En daarna geef ik zo het stokje door aan de collega's
[0:03:06] En dan komen we uiteindelijk bij Annemiek die de presentatie afsluit
[0:03:09] En dan gaan we verder met uw vragen
[0:03:11] Ja? Even het historische perspectief, dan ga ik naar de eerste sheet, de eerste inhoudelijke sheet. Het begint eigenlijk allemaal bij de AVG. Alle organisaties in Nederland moesten op 1 mei 2018 voldoen aan de AVG en in mei 2018 krijgt de Belastingdienst uitstel om te voldoen aan de AVG.
[0:03:37] Een van de elementen daarbij was dat wij heel veel verouderde bestanden hadden, bestanden die we niet goed gearchiveerd hadden.
[0:03:43] Dat was een van de punten die ons onder de aandacht werden gebracht.
[0:03:47] En daarom heeft de Belastingdienst in die tijd besloten om die bestanden apart te zetten, veilig te stellen in een datakluis.
[0:03:53] Met als doel en ook met als ambitie om die op een later moment op een goede manier in archiefbeheer te nemen.
[0:03:59] Dat is eigenlijk het ontstaan van de datakluis.
[0:04:04] zoals u weet
[0:04:05] de Kamer is daarover geïnformeerd via de
[0:04:08] tweede halfjaarsrapportage
[0:04:09] in die tijd hadden wij nog een groot projectstatus
[0:04:12] en dan zie je dat
[0:04:13] in 2019 en 2020
[0:04:15] de datacluis gevuld wordt
[0:04:16] zoals hier staat met
[0:04:18] 64 miljoen bestanden
[0:04:20] uiteindelijk zitten er 24 miljoen inhoudelijke
[0:04:24] bestanden, wat niet
[0:04:24] wil zeggen dat die anderen niet inhoudelijk zijn
[0:04:26] maar wij vermoeden gezien de bestandsextenties
[0:04:29] daar gaat Harry zo meteen nog wat over toelichten
[0:04:31] dat er ongeveer 24 miljoen bestanden in de datacluis zitten die inhoudelijke relevantie hebben waarschijnlijk.
[0:04:39] Wat je ook dan ziet in de tijdlijn is dat er veel discussies in de Belastingdienst
[0:04:44] van hoe gaan we nou om met het verder archiefbeheer nemen, archiveren van alle documenten die in de datacluis zitten.
[0:04:51] En uiteindelijk wordt dat eind 24, begin 25 opgepakt door onze Concernedirectie Facilitaire Dienstverlening.
[0:04:59] Dus dat is de mensen die bij ons het archiefbeheer doen.
[0:05:02] En dan komt, in hun werkzaamheden, komt Medio25 aan het licht dat er misschien documenten in de dataclash zitten die wij hadden moeten leveren aan de PEFD.
[0:05:11] En dan begint eigenlijk de hele aanloop naar de uiteindelijke brief van 15 april.
[0:05:18] Dus dat is even echt in hoofdlijnen even de gang van zaken van de afgelopen periode.
[0:05:25] Collega's, melden het wel als ik echt dingen mis of dingen verkeerd uitleg.
[0:05:31] Dan ga ik even inzoomen op dat onderdeeltje vanaf de zomer.
[0:05:38] Dus onze Centrum voor Facilitaire Dienstverlening, CFD, bij ons, die zijn dus eigenlijk begonnen met het opruimen van de datacluis.
[0:05:46] In dat proces komen ze erachter, samen met de dienst toeslagen, dat er documenten in die datacluis zitten die we waarschijnlijk gemist hebben bij de parlementaire enquête.
[0:05:58] Fraude en Dienstverlening, de PEFD.
[0:06:00] Nee, uiteindelijk betekent dat dat ergens medio zomer 25, wij, en dat betekent dat ook ik zelf, maar ook anderen, van deze informatie op de hoogte raken, dan nadenken over de vraag, wat moeten we doen?
[0:06:15] En wat wij eigenlijk toen bedacht hebben, is dat wij een steekproef wilden uitvoeren op de datacluis, om te kunnen vaststellen van, ja, hebben we documenten gemist, hoeveel dan was de orde grote?
[0:06:27] En toen zijn er twee steekproeven uitgevoerd.
[0:06:30] Eentje door toeslagen en eentje door de Belastingdienst.
[0:06:33] En die blijken, en dat is voor de toeslagen al in oktober, voor de Belastingdienst in november,
[0:06:37] blijken dan dat er documenten gemist zijn die wij hadden moeten leveren aan de parlementaire enquête.
[0:06:45] Dus eind november hebben wij zekerheid over het feit dat het zo is.
[0:06:48] Dan is nog steeds niet, dat is nog steeds niet duidelijk, hoeveel er dan geweest zijn.
[0:06:51] Dat moeten we allemaal natuurlijk nog onderzoeken.
[0:06:53] Maar dat is het moment waarop wij dat zeker weten.
[0:06:57] En misschien nog even in te zoomen op van wat en daar misschien precies is misgegaan.
[0:07:01] Kijk, wij hebben, en dat zit...
[0:07:09] Ja, ik zoek even dat stukje...
[0:07:11] Misschien ga ik toch even gewoon uitleggen.
[0:07:13] Wat er gebeurde bij de parlementaire enquête, kregen wij vorderingen van de parlementaire enquêtecommissie.
[0:07:17] Dus de parlementaire enquêtecommissie heeft ons vorderingen opgestuurd.
[0:07:20] Stuur de documenten die je hebt over een twintigtal onderwerp.
[0:07:24] Die vorderingen hebben wij vertaald in zoekopdrachten binnen de miljoenen documenten van de Belastingdienst.
[0:07:31] En bij die zoekopdrachten zijn wij uitgegaan van bestandsextenties die vooral inhoudelijk zijn.
[0:07:37] Dus dan kun je denken aan .doc, .ppt, .pdf.
[0:07:43] In die bestandsextenties hebben wij de extensie HTML niet meegenomen.
[0:07:47] En hoe werkte de datacluis?
[0:07:49] De datacluis werkte als volgt.
[0:07:51] Als jij als medewerker een map had waar bestanden in stonden en een aantal van die bestanden waren in de datacluis gezet,
[0:07:58] dan scheen daar in jouw map gewoon een HTML-link.
[0:08:01] Dat zag je en dan klik je erop en dan krijg je een webpagina te zien waarin je gevraagd werd van dit document zit in de datacluis.
[0:08:09] Je moet toestemming vragen aan je datacoördinator om dit document te mogen benaderen.
[0:08:13] Omdat wij de HTML niet hebben meegenomen, hebben wij in ieder geval op dat moment ook niet doorgehad dat wij de datacluis gemist hebben in de zoekslag.
[0:08:22] Wat we nu weten, is dat als we dat toen gezien hadden, net zoveel moeite zouden hebben als we nu hebben met het beschikbaar maken en doorzoeken van die datacluis.
[0:08:30] Maar dan hadden ze in ieder geval op dat moment geweten.
[0:08:32] Nou, daar zijn wij dus in de zomer van 25 achtergekomen dat wij in die zoekslag de datacluis gemist hebben.
[0:08:44] Dan gaan we de sheet doen waarin Harry het voor mij gaat overnemen.
[0:08:56] Ja, dankjewel. Een gedeelte is al langsgekomen, de HTML-file die op de plaats gekomen is van de originele file.
[0:09:04] Het is goed om te beseffen dat de datacluis eigenlijk een afgeschermde omgeving is, zonder veel push-pass,
[0:09:10] maar eigenlijk ook verder ook niet de bedoeling was dat iedereen erbij komt.
[0:09:14] Het is een afgeschermde omgeving waar je niet zomaar in kunt zoeken.
[0:09:18] En eigenlijk is hij tot stand gekomen, heel simpel,
[0:09:20] door de directies zijn gevraagd aan te geven welke bestanden moeten daarin gezet worden,
[0:09:26] wat eigenlijk op mapstructuur een hele map in één keer verplaatst is naar de dataclaus.
[0:09:32] En dat levert dan uiteindelijk 64 miljoen bestanden ook.
[0:09:37] Maar omdat je dat op hele mapstructuur gedaan hebt,
[0:09:40] zonder precies te kijken wat zit er nu in die mappen en hoeveel submappen zitten daaronder,
[0:09:45] zijn daar verder geen controles op geweest.
[0:09:47] Dus alles wat daaronder hing, is meegegaan naar de datacluis.
[0:09:51] Door de omvang van de datacluis, dat is eigenlijk wat Jan ook al aangaf,
[0:09:55] kun je ook niet zomaar even zoeken in zo'n datacluis.
[0:09:58] Dat is gewoon onmogelijk.
[0:09:59] Dus enerzijds is die afgeschermd dat niet iedereen erbij kan,
[0:10:03] en anderzijds is het ook dermate groot dat gewoon het doorzoeken daarvan niet mogelijk is.
[0:10:09] Dan weten we zeker, of we verwachten in ieder geval,
[0:10:12] dat omdat het werkdocumenten zijn van medewerkers,
[0:10:15] medewerkers, dat er zeker ook dublures inzitten in die 64 miljoen bestanden. Want mensen werken
[0:10:21] soms samen aan documenten, maken kopieën van documenten, dus we weten zeker dat er ook
[0:10:26] dubbelen inzitten. Alleen als je niet kunt zien wat er precies inzit, weet je ook niet
[0:10:29] wat er dubbelen zijn. We weten ook intussen dat er, ik kan het haast niet zeggen, foto's
[0:10:38] meegegaan zijn van bedrijfsfeestjes, soms. Want die worden ook gemaakt. We weten intussen
[0:10:44] dat er ook beoordelingen meegegaan zijn, omdat dat allemaal in die mappen stond en allemaal meegegaan is.
[0:10:51] Het is Bulck apart gezet. Hij is wel een eigen beheer van de Belastingdienst.
[0:10:59] Daar komt ook wel iets bij kijken, dat moeten we ons wel realiseren.
[0:11:03] Het is intussen zo dat hij jaren geleden gemaakt is, dus de kennis over de datacluis,
[0:11:08] met zijn specifieke inrichting, is ook erg dun geworden binnen de organisatie.
[0:11:14] Dus daar moeten we ook wel goed kijken hoe we dat verder kunnen brengen daar.
[0:11:23] Wat staat er dan in?
[0:11:27] Toen ik hem aantrof waren het 64 miljoen bestanden, zonder dat we eigenlijk wisten.
[0:11:31] En wat is het dan?
[0:11:33] We kunnen het niet doorzoeken.
[0:11:35] En eigenlijk zijn we eerst eens op zoek gegaan, kunnen we nu hier orde scheppen?
[0:11:40] Kunnen we hier gaan onderzoeken wat erin zit?
[0:11:44] Dus we hebben onderzoek laten doen naar wat voor soort extensies zitten er bijvoorbeeld in.
[0:11:48] En hoe ziet de mapstructuur eruit?
[0:11:50] En toen kwam dus boven tafel dat er ongeveer 24 miljoen bestanden in staan die mogelijk interessant zijn.
[0:11:58] En dan praat je over bestanden, doc, pdf, noem maar op.
[0:12:03] De verwachting is ook, met de kennis van u, ik zeg dat heel eerlijk,
[0:12:07] dat er ongeveer 44 miljoen, dus het grootste gedeelte van de bestanden, eigenlijk niet zo relevant zijn.
[0:12:13] Dat wil niet zeggen dat we die niet hoeven te onderzoeken.
[0:12:16] Dat is een eerste inschatting.
[0:12:18] Dat betekent wel dat je je eerst zou kunnen concentreren op die 24 miljoen.
[0:12:23] Maar daarna zullen we natuurlijk wel alles moeten bekijken.
[0:12:27] Als je in die 64 miljoen omstanden kijkt, dan tref je ongeveer 180.000 SIP-files aan.
[0:12:36] Als u niet weet wat een SIP-file is, dat is gewoon een containertje op zich.
[0:12:42] We hebben kunnen kijken wat er in die SIP-files staan.
[0:12:45] Die kunnen we uitpakken.
[0:12:47] En die zitten dan in die 24 miljoen.
[0:12:50] Helaas hebben we ongeveer 46.000 SIP-bestanden gevonden, op dit moment, waar een persoonlijk wachtwoord opgezet is.
[0:12:59] Die mensen zijn vaak ook uit dienst.
[0:13:01] We kunnen niet precies zien wie de eigenaar is, dus daar hebben we nog wel een uitdaging.
[0:13:06] We geven het niet op, maar het is nog wel een uitdaging.
[0:13:09] Daar zitten overigens ongeveer 87.000 bestanden in, die eigenlijk vanuit extensie gezien wel relevant zijn,
[0:13:17] maar waar we dus op dit moment nog niet bij kunnen.
[0:13:23] Dan ga ik even verder.
[0:13:26] Even om gewoon een indrukje te geven.
[0:13:29] Ik schrok er zelf van, zal ik heel eerlijk zijn.
[0:13:31] Als je alle unieke bestandstypen gewoon op een rijtje zet, kom je op 31.000.
[0:13:37] Ik wist niet eens dat we er zoveel hadden, zal ik eerlijk zeggen.
[0:13:41] Hoe komt dat nou?
[0:13:43] Een belangrijke reden is dat je ook heel vaak ziet, die staan niet op deze lijst,
[0:13:48] dat mensen bijvoorbeeld als bestandstype een datum hebben genomen.
[0:13:52] Of een hele specifieke naam van een persoon.
[0:13:55] En dat wordt dan gezien als een apart bestandstype, terwijl we niet weten wat het is.
[0:14:00] Het kan een pdf-verhaal zijn, het kan een foto zijn, het kan een log-verhaal zijn.
[0:14:04] Dus die zullen we allemaal één voor één op een of andere manier nog moeten gaan kijken.
[0:14:09] We zien hier staan onder andere de docs, de pdf's, die zullen bekend zijn.
[0:14:14] De foto's is nog een uitdaging apart om eerlijk te zijn, want het kunnen gewoon foto's zijn van leuke momenten.
[0:14:22] Maar het kunnen ook foto's zijn van screenshots.
[0:14:25] En dan zou het maar zo inhoudelijke informatie kunnen bevatten.
[0:14:29] Het is ook nog een uitdaging om te kijken hoe we dat dan verder kunnen oppakken.
[0:14:40] Dit is wat we op dit moment zien in de dataclish met betrekking tot wie is de eigenaar van welke bestanden.
[0:14:51] Dit is wat we op dit moment daaruit kunnen halen.
[0:14:54] Maar dit is gesorteerd op organisatorische eenheid van toen er tijd.
[0:14:59] Toen was toeslagen onderdeel van de Belastingdienst, douane ook.
[0:15:04] Toen was belasting iets anders georganiseerd dan het nu georganiseerd is.
[0:15:09] Maar dit geeft een eerste indruk van de hoeveelheid bestanden van waar toen die organisatie onderdelen eigenaar van waren.
[0:15:17] We moeten wel oppassen, want hier staan bijvoorbeeld ook onder CAP of MKB,
[0:15:21] zeer waarschijnlijk wel bestanden die te maken hebben met toeslagen of die te maken hebben met douane en vice versa.
[0:15:28] Dus dat moeten we echt onderzoeken.
[0:15:31] Dit geeft dus niet echt exact aan hoeveel bestanden te maken hebben met een bepaalde...
[0:15:39] Dan ben ik aan het eind van mijn verhaal.
[0:15:49] Dankjewel.
[0:15:50] We staan dus nu voor de opgave om die datakluis op te gaan ruimen.
[0:15:56] En voordat we dat kunnen doen, moeten we die kluis eerst kunnen doorzoeken.
[0:16:01] Zoals gezegd door Harry, we kunnen nu kijken hoeveel bestanden zitten erin,
[0:16:06] welke bestandstypen hebben die bestanden allemaal.
[0:16:10] En dat kunnen we zien, maar we kunnen niet zoeken in de documenten.
[0:16:15] En daar is tooling voor nodig.
[0:16:18] Zoals eerder ook al gezegd, de kluis is niet gemaakt om te kunnen doorzoeken,
[0:16:22] is gemaakt om daar documenten in weg te zetten.
[0:16:25] Dus we moeten die kluis doorzoekbaar maken, indexeren heet dat.
[0:16:29] En dat betekent dat je een zoekmachine alle informatie laat analyseren en laat opslaan,
[0:16:36] zodat je dat daarna gemakkelijk kan doorzoeken.
[0:16:39] Daar hebben we inmiddels een externe partij voor aan het werk.
[0:16:42] Die is sinds vorige week ook bezig.
[0:16:45] En die is begonnen met die indexatie, zodat we daarna kunnen gaan zoeken.
[0:16:49] We hebben ons ook georiënteerd bij andere partijen die ook te maken hebben met grote hoeveelheden informatie die doorzocht moeten worden.
[0:16:58] We hebben onder andere gesprekken gevoerd met VWS, die natuurlijk alle corona-informatie hebben.
[0:17:03] met Defensie, met de uitvoeringsorganisatieherstel toeslagen,
[0:17:09] ook om ons te informeren voordat we gingen indexeren van hoe pakken jullie dat aan,
[0:17:14] maar ook als we straks de informatie moeten doorzoeken,
[0:17:17] wat voor tools zijn er dan om gebruik van te maken.
[0:17:23] Ja, en als we dan gaan zoeken, als de kluis één keer doorzoekbaar is,
[0:17:27] dan doen we dat op basis van zoekwoorden.
[0:17:30] En die zoekwoorden worden dan in een soort van queries gezet.
[0:17:34] Dat zijn een soort van formules.
[0:17:36] Omdat je je kan voorstellen, een van de onderwerpen waar we uiteraard op gaan zoeken is bijvoorbeeld RAM.
[0:17:42] Dat als je gaat zoeken op RAM, dan krijg je ook ramen en dat soort zaken.
[0:17:46] Dus er worden formules geschreven, zodat die zoekwoorden ook echt die documenten naar boven halen waar je echt naar op zoeken bent.
[0:17:55] Een aantal van die queries en zoekwoorden zijn er.
[0:17:59] Ik zal even naar de volgende sheet gaan, want het eerste onderdeel eigenlijk van het plan van aanpak om die kluis te gaan opruimen is om in eerste instantie een zoekslag te gaan doen op de politiek-bestuurlijke relevante thema's.
[0:18:13] En dan hebben we het natuurlijk over de parlementaire enquête, fraudebeleid en dienstverlening, de toeslagenaffaire, RAM, FSV, de fraudesignaleringsvoorziening.
[0:18:26] En dan gaan we bij al dat soort onderwerpen kijken van oké welke zoekwoorden zijn er eerder al gebruikt en welke queries en als die er niet zijn dan zullen we zeg maar die zoekwoorden en die queries gaan ontwikkelen.
[0:18:38] Dus dat is zeg maar de eerste spoor in het plan van aanpak om die kluis te gaan opruimen.
[0:18:44] Het tweede spoor gaat over het opruimen van de kluis zelf.
[0:18:48] Dus als we een keer de relevante documenten daaruit hebben gehaald die politiek-bestuurlijk relevant zijn,
[0:18:53] dan gaan we de hele kluis opruimen en van alle bestanden bekijken.
[0:18:58] Moeten ze gearchiveerd worden of kunnen ze vernietigd worden of moeten ze openbaar gemaakt worden?
[0:19:04] Dus dan komt dat proces aan de orde.
[0:19:07] En als het gaat om het eventueel openbaar maken van documenten,
[0:19:10] kijken we ook naar de hotspots die we hebben als financiën.
[0:19:14] Dat zijn natuurlijk de maatschappelijk relevante thema's waar we allerlei informatie over openbaar hebben gemaakt.
[0:19:22] En die hotspots, dan gaat het ook over FSV, maar ook Brexit, corona, de broedkamer, de vertrekregeling.
[0:19:30] Dus we zullen zorgen ook dat alle documenten die in de kluis zitten en over die onderwerpen gaan, toegevoegd worden aan die hotspots.
[0:19:38] Het derde spoor van het plan van aanpak gaat over verzoeken van burgers en bedrijven.
[0:19:43] We krijgen natuurlijk veel WO-verzoeken binnen op het gebied van de wet open overheid, maar ook AVG-inzagenverzoeken.
[0:19:51] En ja, momenteel komen de verzoeken binnen, zowel over de datacluis en de historie van de datacluis,
[0:19:57] maar ook over, zitten er documenten van mij in die datacluis waar ik ooit naar gevraagd heb of die gebruikt worden nu bij AVG-inzagenverzoeken.
[0:20:08] en we hebben natuurlijk in het verleden ook wo-verzoeken behandeld
[0:20:12] en dat kon natuurlijk ook gaan over documenten die in de datacluis zaten
[0:20:16] en die we destijds niet gevonden hebben
[0:20:18] dus dat derde spoor dat gaat helemaal in op hoe gaan we om
[0:20:23] ook met die eerdere wo-verzoeken die we afgehandeld hebben
[0:20:26] en met alle AVG inzagen verzoeken
[0:20:29] de vraag kwam natuurlijk op met het weer vinden, ontdekken van deze datacluis
[0:20:40] Datakluis hebben we als Belastingdienst ook andere datakluizen.
[0:20:45] Daar is momenteel een onderzoek naar gaande, dus er wordt gekeken in de organisatie van hebben we nu nog andere van dit soort omgevingen die we ook bijvoorbeeld gemist hebben bij bepaalde zoekslagen of bepaalde onderzoeken.
[0:21:00] Lastig is natuurlijk wat versta je onder een datakluis en je ziet ook al dat dat woord wordt gewoon gebruikt voor heel veel verschillende zaken.
[0:21:09] Er is bijvoorbeeld een FSV-datakluis, wat ook al eerder is gemeld aan de Kamer, dus een RAM-datakluis.
[0:21:14] En dat is zeg maar meer om alle onderzoeksgegevens netjes in op te slaan en te bewaren.
[0:21:19] En dat is natuurlijk een heel ander type datakluis als waar we het hier over hebben.
[0:21:25] Bij de gesprekken over, goh, hebben we nog meer beveiligde, bewaarde omgevingen, kwam naar voren dat er ook een mailbox-omgeving is gevonden.
[0:21:35] Een beveiligde mailboxomgeving waarvan we een heel aantal dingen nu weten,
[0:21:40] maar we weten ook een heleboel dingen nog niet en die worden nog uitgezocht.
[0:21:44] Wat we wel weten is dat die mailboxen op 19 mei 2020 zijn veiliggesteld.
[0:21:51] En dat was natuurlijk de dag van de aangifte van financiën tegen de Belastingdienst.
[0:21:55] We weten inmiddels ook dat er minimaal duizend en vier mailboxen zijn opgeslagen
[0:22:01] van medewerkers die destijds bij toeslagen werkten.
[0:22:04] En dan ging het echt over het ambtelijk personeel, dus niet over de externe inhuur.
[0:22:11] We weten dat die mailboxomgeving er is en dat er ook opdracht is gegeven ooit
[0:22:16] om ook de inschijven, dat zijn persoonlijke schijven van medewerkers,
[0:22:19] de Q-schijf en ook Connect People-omgevingen, dat zijn samenwerkingsgebieden,
[0:22:24] om die ook veilig te stellen.
[0:22:26] Die hebben we nu nog niet gevonden, maar daar zijn we ook naar op zoek.
[0:22:32] En ja, we weten inmiddels nog niet de precieze achtergrond van die veiligstelling van die mailbox.
[0:22:38] We weten natuurlijk dat het op die datum was, maar we hebben nog niet zeg maar precies achterhaald wie precies die opdracht heeft gegeven of hoe die opdracht er ook precies uitzag.
[0:22:48] Maar dat is dus ook echt een onderdeel in het plan van aanpak en ja, ook een onderdeel van het opruimen van beveiligde omgevingen bij de Belastingdienst.
[0:23:00] Ja, dat plan van aanpak, dat doen we zeg maar onder auspician ook van heel veel externe partijen.
[0:23:07] Dus de autoriteit persoonsgegevens heeft vragen gesteld die we deze week gaan beantwoorden.
[0:23:14] Ook de Algemene Rekenkamer heeft vragen gesteld, inmiddels twee keer.
[0:23:18] Die hebben we ook inmiddels beantwoord.
[0:23:21] De inspectie overheidsinformatie en erfgoed, die zijn een verkennend onderzoek gestart hebben.
[0:23:27] Wij drieën ook inmiddels mee gesproken en die zijn nu ook vervolggesprekken aan het inplannen.
[0:23:32] En we hebben ook gesproken met de ADR.
[0:23:35] In de eerste Kamerbrief is ook gemeld dat de ADR het plan van aanpak zou gaan valideren en ook zou adviseren daarop.
[0:23:41] Dat is inmiddels in de tijd ingehaald door het instellen van die externe onafhankelijke commissie.
[0:23:47] omdat we vinden dat die daar natuurlijk ook zeggenschap over moet hebben
[0:23:52] in hoe zij toezicht gaan houden op hoe wij deze kluis gaan aanpakken en opruimen.
[0:24:00] De ambitie is om dit plan van aanpak voor de zomer gereed te hebben
[0:24:05] maar het zal dus ook in de timing verband houden met de instelling van die externe onafhankelijke commissie.
[0:24:14] Maar onze ambitie is om dat voor de zomer te doen.
[0:24:19] Daarmee komen we aan het einde van deze presentatie.
[0:24:24] Dank u wel.
[0:24:25] Dan gaan we naar mijn linkerzijde.
[0:24:28] Als eerst de heer Matlouti, zeg ik dat goed, van D66.
[0:24:32] We doen het overigens in twee tallen.
[0:24:34] Dus de heer Matlouti en de heer Dekker.
[0:24:36] En daarna de volgende twee tallen.
[0:24:37] Uitgang naar meneer Matlouti.
[0:24:39] Heel erg bedankt, voorzitter.
[0:24:41] Dank voor de uitgebreide presentatie.
[0:24:44] En excuus dat ik iets later was.
[0:24:48] u geeft aan dat de inhoud van de
[0:24:50] van de bestanden
[0:24:52] of documenten die eigenlijk in het datakluis
[0:24:54] zitten niet allemaal bekend zijn
[0:24:56] ik heb deze vraag ook in het debat gesteld
[0:24:58] maar ik bedoel hem echt feitelijk
[0:25:02] hoe groot
[0:25:02] acht u de kans dat daar gewoon echt documenten tussen zitten
[0:25:04] die gewoon van invloed zijn op
[0:25:06] dossiers van gedupeerden
[0:25:08] om maar meteen in het licht van het toeslagenverre te trekken
[0:25:10] want dat is voor mij eigenlijk wel de hamvraag
[0:25:12] in deze hele
[0:25:15] kwestie
[0:25:16] Dus daar ben ik benieuwd naar.
[0:25:19] Dan de heer Dekker van Forum voor Democratie.
[0:25:21] Ja, dank u wel, voorzitter.
[0:25:23] Ja, ik ben geïnteresseerd in het historisch perspectief.
[0:25:25] Want het gaat over verouderde gegevens in eerste instantie.
[0:25:28] Dat is de aanleiding.
[0:25:30] En dan berg je die op in een kluis zonder dat je erbij kunt.
[0:25:34] Ik snap niet goed wat daar de logica van is verder.
[0:25:37] En ik vraag me ook af of dat vandaag de dag nog gebeurt.
[0:25:40] Dat er gewoon hele bulky gegevens in een kluis worden gedaan.
[0:25:44] De deur wordt dicht.
[0:25:44] Want dan herhaalt het probleem zich, zou ik zeggen.
[0:25:48] Dus dat zal ik graag weten.
[0:25:50] Dank u wel. Ik kijk naar mijn rechterzijde.
[0:25:52] Wie gaat de eerste vraag?
[0:25:54] De heer Staven, Schuighoff.
[0:25:57] Op de vraag hoe groot wij de kans achter of de informatie in de datacluis van invloed is,
[0:26:04] is denk ik goed om te benadrukken dat er op dit moment geen concrete aanwijzingen zijn
[0:26:10] dat er relevante informatie in die kluis zit voor individuele dossiers.
[0:26:17] wat daarbij ook belangrijk is om te benadrukken
[0:26:19] denk ik ook al heeft de bewindspersoon ook in het debat gezegd
[0:26:22] is dat de inhoud van die datakluis geen negatieve invloed zal hebben op reeds afgegeven beschikkingen
[0:26:30] en een tweede onderdeel van het antwoord is dat
[0:26:35] bij de vaststelling van de integrale beoordeling
[0:26:39] dat doen wij op basis van informatie die reeds voor handen is
[0:26:44] in de bestanden die wel raadpleegbaar zijn
[0:26:46] en zoals u weet zijn al die
[0:26:48] integrale beoordelingen afgerond
[0:26:50] en een tweede heel belangrijk onderdeel van de
[0:26:52] hersteloperatie is de vaststelling van
[0:26:54] de aanvullende schade
[0:26:55] en daarbij is het natuurlijk zo
[0:26:58] dat de gegevens die daarvoor
[0:27:00] van belang zijn uit het leven van
[0:27:02] de gedupeerde ouders zelf moeten komen
[0:27:05] en dat die informatie niet
[0:27:06] uit de systemen
[0:27:08] van de belastingdienst komt of in de datakluis
[0:27:11] kan zitten
[0:27:15] Korte verduidelijkingsvraag?
[0:27:16] Ja, korte verduidelijkingsvraag.
[0:27:17] U geeft aan, dank u wel, u geeft aan dat het in ieder geval geen negatief gevolg zou hebben voor beschikkingen of uitspraken in het kader van, of bij gedupeerden.
[0:27:30] Maar impliceert dat, dat impliceert ook dat het wel eventueel positieve gevolgen kan hebben, of is dat tekort door de bocht?
[0:27:38] Dus mocht er in de zoekqueries die nog gedaan moeten worden en in de aanpak die nog uitgewerkt wordt,
[0:27:44] mocht dan toch blijken dat er relevante informatie voor individuele dossiers in zit,
[0:27:49] dan zal er ook een aanpak moeten komen om die informatie te betrekken bij de dossiers van de ouders.
[0:27:59] De tweede vraag van de heer Dekker.
[0:28:01] Ja, dan zal ik beginnen.
[0:28:03] Historisch perspectief, kijk, wat er op dat moment speelde,
[0:28:06] was dat de Belastingdienst een jaar had gekregen in uitstel om te voldoen aan de AVG.
[0:28:11] Men ook constateerde dat er nog zoveel documenten waren die op een goede manier gearchiveerd moesten worden,
[0:28:16] ook qua persoonsgegevens, want dat ging natuurlijk over de AVG, dat dat niet zou lukken.
[0:28:20] En toen heeft men besloten om deze, in mijn ogen, noodoplossing te realiseren.
[0:28:25] Dus het is niet zo dat wij nu nog elk jaar weer een nieuwe datacluis vullen, dat is niet aan de orde.
[0:28:32] Maar dat is, zover wij nu kunnen achterhalen, de echte aanleiding geweest om deze actie in te zetten.
[0:28:39] Dank u wel. Meneer Dekker?
[0:28:41] Misschien heeft u de verduidelijking, maar dan zit er toch een normale vervolgactie aan.
[0:28:45] Dit zetten we even apart en daar gaan we straks naar kijken.
[0:28:49] Is dat vervolgens gewoon blijven liggen? Dat kan ik niet goed begrijpen.
[0:28:54] Ik denk dat dat een goede formulering is.
[0:28:56] Wat wij zien, ook in de tijdlijn die meegestuurd is, is dat heel veel collega's en directies
[0:29:00] bezig zijn met vragen en met elkaar te beantwoorden.
[0:29:02] Eerst nog in de eerste twee, 2019 en 2020, over het goed vullen van de datacluis.
[0:29:08] En later over de vraag, wat gaan we ermee doen en hoe gaan we dat doen?
[0:29:11] Je ziet ook discussies over de IV-faciliteit om om te gaan met de datacluis.
[0:29:16] En dan zie je, zover ik de tijdlijn goed begrijp, dan zie je eigenlijk dat zo 22, 23 er niet zo heel veel gebeurt.
[0:29:24] En dan in 24 komt het weer naar boven op het moment dat de collega's van ons Centrum voor Facilitaire Dienstverlening
[0:29:29] beginnen met het opruimen.
[0:29:32] Maar dit zijn terechte vragen en die komen ook aan de oren natuurlijk in het externe onderzoek
[0:29:36] wat nu op dit moment loopt.
[0:29:38] Dank u wel.
[0:29:39] Mevrouw Van Dijk namens het CD.
[0:29:41] Dank u wel, voorzitter.
[0:29:42] En als het de politiek is moet ik het inderdaad maar zeggen, want wat mij op die tijd daarin
[0:29:46] opvalt is inderdaad september 2019, 2020 is men aan de gang gegaan met het vullen van
[0:29:51] die datakluis.
[0:29:53] De POK is gestart nog geen half jaar later.
[0:29:55] Dus dan denk ik van ja, het is ook niet zo dat het zo lang geleden was dat je er totaal
[0:29:59] niet meer aan had kunnen denken.
[0:30:00] Dus ik was een beetje op zoek naar hoe werkt dan zo'n proces binnen zo'n organisatie dat zo'n datakluis, wat toch relatief kort geleden is ingesteld, volledig overdroofd is gezien.
[0:30:11] Dank u wel. Mevrouw Van Eyck, VVD.
[0:30:13] Ja, misschien een vraag iets meer op de toekomst gericht. Dit is een groot project, een majeure operatie.
[0:30:20] Daar zullen ongetwijfeld heel veel mensen vanuit de Belastingdienst en ook extern de aankomende tijd mee bezig zijn.
[0:30:27] In hoeverre leidt dat dadelijk tot verdringing op allerlei andere werkzaamheden die voor de Belastingdienst heel erg belangrijk zijn?
[0:30:36] We hebben een vol portfolio wat betreft de IV. Het is een uitdaging om mensen te krijgen.
[0:30:41] Ik maak me ook wel zorgen over hoeveel capaciteit dit gaat vragen. Kan daar iets over gezegd worden?
[0:30:48] Dank u wel. Ik kijk naar de rechterkant.
[0:30:51] Eerst de vraag van mevrouw Van Dijk.
[0:30:57] Kijk, zover ik de belastings heb leren kennen de afgelopen zes jaar, is dat heel veel dingen ook, de grote organisatie, ook gewoon parallel kunnen lopen, zonder dat daar daadwerkelijk, oorzakelijk, of dat daar een bepaalde correlatie tussen is.
[0:31:09] Ik heb de tijd natuurlijk ook zitten lezen, ik heb het van het weekend natuurlijk nog een keer goed zitten lezen.
[0:31:14] Ik was in die tijd ook al binnen, dus ik heb ook gezien wat daar gebeurd is.
[0:31:17] Ik vraag me dat ook af, hoe kan dat?
[0:31:19] Het geldt ook bijvoorbeeld voor het moment dat wij de extensies voor de parlementaire enquête met elkaar vaststellen.
[0:31:28] Hoe kan het dat wij daar met z'n allen op dat moment niet een verband is gelegd?
[0:31:32] Dat zal in de interviews die we gaan houden met hopelijk nog meer duidelijkheid opkomen.
[0:31:37] Ik heb het antwoord nu niet, maar ik verbaas me er eigenlijk net zozeer over dat het ons niet op die manier gelukt is.
[0:31:42] Het is wel zo dat het natuurlijk ook twee verschillende opdrachten zijn.
[0:31:45] En dat zijn eigenlijk meerdere perspectieven die de afgelopen periode ook gespeeld hebben.
[0:31:49] Er was natuurlijk een juridisch perspectief van wat is nou eigenlijk de status van die documenten in de datakluis.
[0:31:55] Want volgens de ene wetgeving hadden we ze al niet meer mogen hebben.
[0:31:58] Volgens de andere wetgeving hadden we ze moeten archiveren.
[0:32:00] Volgens de parlementaire enquête wet moeten we ze leveren.
[0:32:04] Dat heeft best veel juridische discussie ook in de dienst natuurlijk opgeleverd.
[0:32:07] Wat is nou precies de status?
[0:32:09] Je ziet ook dat de ouderdom ons ook niet helpt.
[0:32:11] Want er is een reorganisatie bij de belastingdienst geweest in de tussentijd.
[0:32:14] Dus om een voorbeeldje te geven, vroeger had je regio's, die zijn deels nu opgesplitst in doelgroepdirecties bij de Belastingdienst,
[0:32:21] waarbij eigenlijk niemand meer is die zich eigenaar voelt van de MT-verslagen van het managementteam Gooi in Eemland,
[0:32:29] die misschien wel in de datacluis zitten.
[0:32:30] Dus daar zit echt veel discussie ook, denk ik, in de periode, omdat mensen moeite hadden om te denken,
[0:32:35] wie is hier nou eigenlijk verantwoordelijk voor, hoe gaan we dit aanpakken, wie heeft eigenlijk de besluitvorming om dit te mogen vernietigen.
[0:32:40] Maar nogmaals, dat zei ik aan het begin al, dit zijn allemaal aannames en ideeën die ik erbij heb.
[0:32:44] Die moeten allemaal nog gevalideerd worden door een externe onderzoek.
[0:32:49] Dan misschien de vraag van mevrouw van Eyck, verdringing.
[0:32:51] Ik denk dat Annemiek nog wat kan zeggen over de orde grootte van de operatie.
[0:32:58] Wij weten het oprecht op dit moment niet, maar ik denk niet dat het orde grootte wordt dat er echt sprake zou zijn van verdringing.
[0:33:05] Ook omdat het een heel ander type werk is dan de andere grote operaties die op het moment lopen.
[0:33:09] Dus ik denk dat er niet zo snel een verdringing zal zijn met Box 3, omdat dat toch heel fiscaal gericht is.
[0:33:14] en je hier echt andere specialiteiten nodig hebt om dit goed op te ruimen.
[0:33:21] Je merkt natuurlijk wel dat het bestuurlijke aandacht vergt van iedereen.
[0:33:23] Dus het is absoluut iets wat tijd en energie kost en wat wij alle drie ook nog even bijdoen,
[0:33:29] zal ik maar zeggen, naast de reguliere werkzaamheden. Dus dat klopt.
[0:33:33] In die zin is er sprake van verding.
[0:33:34] Kun je nog iets zeggen over eventuele ordegroten?
[0:33:38] Heel moeilijk op dit moment, omdat we gewoon eerst die kluis doorzoekbaar moeten maken
[0:33:44] En pas als we echt gaan zoeken met die zoekwoorden en die zoekstrings zien we pas hoeveel zoekresultaten dat oplevert.
[0:33:51] En dan pas kunnen we ook kijken van hoeveel capaciteit is nodig om dat te bekijken.
[0:33:55] En dat is ook wel de reden dat we met heel veel andere partijen praten.
[0:33:58] Om ook te kijken in hoeverre kunnen we ook gebruikmaken van slimme tooling of van AI.
[0:34:03] Om dit soort informatie goed te kunnen doorzoeken en daar de relevante informatie uit te kunnen halen.
[0:34:10] Dank u wel. Dan gaan we naar de heer Ergin namens Denke.
[0:34:14] Voorzitter, dank u wel.
[0:34:15] Waar ik met name benieuwd naar ben is,
[0:34:18] ze wordt besloten een datacluis in te richten op basis van eigenlijk noodzaak.
[0:34:23] En ik ga ervan uit dat er meerdere datacluizen zijn bij de Belastingdienst.
[0:34:28] Dus dat er beleid is rondom hoe richt je een datacluis in,
[0:34:32] wat is good governance, hoe doen we aan onderhoud,
[0:34:35] en hoe bepalen we welke stukken erin en welke stukken eruit.
[0:34:38] En wie überhaupt toegang heeft natuurlijk tot zo'n datacluis.
[0:34:42] En ik ben oprecht benieuwd naar bij welke schakel het mis is gegaan en zo'n datakluis uit beeld is geraakt.
[0:34:53] Dank u wel. En dan mevrouw Westerveld namelijk als GroenLinks Partij van de Arbeid.
[0:34:58] Ja, een aanvulling op deze vraag.
[0:35:00] We kunnen ook in de tijdlijn lezen dat in 2019 het plan was om de maatregelen te verwijderen.
[0:35:08] En dan wordt de datakluis daar ook bij benoemd.
[0:35:10] Dat lezen we in de tijdlijn.
[0:35:11] Waarom is dat destijds niet gebeurd?
[0:35:15] Dus wat is daar ook misgegaan?
[0:35:20] Dank u wel.
[0:35:22] Meneer Schuws?
[0:35:28] Deze datakluis was geen regulier beleid.
[0:35:31] Dus dat zeg ik gewoon heel eerlijk.
[0:35:34] Het was ook niet eerder gedaan.
[0:35:36] Het was een soort, misschien moet ik het wel noemen, noodmaatregel om toch zo snel mogelijk en zo goed mogelijk te voldoen aan de AVG-wens die er toen lag.
[0:35:45] Het is dus wel gekeken naar het veiligstellen van de documenten.
[0:35:48] Er is ook netjes een inrichting geweest dat niet iedereen daarbij kon, via de datacoördinatoren,
[0:35:55] dat er wel een dooselijk proces was of iemand wel of niet weer een document uit de datacluis mocht halen.
[0:36:02] Overigbeheer is niet echt ingericht, omdat het ook geen normaal beleid is om dit soort datacluizen te creëren.
[0:36:10] Het was echt een eenmalige stap die toen uitgezet is.
[0:36:16] Wat er toen misgegaan is, daar kan ik weinig over zeggen.
[0:36:19] Dat is ook onderdeel van onderzoek wat natuurlijk nog gaat plaatsvinden.
[0:36:24] Korte verduidelingsvraag, meneer.
[0:36:25] Hoeveel mensen hadden toegang tot deze dataclijs?
[0:36:29] Dat kan ik zo niet zeggen.
[0:36:35] Datacoördinatoren gemiddeld één, twee per organisatie om een deel.
[0:36:40] Dus dat is, hoeveel hebben we er dan? Een stuk of twintig misschien.
[0:36:43] Die mochten toegang verlenen.
[0:36:45] Dus medewerkers konden daar vragen om hun bestand, hun deden een toets.
[0:36:50] En dan kregen ze al dan niet toegang.
[0:36:52] Dus het was echt een zeer beperkte groep.
[0:36:54] Maar ik ben me niet vast op het aantal, het was een klein aantal in ieder geval.
[0:37:04] Ja, dat ging over wat er is misgegaan in 2020.
[0:37:08] Wat er precies is misgegaan, weet ik niet.
[0:37:10] Maar het is wel duidelijk, als wij kijken naar alle documenten op basis van die tijdlijn is gemaakt.
[0:37:16] Dan zie je dat het natuurlijk beloofd is om die kluis zo snel mogelijk op te ruimen.
[0:37:20] Dat alle directies gevraagd is om een plan van aanpak te maken.
[0:37:23] En dat dat uiteindelijk niet gebeurd is.
[0:37:26] En waar dat dan precies is misgegaan, dat weet ik niet.
[0:37:30] Maar we zien wel dat de kluis in allerlei overleggen elke keer weer terugkwam.
[0:37:34] Maar er is nooit echt, nou ja, moeten we constateren,
[0:37:38] dus gestuurd op die plannen van aanpak en het echte opruimen van die kluis.
[0:37:43] Verduidelijk, mijn vraag.
[0:37:46] Ja, eigenlijk ook naar aanleiding van het antwoord.
[0:37:50] En sowieso heel fijn, deze briefing.
[0:37:53] Maar u geeft zelf aan, het was eigenlijk een mitigerende, verzachtende maatregel
[0:37:58] om te voldoen aan de AVG, maar hoe kunnen we dan ook zeker weten
[0:38:01] dat er geen andere gegevens zijn die bijvoorbeeld destijds wel zijn vernietigd?
[0:38:05] Of weten we dat niet en wordt dat ook nog onderzocht in dat externe onderzoek?
[0:38:12] Meneer Vlot of meneer Schreus?
[0:38:15] U bedoelt gegevens uit de datacluis zelf of gegevens die eigenlijk in de datacluis hadden gemoeten?
[0:38:22] Dat zijn twee verschillende vragen. Ik weet niet welke u bedoelt.
[0:38:25] Het was een mitigerende... De reden dat deze gegevens zijn bewaard
[0:38:29] is eigenlijk om aan de
[0:38:31] AVG'en te voldoen en omdat de belastingdienst
[0:38:34] anders niet op tijd kon voldoen aan de AVG.
[0:38:36] Dus dat was de reden dat die zijn bewaard.
[0:38:38] Maar hoe weten we dan dat er niet meer
[0:38:39] gegevens nog zijn die in het
[0:38:42] kader van de AVG
[0:38:43] wel relevant hadden kunnen zijn voor die parlementaire
[0:38:46] enquête, maar die dus nu vernietigd zijn?
[0:38:50] Dat kan ik
[0:38:51] op dit moment heel haast geen antwoord opgeven.
[0:38:53] Dat weet ik gewoon niet.
[0:38:57] Dank u wel. Dan gaan we weer naar de...
[0:38:59] Geen vraag meer? Meneer Dekker nog een vraag?
[0:39:01] Ja, ik heb maar een vraag. Is het nu zo
[0:39:03] dat binnen de Belastingdienst, en misschien breder ook,
[0:39:07] er van ieder type document een soort retentieperiode is,
[0:39:11] dus waarbij die bewaard moet worden,
[0:39:13] maar ook een soort vernietigingsverplichting na een aantal jaren.
[0:39:17] Is dat nu qua beleid vastgesteld?
[0:39:22] Meneer Schuurs.
[0:39:23] Eigenlijk refereert hij naar de archiefwet.
[0:39:26] We hebben de selectielijsten geïmplementeerd,
[0:39:28] althans gedefinieerd geïmplementeerd.
[0:39:31] Gedeeltelijk zijn die ook al werkzaam.
[0:39:33] Ja, we hebben daar ook een archieffunctie voor gemaakt, die verder doorontwikkeld wordt.
[0:39:40] Het is nog niet zo dat het helemaal 100% ingericht is, maar we zijn druk bezig om dat verder vorm te geven,
[0:39:47] ook naar aanleiding van het grote programma informatiehuishouding op orde, daar is dit onderdeel van.
[0:39:53] En daar hebben we ook planning onder liggen en daar wordt echt wel goed op gestuurd om dit allemaal op orde te krijgen.
[0:40:00] Dank u wel.
[0:40:00] Ja, ik vraag dit voorzitter omdat, ik kom zelf uit de bankomgeving en daar is de retentie belangrijk, maar ook het duidelijk aantoonbaar niet meer hebben van gegevens belangrijk.
[0:40:11] En dat laatst wordt vaak vergeten, maar dat is onderdeel van, begrijp ik, van het plan om dat wel helemaal in te richten.
[0:40:17] Ja, dan praten we ook over vernietiging, vernietigingsbestanden, eigenlijk bewijslast, logging van vernietiging.
[0:40:24] Dat is voor een groot gedeelte al ingericht en dat wordt ook verder vormgegeven, waarbij we ook natuurlijk papierenvernietiging nog hebben, heel veel, en ook digitale vernietiging.
[0:40:38] Mevrouw van Dijk.
[0:40:39] Dank je wel, voorzitter. Er werd verteld dat met betrekking tot de individuele dossiers uit de kluis zeer waarschijnlijk geen, hopelijk, documenten komen die direct betrekking hebben op individuele dossiers.
[0:40:53] Maar hoe zit het met die mailbox?
[0:40:55] Is daar ook een soort steekproefje op gedaan of zijn jullie zover nog niet?
[0:41:02] Nee, we hebben nog geen toegang tot die mailboxomgeving.
[0:41:05] Dus we kunnen zien dat het heet mailboxen, toeslagen, et cetera.
[0:41:08] Maar we hebben nog niet in kunnen kijken.
[0:41:10] Dus dat is een vervolgstap.
[0:41:15] Dank u wel. Mevrouw Van Eycke.
[0:41:16] Ja, en het verlengde hiervan.
[0:41:18] De Belastingdienst en dienst toeslagen werken met heel veel verschillende applicaties.
[0:41:23] Alle documenten die in een persoonlijk of in een ouder dossier zouden moeten zitten,
[0:41:27] zouden, dacht ik, altijd grotendeels ook uit die applicaties moeten komen,
[0:41:31] omdat ze daar op de een of andere manier zijn opgeslagen.
[0:41:35] Is dat zo? En zo nee?
[0:41:38] Is het dan dus zo dat die mailboxen daadwerkelijk nog wel tot aanvullende documentatie kunnen leiden
[0:41:42] of inzichten die we eerder niet hadden?
[0:41:44] Dus ik ben een beetje te zoeken naar wat wordt sowieso in andere applicaties gedaan
[0:41:47] en wat zou er dan nog in die mailboxen kunnen zitten wat daar aanvullend op is?
[0:41:53] Dank u wel. Meneer Flot.
[0:41:54] Ik begin even.
[0:41:57] Ik denk dat het makkelijk is om gewoon voor te stellen, de belasting is eigenlijk gewoon een organisatie waarin we werken met kantoorautomatisering en waar we primaire processystemen hebben.
[0:42:06] En in die primaire processystemen, daar zitten al onze aangifte, beschikkingen via allerlei tussenstappen.
[0:42:13] Er zitten ook applicaties om al die beschikkingen weer inzichtelijk te maken voor mensen bij de belastingtelefoon enzovoort.
[0:42:18] Dus daar zit de primaire procesinformatie van ons als belastingplichtigen.
[0:42:22] En daarnaast hebben we natuurlijk een kantooromgeving waarin wij gewoon met elkaar mailen, bestanden opslaan op een Q-schijf enzovoort.
[0:42:28] Wat er natuurlijk wel kan gebeuren, wat ik ook gewoon weet uit de modus operandi van de belastingdienst van de afgelopen 20 jaar, zoals ik die de afgelopen 6 jaar heb leren kennen,
[0:42:36] is dat er natuurlijk soms bijvoorbeeld, dat kon uit RAM bijvoorbeeld, een Excel-sheet wordt gemaakt waarin persoonsgevens van burgers worden opgenomen,
[0:42:45] omdat ze die om wat voor reden dan ook bij hun dagelijkse werk nodig hadden.
[0:42:49] Zo'n Excel-sheet belandde dan vervolgens in de kantoorautomatisering en we weten ook dat er Excel-sheets in de datacluis staan.
[0:42:56] Dat geldt voor RAM-bestanden, maar dat kan ook voor heel veel andere Excel-sheets natuurlijk betekenen.
[0:43:01] Op die manier kan er primaire procesinformatie uit systemen in de datacluis terechtgekomen.
[0:43:09] Dat lijkt mij, vanuit mij wat ik weet, de meest plausibele manier.
[0:43:13] Ik denk dat dat ten opzichte van de hoeveelheid informatie die we hebben in onze primaire processystemen zeer beperkt is.
[0:43:18] Maar dat hoeft natuurlijk niet, dat is leuk om te weten, maar dat is voor de individuele burger natuurlijk veel minder relevant.
[0:43:25] Dus daar zit natuurlijk het punt.
[0:43:27] Dus dat maakt het ook waarom wij heel voorzichtig zijn met te zeggen dat er geen relevante informatie in zit, want dat kan wel.
[0:43:32] En er kunnen natuurlijk ook dingen in zitten in alle openheid.
[0:43:34] Ja, aanpakken, project aanpakken, fraude aanpakken van documenten die wij gewoon nog nooit gezien hebben, nooit gekend hebben.
[0:43:41] Dus dat kan.
[0:43:42] En tegelijkertijd zit er waarschijnlijk ook heel veel informatie in die iedereen die werkzaam is in wat grotere organisaties kent over hoe schijven van afdelingen eruit zien en de verwoorde pogingen van secretariaten om daar orde in aan te brengen.
[0:43:55] En dat is allemaal in één klap in die datacluis neergezet en dat gaan wij allemaal terugvinden en hopelijk zo goed en snel mogelijk sorteren.
[0:44:05] Ja, wat betreft die mailbox omgeving denk ik dat de relevantie nog is.
[0:44:14] Maar dat we bij de parlementaire enquête, fraudebeleid en dienstverlening alle mailboxen van schaal 16 en hoger hebben doorzocht.
[0:44:21] En dat het gewoon zo kan zijn dat die veiliggestelde mailboxen in 2020, dat daar nog mailboxen schaal 16 en hoger tussen zitten.
[0:44:28] Die we gemist hebben bij het zoekproces van de parlementaire enquête.
[0:44:35] Dank u wel. Meneer Eriken.
[0:44:39] Kunt u aangeven, er zijn diverse steekproeven uitgevoerd.
[0:44:44] Ik kan me ook goed voorstellen dat u wellicht inmiddels in de digitale kluis heeft kunnen neusden, kunnen kijken van wat komt u daar tegen, hoe ziet dat eruit.
[0:44:56] Zijn het met name bestanden die te maken hebben met het RAM-model of zijn het met name bestanden die te maken hebben met het toeslagenschandal?
[0:45:06] Of kunt u daar een inschatting in maken?
[0:45:09] Meneer Schuurs.
[0:45:12] Wij kunnen op dit moment niet in de bestanden zelf nog kijken.
[0:45:16] We hebben een bestandsnaam, maar dat kan nog heel veel op inhoud betekenen.
[0:45:22] De verwachting is dat er ook faals bestanden in zitten.
[0:45:27] Die kans is gewoon heel groot.
[0:45:29] Maar of dat echt zo is en hoeveel het er zijn,
[0:45:31] en of er fiscale informatie in zit of wat voor een andere soort informatie,
[0:45:36] dan zullen wij echt in de bestanden moeten kijken.
[0:45:38] Daarvoor zullen we wel eerst de indexering helemaal af moeten ronden.
[0:45:42] En met elkaar moeten kijken als de indexering afgerond is,
[0:45:45] Dus met de zoektermen en gewoon de nabewerking, die veel groter is overigens als het indexeren, echt per bestand eigenlijk moeten gaan kijken wat staat hier nu eigenlijk in.
[0:45:59] Pas dan kunnen we echt antwoord gaan geven op deze vraag.
[0:46:03] Alles wat ik daar nu over zou zeggen is echt gissen, dus dat is onverstandig denk ik.
[0:46:10] Dank u wel. Mevrouw Westerveld.
[0:46:11] Ja, nog een vraag over de tijdlijn. Want als we verder kijken, dan zien we op 9 oktober 2025 dat de directeur IVND een totale vernietigingsstop afkondigt met betrekking tot de documenten.
[0:46:23] En dat dan de week daarna ook de staatssecretarissen verder worden geïnformeerd. Maar weten we ook of zij zijn in de tussentijd geen documenten vernietigd of verwijderd uit die datacluis?
[0:46:38] Meneer Schuurs.
[0:46:39] Dat is niet gebeurd, want het proces is dat voordat iets vernietigd wordt,
[0:46:44] een document opgemaakt wordt van dit willen we gaan vernietigen.
[0:46:47] En dat is ook de trigger geweest om te zeggen, dat gaan we niet doen.
[0:46:51] En daar is de vernietiging stop op afgegeven.
[0:46:54] Dus voor zover we weten is dat niet gebeurd.
[0:46:59] Dank u. Ik kijk naar mijn linkerzijde.
[0:47:01] Meneer Dekker, wil u vragen hebben? Mevrouw Van Dijk?
[0:47:06] Mevrouw Van Dijk niet.
[0:47:07] De heer Ergen, ga uw gang.
[0:47:10] Is er sprake van adequate datalogging bij deze kluis?
[0:47:17] De vragen worden wel korter. Wie gaat deze man antwoorden?
[0:47:24] Ik zit even te denken. Dat is het eerlijk.
[0:47:27] Datalogging is eigenlijk het loggen van het gebruik van de data bedoelt u.
[0:47:31] Of het loggen van wat erin zit. Wat bedoelt u met datalogging in deze context?
[0:47:35] Meneer Erkin.
[0:47:36] Wat ik bedoel met adequate datalogging is dat er ongeveer navolgbaar is wat er in de kluis en met de kluis gebeurt.
[0:47:45] Ik ken toevallig dat RAM-onderzoek, die natuurlijk ook in de zomer van vorig jaar is opgeleverd.
[0:47:51] Daar was conclusie 1, er was überhaupt geen sprake van datalogging en daardoor kunnen we heel veel vragen niet beantwoorden.
[0:47:58] Dus vanuit die context stel ik deze vraag. Kan het teruggehaald worden wie in die dataclash is geweest? Welke documenten er eventueel eruit zijn gehaald of documenten zijn verplaatst? Is dat gewoon navolgbaar? Kan dat navolgbaar gemaakt worden? Laat ik die vraag correct formuleren.
[0:48:24] Mevrouw Wissing.
[0:48:25] Ja, ik heb de indruk dat we dat hebben, zeg maar.
[0:48:30] Dat er gelogd is wat er in die kluis gegaan is.
[0:48:34] Dat is wel de informatie zoals ik die nu heb.
[0:48:38] Dus ja, en ook of er iets uitgegaan is.
[0:48:47] Voldoende, meneer Eriken?
[0:48:50] Ja, nee, oké. Ik zie u namelijk denken.
[0:48:53] En mevrouw Westerveld, heeft u nog een vraag?
[0:48:58] Ja, graag.
[0:48:59] Daar is het niet aan. Misschien dat ook nog toe te lichten.
[0:49:05] Kijk, in algemene zin kan je ervan uitgaan binnen de Belastingdienst,
[0:49:11] als je kijkt in de informatiehuishouding van nu 20 jaar, 25 jaar terug,
[0:49:15] dat dat niet op beperkt het geval is, zal ik maar zeggen.
[0:49:17] Dus in heel veel gevallen kunnen wij een document tegenkomen,
[0:49:20] bijvoorbeeld een Excel-sheet of andere dingen,
[0:49:23] dat je niet kan terughalen door wie die, wanneer gebruikt is,
[0:49:26] in welke context, met welk doel.
[0:49:28] Dat maakt het vaak heel erg moeilijk om tien of vijftien jaar terug reconstructies te maken
[0:49:33] van wat er nou precies gebeurd is en wat we daar eventueel betrokken burger of bedrijf mee zouden moeten.
[0:49:40] De datakluis, wat daarmee gebeurd is, dat heeft u net gehoord van mijn collega Wissink.
[0:49:46] Dus ik denk dat het heel goed is om dat te realiseren,
[0:49:48] dat de informatie, dat hebben we natuurlijk al heel vaak aan de Kamer gemeld,
[0:49:51] dat de staatssecretaris ook heel vaak verantwoording over aflegt,
[0:49:54] dat de informatieafscherming voor de Belastingdienst van de afgelopen 15, 20 jaar gewoon niet op orde was.
[0:49:58] We zijn nu druk bezig, Harry is daar heel erg druk mee bezig, om dat op orde te krijgen in de komende jaren.
[0:50:04] Dat betekent dat als we terug blijven kijken naar de afgelopen 20 jaar,
[0:50:06] we altijd kijken naar die wat onderdringbare, ongeordende informatiehuishouding van de Belastingdienst
[0:50:13] en tegen deze problemen waar we bij RAM tegenaan lopen, waar we bij FSV tegenaan gelopen zijn,
[0:50:18] waar we op andere plekken ook tegenaan lopen.
[0:50:20] Dat is denk ik wat het is. Dus dat is denk ik ook goed om te weten.
[0:50:23] En een tweede opmerking, als dat mag, volgens een aanvulling van het andere onderwerp, is dat het is goed om te weten dat wij toen bij de parlementaire enquêtecommissie,
[0:50:30] kregen wij natuurlijk twintig vorderingen, ongeveer, over inhoudelijke onderwerpen.
[0:50:35] We hebben natuurlijk ook in overleg met de toenmalige Griffie ook afspraken gemaakt over hoe we dat precies gingen zoeken en dat we daar is overleg geweest.
[0:50:42] Want wij konden natuurlijk binnen de gestelde tijd van de parlementaire enquête, hadden wij misschien, ja, konden wij ook niet alles wat wij binnen de Belastingdienst hebben,
[0:50:50] aan 4 miljard of meer documenten
[0:50:52] hadden wij niet kunnen leveren
[0:50:54] dat de Kamer technisch überhaupt niet kunnen ontvangen
[0:50:56] dus we hebben heel erg goede afspraken gemaakt
[0:50:58] over waar we zoeken, hoe we zoeken
[0:50:59] dat is ook allemaal netjes vastgelegd
[0:51:01] dat gaan we ook gewoon herhalen
[0:51:02] dus als de spullen uit de datacluis
[0:51:05] die tijd beschikbaar geweest waren
[0:51:07] dan krijgt de Kamer dat alsnog
[0:51:09] maar het is goed om te realiseren
[0:51:11] dat die Belastingdienstopgeving
[0:51:13] en de informatiehouding gewoon
[0:51:15] van de terugkijkend
[0:51:17] de afgelopen 15, 20 jaar gewoon heel ingewikkeld is
[0:51:19] en dat ook zal blijven
[0:51:20] Want wij kunnen niet meer terugwerken in de kracht dat structureren.
[0:51:27] Duidelijk en eerlijk antwoord.
[0:51:29] Ik kijk nog één keer, laatste keer naar de linkerzijde.
[0:51:33] Een eerlijk keer, ja.
[0:51:36] Die 1004 mailboxen die inmiddels ook zijn gevonden, die met een persoonlijk wachtwoord zijn beveiligd.
[0:51:43] Ik hoop dat die bestanden gekraakt kunnen worden.
[0:51:47] Vraagteken.
[0:51:48] Het is de SIP-fals bedoeld.
[0:51:52] Nou ja, we geven de moed niet op, zal ik maar zeggen.
[0:51:56] En we hebben collega's gevraagd die hier wat meer ervaring mee hebben om dit soort dingen toch te kraken, om ons te helpen hoe ver we komen.
[0:52:07] Ik kan alleen geen toezeggingen opdoen, maar we zetten alles in het werk om die alsnog open te krijgen, zodat we ook bij die bestanden kunnen.
[0:52:14] Er gaat wel wat tijd inzitten, moet ik eerlijk zijn.
[0:52:18] Wat ik bedoelde te vragen is, de kans is natuurlijk vrij klein dat iemand nog weet, zeker als je een paar jaar elders werkt, wat het wachtwoord is van zo'n zip-document.
[0:52:31] Volgens mij, en daar vraag ik eigenlijk naar, zijn er voldoende technieken om zonder dat wachtwoord te achterhalen, waarbij je zip-documenten, zip-files en volgens mij zien we inmiddels zelfs dat hele Twitter-accounts worden gehekt.
[0:52:47] dat het gewoon mogelijk is om dat te hacken en om die informatie veilig te stellen.
[0:52:51] Ja, dat is ook exact wat ik bedoel.
[0:52:53] En we hebben dus contact met organisatieonderdelen die daar ervaring mee hebben.
[0:52:58] Maar dan nog moeten we ons wel realiseren dat het niet iets wat je in één dag even doet
[0:53:02] bij dit soort aantallen.
[0:53:04] Maar we hebben er afspraken over gemaakt dat we dat in gang zetten.
[0:53:08] Een 100% garantie kunnen we dat op dit moment niet opgeven,
[0:53:10] maar ik denk wel dat we nog wel aan het eind gaan komen.
[0:53:16] Allerlaatste vragen, meneer.
[0:53:17] Mijn laatste vraag gaat over die html-bestanden. Volgens mij zijn het een stuk over 611.000 html-bestanden.
[0:53:25] Die zijn dus op een gegeven moment, die zijn veel al niet aangeleverd bij de parlementaire ondervraagingscommissie.
[0:53:33] Dat lees ik althans terug in de stukken. Hoe ziet dat er in de praktijk uit?
[0:53:38] Moet iemand ergens een vinkje zetten van deze zoekwoorden en inclusief html-bestanden?
[0:53:46] Kunt u technisch uitleggen hoe het kan dat zoveel duizenden, honderdduizenden bestanden of tienduizenden bestanden buiten een zoekslag kunnen vallen?
[0:53:57] Wat moet daarvoor gebeuren?
[0:53:59] Moet iemand een vinkje verkeerd neerzetten of moet een bepaalde woord?
[0:54:03] Of ligt het aan de filter die je toepast?
[0:54:06] Ik ben daar op zoek naar een technische duizenden daarvan.
[0:54:08] Ik kijk naar de heer Vlop, maar volgens mij heeft u net het begin van het antwoord ongeveer gegeven al.
[0:54:14] Misschien zit er ook enige verwarring in de vraag.
[0:54:17] Er zijn twee dingen rond HTML-files.
[0:54:19] Er zitten HTML-files in de datakluis.
[0:54:22] Maar die HTML-files waar ik het over had, dat zijn eigenlijk de HTML-linkjes die in de mappen terechtkwamen van de medewerkers.
[0:54:28] Die hebben wij gemist bij de zoekslag.
[0:54:31] Dus stel je voor je had die map projectbedrijf X.
[0:54:36] Daar had je een aantal bestanden in die je eigenlijk al had moeten vernietigen.
[0:54:39] Die werden door die datakluisactie uit je map gehaald en daar kwam dan een linkje in staan.
[0:54:43] Dat was een HTML-linkje.
[0:54:44] Daarnaast zitten HTML-bestanden in de datakluis, maar daar durf ik eigenlijk niks over te zeggen wat dat precies is.
[0:54:52] Het tweede punt is, de extensies voor de parlementaire enquêtecommissie,
[0:54:56] die zijn vastgesteld in overleg binnen de Belastingdienst en overleg binnen het ministerie van Financiën.
[0:55:03] Daar heb ik mijn akkoord op gegeven, daar heeft de leiding boven mij akkoord op gegeven.
[0:55:09] We hebben met z'n allen vastgesteld en in dat proces is dit punt niet naar boven gekomen.
[0:55:13] En dat is, wat ik aan het begin ook al zei, voor mij ook nog steeds een zoektocht van hoe dat nou heeft kunnen gebeuren.
[0:55:19] En dat zal ook hopelijk het externe onderzoek nog duidelijker maken van hoe dat misgelopen is.
[0:55:25] Ik kende de techniek van de datacluis niet voordat ik daarvan de zomer over werd geïnformeerd.
[0:55:29] Maar ik weet het oprecht niet.
[0:55:36] Volgens mij zijn alle relevante vragen gesteld en ook volgens mij deskundig beantwoord.
[0:55:41] Ik dank de vier antennen voor hun aanwezigheid en hun inbreng.
[0:55:46] Ik dank de leden voor de gestelde vragen, de mensen op de tribune.
[0:55:49] En dan sluit ik hier bij de vergadering en ik wens iedereen een fijne avond.