VNR-80697
Reageren kan al binnen 2 minuten
Functieomschrijving:
Let op!! Het aanleveren van een toelichting op de eisen en de wensen en een persoonlijk motivatie is verplicht. Gelieve de eisen en de wensen letterlijk over te nemen. Zonder deze toelichting en motivatie kunnen wij het aangeboden CV helaas niet verder in behandeling nemen. CV in Word formaat.
Beschrijving project/programma:
De samenleving verandert snel en signalen uit de maatschappij bereiken het ministerie van SZW in toenemende mate digitaal en ongestructureerd. Het is daarom van strategisch belang om deze signalen effectief te duiden en te vertalen naar responsief beleid, heldere communicatie en toekomstgerichte wetgeving.
De afdeling Omgevingskennis & Responsiviteit (O&R) heeft hierin een centrale rol. Zij verzamelt en duidt signalen, genereert omgevingskennis en ondersteunt het ministerie in het ontwikkelen van passende responsiviteit. Het doel is om deze werkwijze technisch te professionaliseren binnen een betrouwbare data-omgeving waarin innovatieve technologie – zoals data-analyse en AI – op verantwoorde wijze wordt toegepast.
Het project bevindt zich in de opstartfase. Er is een bestaand Databricks-platform op Azure beschikbaar, dat echter nog configuratie en projectspecifieke toegang vereist voor SZW brede signalering. De huidige datastroom is grotendeels handmatig (Excel op gedeelde schijven). Voor gebruik van persoonsgegevens in de cloud is toestemming van de Chief Privacy Officer vereist plus een Data Privacy Impact Assessment (DPIA), wat 3+ maanden duurt. Dit maakt een hybride aanpak noodzakelijk: pragmatisch starten met on-premise lokale setup voor privacy-gevoelige verwerking, terwijl de bestaande Azure/Databricks-omgeving parallel wordt ingericht voor projectgebruik.
Daarnaast is SZW onderdeel van een overheidsbreed samenwerkingsverband waarin verschillende overheidspartijen uniform werken aan signalering. Binnen dit verband wordt er momenteel gewerkt aan het beschikbaar stellen van reeds ontwikkelde code voor signalering (o.a. een anonimiseringsscript en tekstminingsscripts), welke naar verwachting gebruikt gaan worden in het project.
Omschrijving einde project/programma:
De (voorlopige) einddatum van het project SZW brede signalering is 31-12-2026. Het project is afgerond zodra resultaten zijn opgeleverd aan opdrachtgever en decharge is verleend. De einddatum voor de oplevering van de PoC is eind mei 2026 (maand 4 van het project).
Welke rol heeft de professional binnen het project/programma:
De Data Engineer is verantwoordelijk voor het opzetten van de technische fundamenten van het signaalmanagementsysteem. Dit omvat het ontsluiten van databronnen, bouwen van robuuste data pipelines, implementeren van privacy-waarborgen (AVG-compliance), en het opzetten van de benodigde infrastructuur (hybride on-premise/cloud). De Data Engineer werkt nauw samen met de Senior Data Scientist die de modellen ontwikkelt en met het DACC team (Data and AI Competence Center) voor technische infrastructuur.
Welke opdracht gaat de professional uitvoeren en welke activiteiten horen daarbij?
De Data Engineer is verantwoordelijk voor het opzetten van de data engineering fundamenten voor signaalmanagement.
De activiteiten die horen bij het realiseren van de opdracht zijn:
1. DATABRONNEN ONTSLUITEN EN AUTOMATISEREN
- 4 databronnen operationaliseren: interne publieksvragen (handmatige datastroom automatiseren), social media (scraping, API-integratie), media monitoring (Coosto API waarschijnlijk niet ontsluitbaar; eigen media scraper noodzakelijk), publieke documenten (scraping)
- Focus op ongestructureerde data: tekst, PDF, HTML, JSON
- Handmatige processen (Excel workflows) vervangen door pipelines
2. DATA PIPELINES BOUWEN
- ETL/ELT pipelines voor data cleaning, transformatie, normalisatie
- CI/CD pipelines van ontwikkeling naar productie
- Batch processing implementeren
- Schone, gestructureerde data leveren aan Data Scientist
3. DATA-CATALOGUS OPZETTEN
- Metadata en data lineage structureren
- Documentatie databronnen, schemas, pipelines
- Overzicht eigenaarschap, update frequentie, privacy overwegingen
4. PRIVACY, AVG-COMPLIANCE EN ANONIMISERING
- Anonimiseringsscript ontwikkelen (i.s.m. Rotterdam)
- On-premise machine opzetten voor lokaal draaien anonimisering
- Werken met synthetische data voor ontwikkelfase
- DPIA kennis en ondersteuning
5. INFRASTRUCTUUR OPZETTEN
- Eerste fase: on-premise/lokale setup voor privacy-gevoelige verwerking (anonimisering, synthetische data)
- Bestaand Databricks-platform op Azure configureren en inrichten voor projectgebruik (i.s.m. DACC)
- NSK sandbox als aanvullende optie indien bestaande omgeving onvoldoende capaciteit biedt
- Cloud strategie voor productiedata zodra CPO toestemming en DPIA gereed zijn
Welke concrete resultaten dient de professional te behalen?
Opleveren van (deel)resultaten:
- Een datacatalogus met overzicht van alle relevante databronnen, inclusief eigenaarschap, update frequentie, privacy en ethische overwegingen. Werkende data pipelines voor minimaal 2 van de 4 databronnen (prioriteit: interne publieksvragen en media).
- Anonimiseringsscript geïmplementeerd en draaiend op on-premise machine voor privacy-gevoelige databronnen.
- Schone, gestructureerde data beschikbaar voor Data Scientist voor modelontwikkeling (minimaal 1 databron volledig operationeel).
- Azure sandbox omgeving aangevraagd en (indien goedgekeurd) basis-infrastructuur ingericht.
- Technische documentatie van pipelines, data schemas, en architectuurkeuzes.
Welke eindresultaten zal de professional aan het einde van de opdracht dienen op te leveren.
Na oplevering/acceptatie van de genoemde deelresultaten zal een eindrapportage worden opgeleverd met:
- Bereikte resultaten (werkende pipelines, data beschikbaarheid)
- Technische documentatie en architectuurdiagram
- Aanbevelingen voor het vervolg (opschaling naar alle 4 databronnen, cloud migratiestrategie)
- Kennisoverdracht aan DACC team en Lead Data Scientist
- Handover documentatie voor toekomstig onderhoud
Wanneer is de opdracht afgerond en beëindigd:
Na oplevering en acceptatie van alle deliverables aan opdrachtgever.
Hoe wat en wanneer zal het werk/de resultaten worden beoordeeld?
De voortgang wordt beoordeeld op basis van vooraf overeengekomen criteria, waaronder:
- Tijdige oplevering van resultaten: De professional levert de afgesproken producten en resultaten binnen de vastgestelde termijnen, op basis van tussentijdse planningsafspraken met de opdrachtgever
- Kwaliteit van de opgeleverde producten: De pipelines voldoen aan de overeengekomen standaarden, zijn robuust, gedocumenteerd en voldoen aan privacy/AVG vereisten.
- Bijdrage aan samenwerking: De professional draagt zelfstandig bij aan een effectieve samenwerking binnen het project SZW brede signalering
De beoordeling vindt plaats via vooraf geplande evaluatiemomenten, waaronder:
- Wekelijkse voortgangsoverleggen met opdrachtgever
- Maandrapportages met schriftelijke voortgangsoverzichten.
- Eindrapportage
Over welke specifieke kennis beschikt de professional
· TECHNISCH:
- Python + SQL (data engineering, automation)
- Ongestructureerde data processing (text, PDF, HTML, JSON parsing)
- API integratie (REST APIs voor social media, media feeds)
- ETL/ELT pipeline ontwerp en implementatie
- Batch processing (Spark, pandas, of vergelijkbaar)
- Orchestration tools (Airflow, Prefect, Azure Data Factory)
- CI/CD pipelines (YAML, GitHub Actions, Azure DevOps)
- On-premise én cloud ervaring (flexibiliteit in beide omgevingen)
· PRIVACY & GOVERNANCE:
- Data anonimisering/pseudonimisering praktische ervaring\
- AVG/GDPR basiskennis en bewustzijn
- Data Privacy Impact Assessment (DPIA) begrip
- Data cataloging (metadata management, lineage)
· INFRASTRUCTUUR:
- Azure ervaring (bij voorkeur Data Factory, Databricks, Data Lake)
- On-premise setup en beheer
- Cost management cloud omgevingen
· SOFT SKILLS:
- Zelfstandigheid (minimale begeleiding)
- Pragmatisch werken (van prototype naar PoC, 80/20 regel)
- Sterke documentatie vaardigheden
- Mentoring/kennisdeling (begeleiding stagiair)
Gewenst profiel
Als Senior Data Engineer ben je de fundering van SZW brede signalering. Je bouwt de technische fundamenten in een complexe omgeving zonder kant-en-klare cloud infrastructuur. Dit vraagt om creativiteit, doorzettingsvermogen en pragmatisme, maar betekent ook dat je directe impact hebt en ruimte krijgt om architectuurkeuzes te maken.
Een cruciaal onderdeel van je rol is nauwe samenwerking met de Senior Data Scientist (data delivery requirements), het DACC team (technische infrastructuur), en het begeleiden van een stagiair met SQL pipelines.
Over de klant:
Over ICTU
ICTU werkt aan een betere digitale overheid. In deze opdracht werk je binnen het project SZW brede signalering, met betrokkenheid van de afdeling Omgevingskennis & Responsiviteit (O&R) van het Ministerie van SZW. Het doel is om signalen uit de samenleving effectief te duiden en te vertalen naar beleid, communicatie en wetgeving met behulp van data-analyse en AI binnen een verantwoorde data-omgeving.
Eisen:
- Afgeronde HBO- of WO-opleiding (bijv. Informatica, Computer Science, Data Engineering).
- Aantoonbare ervaring als Data Engineer (minimaal 5-7 jaar relevante werkervaring)
- Ruime aantoonbare ervaring met ongestructureerde data processing (text data, PDF, HTML, JSON parsing; API integratie; data cleaning en normalisatie)
- Aantoonbare ervaring met ETL/ELT pipelines, batch processing, en data modeling
- Aantoonbare ervaring met data anonimisering/pseudonimisering en AVG/GDPR compliance
- Vermogen om technische complexiteit te vertalen naar begrijpelijke taal en samen te werken met Senior Data Scientist en DACC team
Wensen:
- Azure ervaring (Data Factory, Databricks, Data Lake, of vergelijkbare cloud data services)
- Python/PySpark + SQL voor data engineering en automation
- CI/CD pipelines (YAML, GitHub Actions, Azure DevOps, of vergelijkbaar)
- Performance optimization van data pipelines (aantoonbare snelheidswinst/cost reduction)
- Ervaring met privacy-gevoelige data (overheid, gezondheid, financieel) en DPIA proces
- On-premise én cloud projecten (flexibiliteit in beide omgevingen)
Opdrachtdetails:
Interesse?
Stuur ons dan uiterlijk 2 maart 2026, voor 14:00 uur je recente CV + motivatie voor deze rol, samen met je beschikbaarheid/geplande vakanties en je all-in uurtarief excl. BTW.
Voor vragen over deze procedure kunt u contact opnemen met Lisa Verheij
Aanvullende informatie:
- 24 uur in de week
- Geen max/richttarief meegegeven, graag marktconform aanbieden
- Het aanleveren van een toelichting op de eisen en de wensen en een persoonlijk motivatie is verplicht. Gelieve de eisen en de wensen letterlijk over te nemen. Zonder deze toelichting en motivatie kunnen wij het aangeboden CV helaas niet verder in behandeling nemen. CV in Word formaat.
BYOD
ICTU biedt BYOD voorzieningen aan voor externe medewerkers. Van de externe medewerker wordt verwacht dat diegene beschikt over een passend apparaat (laptop) en een mobiele telefoon om diens werk uit te voeren. Aan de externe medewerker gevraagd (digitaal) akkoord te gaan met het ingevoerde reglement zakelijke apparatuur.
Tijdens het intakegesprek zal dit reglement op hoofdlijnen worden doorgenomen. ICTU hanteert voor ICT voorzieningen een N-1 beleid, concreet betekent dit dat naast de huidige versie, 1 lagere voorgaande versie, mits door de leverancier ondersteund, wordt toegelaten tot de ICTU infrastructuur.
"Houd er rekening mee dat vacatures soms eerder kunnen sluiten. Om uw aanbieding zo goed en snel mogelijk te verwerken, vragen wij u vriendelijk om deze altijd via onze website in te dienen. Aanbiedingen die wij zonder overleg per e-mail ontvangen, kunnen wij helaas niet in behandeling nemen."
Jouw weg naar succes?
In 7 stappen en enkele dagen
- 1
Vind jouw opdracht
- 2
Reageer: stuur ons je cv
- 3
Wij checken jouw profiel met de opdracht(gever)
- 4
Telefonisch kennismaken met een recruiter van Circle8
- 5
Is er een match? We stellen je voor
- 6
Intakegesprek bij de opdrachtgever
- 7
Contract en let's go!

