De Nederlandse bevolking staat model Construeren van een synthetische determinanten-ziekten populatie ten behoeve van het berekenen van gezondheidseffecten en beleidsondersteuning (DEDIPOP, S/210003) Boshuizen, prof (professor).dr. H.C. (Hendriek)
Inleiding en motivatie
Beleidsmakers hebben regelmatig behoefte aan cijfers over het voorkomen van ziekten in combinatie met andere ziekten en risicofactoren. Ook zijn dergelijke gegevens noodzakelijk voor ziektemodellering. Om dergelijke cijfers te verkrijgen moet gebruik worden gemaakt van meerdere gegevensbronnen, die vaak onderling niet consistent zijn. Wanneer er een enkele databank zou bestaan van een dwarsdoorsnede van de huidige Nederlandse bevolking, waarin al deze informatie is opgenomen, zou dat de situatie aanzienlijk verbeteren. Dit project heeft tot doel een dergelijke databank te ontwikkelen, in de vorm van een synthetische populatie. Een dergelijke populatie bevat één record voor elke persoon in de Nederlandse bevolking. Dit record bevat echter geen gegevens van een echte persoon, maar synthetische informatie. Deze synthetische informatie is zodanig geconstrueerd dat de samenstelling van de synthetische populatie als geheel gelijk is aan die van de Nederlandse bevolking. Dit geldt zowel voor de verdeling van ziekten en risicofactoren, als voor alle onderlinge correlaties. Het construeren van een dergelijke synthetische populatie heeft nog niet eerder plaatsgevonden. Wanneer het zou lukken een dergelijke populatie te maken, zal dit het beleidsondersteunende onderzoek vereenvoudigen omdat problemen met gegevensbronnen niet voor iedere nieuwe vraag opnieuw opgelost hoeven te worden. Verder wordt onderzocht of het mogelijk is deze data, vanwege het synthetische karakter, als open data te beschouwen.
Doel(en) en onderzoeksvragen
- Het ontwikkelen van methoden voor het construeren van een synthetisch "determinant-ziekte populatie".
- Het bouwen van een prototype met daarin de meest relevante risicofactoren en ziekten voor de huidige RIVM chronische ziekte modellering.
Aanpak en methoden
Het project zal zich richten op:
- Ontwikkeling van predictiemodellen, die kunnen worden gebruikt om gegevens die uit verschillende bronnen afkomstig zijn onderling te koppelen. In sommige gevallen kunnen deze predictie modellen rechtstreeks worden afgeleid uit gegevens. In andere gevallen zullen deze worden ontwikkeld met behulp van externe informatie (in de literatuur gepubliceerde gegevens, zoals epidemiologische studies of expert meningen).
- Het ontwikkelen van een Bayesiaans model om inconsistente gegevens uit verschillende bronnen te integreren. Het model zal informatieve priors gebruiken over de grootte en de richting van mogelijke vertekeningen in de verschillen gegevensbronnen. Deze priors zullen worden gebaseerd op meningen van deskundigen.
- Het ontwikkelen van een aan multiple imputation gerelateerde benadering, waarmee de onzekerheid van schattingen die worden gedaan met de gegevens uit de synthetische populatie kunnen worden geëxpliciteerd. Hierbij wordt de populatie opgedeeld in segmenten, waarbij elk segment wordt geconstrueerd op basis van een enigszins verschillend predictiemodel. De verschillen tussen de resultaten op basis van ieder segment kunnen worden gebruikt om een betrouwbaarheidsinterval te leveren bij resultaten die worden berekend met gebruik van de synthetische populatie.
Verwachte resultaten
Methoden om een "synthetische populatie" te construeren. Methoden om betrouwbaarheids-intervallen te construeren rond resultaten uit een dergelijke populatie. Een prototype populatie.
Geplande producten
Twee of meer wetenschappelijke publicaties die de ontwikkelde methoden beschrijven. Een prototype van een synthetische populatie. Een onderzoeksvoorstel voor het verder uitbouwen van de database en/of de methodologie. Software die kan worden gebruikt om de methode toe te passen. Presentaties op wetenschappelijke conferenties.