Regionale verschillen: schattingen per gemeente, wijk en buurt

Aanleiding

Op deze site worden cijfers over gezondheid en gezondheidsgerelateerde onderwerpen gepubliceerd. Vanwege de decentralisaties in het sociaal domein is steeds meer behoefte aan cijfers op kleinere geografische niveaus. Een belangrijke bron is de Gezondheidsmonitors volwassenen en ouderen van GGD'en, CBS en RIVM. Ondanks dat dit een enorm databestand is, bevat het onvoldoende respondenten om met behulp van weegmethoden cijfers te berekenen voor alle wijken en buurten in Nederland. Daarom heeft het RIVM een model ontwikkeld om cijfers te kunnen berekenen op wijk- en buurtniveau op basis van de Gezondheidsmonitor volwassenen van GGD'en, CBS en RIVM. Dit wordt wel het SMAP-model genoemd (SMall Area estimates for Policymakers). In 2012 zijn de eerste wijk- en buurtcijfers gepresenteerd. In 2016 is dit herhaald. Momenteel zijn de meest recente cijfers berekend op basis van de Gezondheidsmonitor van 2020.

Momenteel zijn er ook plannen om gegevens op wijk- en buurtniveau te berekenen op basis van de Nivel Zorgregistraties Eerste Lijn en het Woononderzoek Nederland. Daarnaast is het RIVM bezig om via andere methoden cijfers op gemeente-, wijk- en buurtniveau beschikbaar te stellen. We hebben inmiddels ook cijfers over blootstelling aan geluid op deze schaalniveaus beschikbaar. Deze zijn afkomstig uit het STAMINA-model.

Hieronder geven we een verantwoording van de totstandkoming van de gegevens.

SMAP-model

Methode - Algemeen

In het kader van de Gezondheidsmonitor zijn via vragenlijsten gegevens over gezondheid en leefstijl verzameld over volwassenen van 18 jaar en ouder. De ruim 540.000 deelnemers aan de Gezondheidsmonitor 2020 zijn anoniem in een beveiligde omgeving gekoppeld aan registratiebestanden van het CBS. Deze bestanden bevatten informatie over een reeks achtergrondkenmerken, zoals leeftijd, geslacht, herkomst, huishoudsamenstelling, opleidingsniveau, inkomen en woningtype. Er is een model gebruikt om de gezondheid en leefstijl te relateren aan deze achtergrondkenmerken. Ook wordt rekening gehouden met de ruimtelijke ligging. Door middel van deze relatie is het daarna mogelijk om voor alle volwassenen hun verwachte gezondheid en leefstijl te berekenen. De uitkomsten worden vervolgens gemiddeld over de betreffende wijk of buurt. De berekeningsmethode is herzien. Voorheen werd een STAR-model (Structured Additive Regression) gebruikt. Dit is vervangen door XGBoost (eXtreme Gradient Boosting).

Het model heeft als doel om cijfers te kunnen berekenen op wijk- en buurtniveau. De gemeentecijfers en landelijke cijfers op deze website zijn via hetzelfde statistische model berekend om als referentiecijfer te kunnen fungeren voor de wijk- en buurtcijfers. De cijfers kunnen afwijken van de gemeente- en landelijke cijfers die direct uit de Gezondheidsmonitor 2016 komen omdat ze volgens een andere methode (weegmethode van het CBS) berekend zijn. Voor gebieden met minder dan 10 inwoners worden geen cijfers getoond.

Schattingen

De cijfers op wijk- en buurtniveau moeten met enige voorzichtigheid worden gebruikt. Met het model wordt de werkelijkheid zo goed mogelijk benaderd, maar de cijfers blijven schattingen van de werkelijkheid. De cijfers worden met één decimaal gepresenteerd. Via RIVM Statline zijn ook betrouwbaarheidsintervallen beschikbaar.

De cijfers uit de Gezondheidsmonitor die zijn verkregen met behulp van weegmethoden zijn echter ook een benadering van de werkelijkheid. De weging is nodig vanwege o.a. selectieve non-respons. Net zoals bij de berekeningen van de wijk- en buurtcijfers zijn de weegfactoren van het CBS ook gebaseerd op achtergrondkenmerken van de respondenten.

Verschillen tussen wijkcijfers

Verschillende GGD’en hebben de steekproef voor de Gezondheidsmonitor opgehoogd om ook voldoende respondenten te hebben om cijfers op wijkniveau te kunnen presenteren. Omdat deze cijfers op een andere manier zijn berekend, kunnen ze afwijken van de cijfers die hier worden gepresenteerd. Niet alleen het onderliggende model is anders, ook het aantal achtergrondkenmerken dat wordt gebruikt verschilt; bij de RIVM schattingen wordt meer informatie over de bevolking gebruikt. Over het algemeen leiden de RIVM schattingen tot kleinere verschillen tussen gebieden dan de cijfers die verkregen zijn door middel van weegmethoden.

De volgende GGD'en publiceren eigen wijkcijfers:

Ook na ophoging blijft de steekproefomvang meestal te klein om ook cijfers op het nog gedetailleerdere buurtniveau te kunnen berekenen. De SMAP-methode biedt hiervoor een oplossing.

Grote aantallen nodig

Voor het doen van dit soort schattingen zijn grote aantallen respondenten nodig. Het is dus niet zo dat het ontwikkelde model de Gezondheidsmonitors kan vervangen. Hoe meer respondenten er zijn, hoe minder er geschat hoeft te worden en hoe beter de cijfers zijn.

Samenwerking

De cijfers zijn berekend in het kader van het Strategisch Programma RIVM (SPR), een programma voor onderzoek, innovatie en kennisontwikkeling. Een werkgroep van epidemiologen van GGD'en en GGD GHOR NL is er bij betrokken.

Meer weten?

De schattingen zijn gedaan middels XGBoost (eXtreme Gradient Boosting). Er wordt nog gewerkt aan een wetenschappelijk artikel over deze methode.

Voor vragen over de cijfers kunt u contact opnemen met Laurens Zwakhals.