Image
Donaudreef, Overvecht

Methode

2.1 Gebruik van beveiligde CBS-statistieken

Dit onderzoek is uitgevoerd met geanonimiseerde, gedetailleerde gegevens op individueel niveau, verzameld en beheerd door het Centraal Bureau voor de Statistiek (CBS). De analyse van de gegevens vindt plaats binnen de CBS-omgeving, onder strikte beveiligings- en privacy voorwaarden. De CBS-omgeving biedt toegang tot 'Woonbase', een database met veelzijdige informatie over wonen in Nederland, gemaakt in samenwerking met het ministerie van Binnenlandse Zaken en Koninkrijksrelaties. Deze database geeft inzicht in de relatie tussen personen, huishoudens en huisvesting. 'Woonbase' bevat gegevens over de periode 2018 tot en met 2021 over alle inwoners die zijn geregistreerd in de Basisregistratie Personen (BRP) van Nederland.

2.2 Bepaling van precieze onderzoeksgroep

De verhuizingen die in deze analyse zijn opgenomen, zijn uitsluitend die verhuizingen die door de burger zijn gemeld bij het bevolkingsregister van de Gemeente Utrecht. Adreswijzigingen als gevolg van een straatnaam- of huisnummerwijziging, gemeentelijke herindeling of vergelijkbare administratieve aanpassingen worden niet als verhuizing beschouwd. De definities van verhuizing naar, vanuit en binnen Overvecht zijn als volgt:

  • Een verhuizing naar Overvecht betekent dat de vorige woning buiten de wijkgrenzen lag en de nieuwe woning binnen Overvecht ligt.
  • Een verhuizing vanuit Overvecht betekent dat de vorige woning binnen Overvecht lag, maar de nieuwe woning zich buiten de wijk bevindt.
  • Een verhuizing binnen Overvecht houdt in dat zowel de oude als de nieuwe woning zich binnen de wijkgrenzen bevindt.

Om de analyse correct en volledig uit te voeren is een aantal keuzes gemaakt. Allereerst is ervoor gekozen om thuiswonende kinderen (gepeild op 31 december van het betreffende onderzoeksjaar) buiten het onderzoek te laten. Thuiswonende kinderen worden verondersteld samen te wonen met hun ouders en/of verzorgers en zullen zodoende hetzelfde ‘verhuisgedrag’ vertonen. Daarnaast zijn er nog twee groepen inwoners buiten de analyse gelaten: studenten/scholieren en inwoners van institutionele huishoudens. Van deze populaties wordt aangenomen dat hun verhuispatronen aanzienlijk kunnen afwijken van die van de rest van de bevolking. Daarmee kunnen de algemene verhuisstatistieken vertekend raken en kan het moeilijker worden om hierin scherpe trends en patronen te identificeren

Tot slot is besloten om verhuizingen op het niveau van huishoudens te benaderen en niet op individueel- of persoonsniveau. Verhuisbeslissingen gelden doorgaans voor een geheel huishouden en worden beïnvloed door de kenmerken van alle gezinsleden samen, zoals bijvoorbeeld het gezamenlijk huishoudinkomen.

2.3 Indicatoren

In de analyse zijn de volgende indicatoren meegenomen: leeftijd, huishoudinkomen, aantal personen huishouden, eigendomsvorm van de woning, type huishouden, inkomensbron, geslacht en opleiding. 

Tabel 2.1 Beschikbare indicatoren voor analyse 

Indicator Indeling Data type
Leeftijd Jaren Numeriek
Belastbaar huishoudinkomen Euro’s Numeriek
Aantal personen huishouden Personen Numeriek
Eigendomsvorm woning Koop
Particuliere huur
Woningcorporatie
Onbekend
Categorie
Type Huishouden Eenpersoonshuishouden
Paar zonder kinderen
Paar met kinderen
Eenouderhuishouden
Overig
Categorie
Inkomensbron Werknemer
Uitkering (niet AOW)
AOW-uitkering
Zelfstandige
Onbekend
Categorie
Geslacht Man
Vrouw
Categorie
Opleiding Geen startkwalificatie
- Basisonderwijs (groep 1-8)
- Praktijkonderwijs, havo-, vwo-onderbouw, vmbo
Havo, vwo, mbo
- Mbo (1-4)
- Havo-, vwo-bovenbouw
Hbo, wo
- Hbo-bachelor, wo-bachelor, Hbo-master, wo-master, postdoctoraal
Onbekend
Categorie



2.4 Statistische analyse

Voor de statistische analyse is de programmeertaal Python gebruikt. Zoals weergegeven in tabel 2.1, bestaat de set indicatoren uit zowel numerieke als categorische variabelen. Dit onderscheid is relevant, omdat verschillende typen gegevens verschillende statistische toetsen vereisen. In deze analyse worden resultaten als statistisch significant beschouwd bij een p-waarde van < 0.05. Als een resultaat significant is, betekent dat dat de gevonden verschillen tussen uitkomsten slechts voor een heel klein deel aan toeval kunnen worden toegeschreven. Veel aannemelijker is het dan om te veronderstellen dat het gaat om realistische (echte) verschillen. Om vast te stellen of de inwoners die in 2018 t/m 2021 naar, binnen of uit Overvecht zijn verhuisd onderling significante demografische verschillen vertonen, zijn diverse statistische toetsen gebruikt. Achtergronden van deze toetsen worden toegelicht in onderstaand kader. 

Gebruik van statistische toetsen

Allereerst zijn de indicatoren getoetst en gecorrigeerd op de aanwezigheid van outliers. Outliers zijn waarnemingen die sterk afwijken van de rest en daardoor de resultaten scheef kunnen trekken en zo een vertekend beeld van de werkelijkheid kunnen geven. Een voorbeeld van een outlier is een huishouden met een jaarinkomen van €10 miljoen in een dataset waar de meeste mensen rond de €30.000 verdienen; zonder correctie kan dit het gemiddelde inkomen veel hoger laten lijken dan wat voor de meeste mensen realistisch is. Aangaande de numerieke indicatoren, zijn daarna de assumpties voor de ANOVA-toets getest. Zowel de assumptie van normaliteit (Shapiro-Wilk toets) als de assumptie van homogeniteit van varianties tussen de klassen (Levene's toets) werden geschonden. Daarom zijn de verschillen tussen de drie groepen verhuizers getoetst met een non-parametrische Kruskal Wallis toets, in combinatie met een post-hoc Mann-Whitney U toets, inclusief Bonferroni-correctie voor multiple comparisons. Aangaande de categorische variabelen uit de indicatoren set, zijn de verschillen getoetst met de Chi-kwadraattoets voor onafhankelijkheid en een post-hoc Z-toets voor onafhankelijkheid met Bonferroni-correctie voor multiple comparisons.