# Data story hypotheekschulden

Student names: Fabian Veltkamp, Finley Helms, Jesse Mastenbroek, Patrick Wisse

Team number: I3

In [10]:
# Afbeeldingen inladen via url
url = 'https://cdn.canadianmortgagetrends.com/wp-content/uploads/2022/10/Mortgage-rates-on-the-rise_med-770x490.jpg'

# Afbeelding weergeven
from IPython.display import Image, display

width = 600
height = 300

subtitle = "© Getty images"

image = Image(url=url, width=width, height=height)

display(image)
print(subtitle)

© Getty images


# Inleiding

In de afgelopen jaren is er een redelijk constante stijging van de hypotheekschulden, dit is in de data die we gebruiken voor het onderzoek te zien. Hierboven op heeft de economie nog een harde klap gehad vanwege het coronavirus. Dan komt de vraag omhoog of die stijgende hypotheekschulden wellicht problemen veroorzaken. Daar omheen zal ons onderzoek ook gecentreerd staan. 

De stijgende schulden kunnen gelinkt worden aan andere informatie uit de data en hierdoor kunnen dan stellingen gedaan worden over het feit dat de schulden stijgen. Zo willen we ook niet alleen focussen op de financiële kant, maar ook op wat dit doet met de mensen. 

# Dataset and preprocessing

### [Dataset 1](https://opendata.cbs.nl/statline/portal.html?_la=nl&_catalog=CBS&tableId=85162NED&_theme=190)
Deze dataset bevat info over het financieel risico voor huiseigenaren. Hypytheekschuld, woningwaarde en inkomen worden aan elkaar gekoppeld. Hierbij word er onderscheid gemaakt tussen de resultaten met factoren op basis van huishoudsamenstelling, leeftijd van de kostwinner, inkomens groepen en vermogensgroepen. Er zijn drie belangrijke
metingen van financieel risico, hypotheekschuld/woningwaarde (LTV), hypotheekschuld/bruto inkomen en hypotheekschuld/besteedbaar inkomen.

### [Dataset 2](https://opendata.cbs.nl/statline/portal.html?_la=nl&_catalog=CBS&tableId=85558NED&_theme=168)
De dataset bevat cijfers over welzijn in relatie met financiën. De cijfers over welzijn gaan over de bevolking van Nederland van 18 jaar of ouder. Dit wordt gedaan door middel van termen van geluk en tevredenheid met de financiële situatie (en het leven). Ook worden de mate van zorgen over de financiële toekomst opgenomen. Deze (financiële)] onderwerpen zijn verder opgesplitst in meerdere kenmerken.

### Preprocessing
Voor de eerste stap van de dataverwerking hebben we de gegevens ingeladen met Pandas. We hebben beide datasets ingeladen met sep=";" als parameter aangezien de csv bestanden een punt komma gebruikte als scheidingsteken. Daarna hebben we de kolomnamen van beide datasets gestandaardiseerd door spaties te vervangen door underscores. Dit hebben we gedaan zodat er makkelijker te refereren is naar deze kolommen. Ontbrekende waardes in de datasets werden aangegeven met een . maar dit hebben we veranderd naar NaN zodat Pandas dit beter herkend als ontbrekende waardes. 

Ook doen we voor een aantal relevante kolommen de waardes veranderen naar een numeric value in plaats van een string omdat het cbs de kolommen in een string aanlevert en Pandas dit niet herkend. Daarnaast veranderen we de Perioden kolom. In de originele 2 datasets word er na elk jaartal 'JJ00' gezet. Dit gaan we voor elk jaar weghalen zodat dit een integer word waarmee we met Pandas kunnen werken.

In [11]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import plotly.graph_objs as go
import plotly.express as px

# Loading datasets
df_tevredenheid = pd.read_csv('tevredenheid.csv', sep=";")
df_schuld = pd.read_csv('schuld.csv', sep=";")

# Replace spaces with underscores
df_tevredenheid.columns = df_tevredenheid.columns.str.replace(' ', '_')
df_schuld.columns = df_schuld.columns.str.replace(' ', '_')

# Replace '.' with NaN
df_tevredenheid.replace('.', np.nan, inplace=True)
df_schuld.replace('.', np.nan, inplace=True)

# Convert string to numeric
df_tevredenheid['ScoreGeluk_1'] = pd.to_numeric(df_tevredenheid['ScoreGeluk_1'], errors='coerce')
df_schuld['GemiddeldeHypotheekschuldEigenWoning_2'] = pd.to_numeric(df_schuld['GemiddeldeHypotheekschuldEigenWoning_2'], errors='coerce')
df_schuld['GemiddeldBesteedbaarInkomen_5'] = pd.to_numeric(df_schuld['GemiddeldBesteedbaarInkomen_5'], errors='coerce')
df_tevredenheid['ScoreTevredenheidFinancieleSituatie_9'] = pd.to_numeric(df_tevredenheid['ScoreTevredenheidFinancieleSituatie_9'], errors='coerce')
df_tevredenheid['ScoreZorgenOverFinancieleToekomst_13'] = pd.to_numeric(df_tevredenheid['ScoreZorgenOverFinancieleToekomst_13'], errors='coerce')

#Cleaning the Perioden column
df_tevredenheid['Perioden_clean'] = df_tevredenheid['Perioden'].str.replace('JJ00', '').astype(int)
df_schuld['Perioden_clean'] = df_schuld['Perioden'].str.replace('JJ00', '').astype(int)

# De stijgende hypotheekschulden vormen geen probleem op financieel gebied

Het eerste perspectief is dat de stijgende hypotheekschulden geen probleem vormen op financieel gebied. Het perspectief is er dus op gebasseerd dat mensen hun financiën niet erop achteruit gaan, ondanks dat de hypotheekschulden toenemen. Het is makkelijk om snel te denken dat stijgende hypotheekschulden zorgen voor financiële problemen, maar als het verder goed gaat met de financiën hoeft dat niet gelijk zo te zijn. De volgende argumenten, met ondersteunende grafieken, ondersteunen dit perspectief.

## De inkomens stijgen ook

Hoewel de toename van hypotheekschulden in Nederland op het eerste gezicht zorgwekkend kan lijken, biedt de groei van bruto- en besteedbaar inkomen een tegengewicht. Volgens recente gegevens van het CBS is het gemiddeld beschikbaar inkomen per hoofd van de bevolking in de afgelopen veertig jaar met 60% gestegen (CBS, 2021). Deze toename in besteedbaar inkomen zorgt voor extra financiële zekerheid bij Nederlandse huishoudens, wat helpt om de toename van de hypotheekschuld te compenseren.
Argument 1 bij P1: Het bruto-inkomen en besteedbaar inkomen stijgen ook (zorgt voor meer financ. zekerheid)
Ondanks de stijging van de hypotheekschuld in Nederland, is er ook sprake van een aanzienlijke stijging van het besteedbaar inkomen. Dit vergroot de financiële zekerheid van huishoudens en stelt hen in staat om hun stijgende hypotheekschuld op een verantwoorde manier te beheren. De gegevens van het CBS bevestigen dit, waarbij het gemiddeld beschikbaar inkomen per hoofd van de bevolking in de afgelopen 40 jaar met 60% is gestegen (CBS, 2021). Deze trend van stijgende inkomens wordt ook ondersteund door veranderingen in de consumptiepatronen van Nederlanders, met een opmerkelijke toename van het bezit van auto's, consumentenelektronica en de frequentie van buitenlandse vakanties en horecabezoeken.

In [12]:
"Figuur 1: Bar Chart Hypotheekschulden"

'Figuur 1: Bar Chart Hypotheekschulden'

Deze grafiek toont de gestage stijging van de hypotheekschuld in Nederland over een bepaalde periode. Op het eerste gezicht kan dit zorgwekkend lijken, maar in de context van de stijgende inkomens wordt dit minder problematisch.

In [13]:
"Figuur 2: Lijngrafiek Bruto-Inkomen en Besteedbaar Inkomen"

'Figuur 2: Lijngrafiek Bruto-Inkomen en Besteedbaar Inkomen'

Deze grafiek illustreert de stijging van het bruto- en besteedbaar inkomen in Nederland. Dit ondersteunt het argument dat de stijging van de hypotheekschuld geen probleem hoeft te zijn, aangezien het bruto- en besteedbaar inkomen van huishoudens in gelijke mate is toegenomen.

## De schuldrisico kengetallen (LTI) dalen

Schuldrisico kengetallen zijn verhoudingsgetallen die bijhouden hoe groot het risico is dat de huishoudens lopen door het hebben van hypotheekschulden. Onze eerste dataset maakt onderscheid tussen drie verschillende schuldrisico kengetallen:
- hypotheekschuld / woningwaarde (LTV)
- hypotheekschuld / bruto-inkomen (LTI)
- hypotheekschuld / besteedbaar inkomen (LTI)

Het eerste kengetal geeft een verhouding weer tussen de hypotheekschuld van de eigen woning en de waarde van de eigen woning. Dit verhoudingsgetal staat ook wel bekend als loan-to-value (LTV). Omdat deze waarde hetzelfde is gebleven na de periode die we gebruiken, gaan we er niet verder op in. De andere twee verhoudingsgetallen zijn loan-to-income ratio’s. Deze geven dus de verhouding weer van de hypotheekschuld met het inkomen, waarbij gekozen kan worden tussen het bruto-inkomen en het besteedbaar inkomen. Bij de ratio’s geldt: hoe lager het inkomen of hoger de schulden, hoe hoger de LTI, en dus hoe hoger het betalingsrisico.


In [14]:
"Figuur 3: Een gegroepeerde staafdiagram met de twee loan-to-income (LTI) schuldrisico kengetallen als variabelen. Op de y-as staan de waardes van de kengetallen, en op de x-as staan de jaartallen."

'Figuur 3: Een gegroepeerde staafdiagram met de twee loan-to-income (LTI) schuldrisico kengetallen als variabelen. Op de y-as staan de waardes van de kengetallen, en op de x-as staan de jaartallen.'

Zoals in de grafiek te zien is, dalen over de periode de waardes van de schuldrisico kengetallen. Zoals eerder vernoemd, zorgt een hogere LTI voor een hoger betalingsrisico. In dit geval nemen de waarden juist af en zijn de LTI ratio’s dus minder geworden over de tijd. Dit suggereert dus dat de stijgende hypotheekschulden geen probleem zijn.

# De stijgende hypotheekschulden vormen geen probleem op mentaal gebied

Het tweede perspectief is dat de stijgende hypotheekschulden geen probleem vormen op mentaal gebied. Het perspectief is er dus op gebasseerd dat mensen, ondanks de toenemende hypotheekschulden, er niet mentaal op achteruit gaan. Het is makkelijk om snel te denken dat stijgende hypotheekschulden zorgen voor mentale problemen, omdat hogere schulden kunnen zorgen voor stresvolle situaties, maar dit hoeft niet gelijk zo te zijn. De volgende argumenten, met ondersteunende grafieken, ondersteunen dit perspectief.

## Geluk en tevredenheid met het leven bij mensen met eigenwoning blijft gelijk

In onze tweede dataset staat er data in over hoe gelukkig mensen zijn en over hun tevredenheid met het leven. Natuurlijk is het niet heel duidelijk wat er precies onder 'geluk' verstaan wordt. Om de data te krijgen werd gevraagd: ‘Kunt u op een schaal van 1 tot en met 10 aangeven in welke mate u zichzelf een gelukkig mens vindt?' Een 1 staat voor volledig ongelukkig en 10 voor volledig gelukkig. Tevredenheid met het leven werd op dezelfde manier gedaan maar dan werd gevraagd hoe tevreden mensen zijn met het leven wat ze nu leiden.

In [15]:
"figuur 4 taartdiagram geluk bij mensen met eigenwoning"

'figuur 4 taartdiagram geluk bij mensen met eigenwoning'

Wanneer we het geluksniveau onder individuen met hypotheekschulden door de jaren heen analyseren, onthult dit een consistente trend. Dit is in figuur 4 te zien. Een taartdiagram, dat de verdeling van geluk weergeeft, toont aan dat er geen significante verandering is in het algehele geluk van huiseigenaren ondanks hun toenemende hypotheekschulden. De diagram blijft relatief stabiel, hieruit kunnen we concluderen dat individuen geen afname in geluk ervaren wanneer de schulden toenemen.

In [16]:
"figuur 5 taartdiagram tevredenheid met het leven bij mensen met eigenwoning"

'figuur 5 taartdiagram tevredenheid met het leven bij mensen met eigenwoning'

Er wordt een vergelijkbare trend waargenomen als we naar tevredenheid met het leven kijken van individuen die huiseigenaren zijn. Deze gegevens hebben we met behulp van figuur 5 in een taartdiagram kunnen weergeven. Ondanks de momenteel stijgende hypotheekschulden is er in de diagram geen verschuiving van verdelingspatroon te zien. Hieruit valt te concluderen dat de tevredenheid met het leven van huiseigenaren constant blijft en niet aanzienlijk wordt beinvloed door de stijgende hypotheekschulden.

Onze bevindingen tonen aan dat individuen met hypotheekschulden in staat blijven om de financiele verplichtingen die ze hebben, te beheren zonder dat dit een significant effect heeft op hun algehele geluk. Hieruit kunnen we concluderen dat, hoewel hypotheekschulden bestaan, ze geen grote impact hebben op individuen en daardoor de maatschappij op mentaal niveau.

## Tevredenheid met de financiële situatie stijgt en zorgen over de financiële toekomst dalen bij mensen met eigenwoning

Net zoals bij geluk en tevredenheid met het leven is hier weer aan de mensen gevraag om een score te geven van 1 tot 10, maar nu om aan te geven hoe tevreden ze zijn met de situatie van hun huishouden en hoevaak ze zich zorgen maken over hun financiële toekomst. Om dit argument te onderbouwen hebben we gebruik gemaakt van een boxplot van beide variabelen. Deze lijken op het eerste gezicht misschien ook op variabelen die over financiën gaan, maar ze gaan eigenlijk over wat de individuen vinden van hun financiële situaties.

In [17]:
"figuur 6 boxplot met dropdown"

'figuur 6 boxplot met dropdown'

Figuur 6 toont een boxplot die de tevredenheidsniveaus weergeeft. Hierin is een opmerkelijke trend te zien. In de afgelopen jaren neemt tevredenheid van huiseigenaren met hun financiele situatie toe. Dit wijst erop dat de toenemende hypotheekschulden de financiële tevredenheid niet zodanig negatief beïnvloedt dat het ook begint te dalen.

De tweede boxplot in figuur 6 toont de zorgen over de financiele toekomst van de individuen. De individuen blijken minder vaak angstig te worden over hun toekomst, hieruit valt te concluderen dat ze vetrouwen hebben in hun vermogen om schulden te beheren en financieel stabiel te blijven of zelfs te groeien. 
Door deze argumenten en ondersteunende visualisaties te presenteren, kun je het perspectief illustreren dat stijgende hypotheekschulden geen probleem vormen op mentaal niveau.

# Reflection

de feedback die we hebben behandeld: 
- Grafieken duidelijker
- Uitleg bij de plots
- Verbanden tussen goede plot en plots die iets zeggen
- Goede argumenten uit de plots
- Koppelen aan wetenschappelijke bronnen

# Work distribution

jo

# References
CBS. (2021). Economische groei en het inkomen van Nederlanders. https://www.cbs.nl/nl-nl/longread/de-nederlandse-economie/2021/economische-groei-en-het-inkomen-van-nederlanders?onepage=true

Lee, L. O., James, P., Zevon, E. S., Kim, E. S., Spiro, A., Grodstein, F., & Kubzansky, L. D. (2019). Optimism is associated with exceptional longevity in 2 epidemiologic cohorts of men and women. Proceedings of the National Academy of Sciences, 116(37), 18357-18362. https://doi.org/10.1073/pnas.1900712116