# Data Story: Het verband tussen de levenstandaarden in een land en migratie

1. Lars van der Groep 14346168
2. Guido Elzer 15817628 
3. Simon van Rooij 15692221 

## Inleiding
Migratie is al erg lang een erg belangrijk onderwerp waar de meningen verdeeld over zijn. Er zijn namelijk verschillende redenen waardoor mensen uit hun herkomst land vertrekken. Veel mensen en ook overheden zijn geen voorstander van buitenlanders die binnenkomen in hun land, omdat ze gebruik willen maken van het succes dat daar behaald is. In deze datastory wordt er onderzocht of mensen vooral emigreren om uit hun eigen land weg te gaan, om naar een beter land te gaan, of misschien wel een combinatie tussen de twee.

#### Eerste perspectief: 
Migranten emigreren vooral uit hun eigen land omdat de levensomstandigheden in hun eigen land te slecht/gevaarlijk zijn om een normaal leven in te kunnen hebben.

##### Argument 1: Landen met een historische gebeurtenis wat de leefomstandigheden onleefbaar maakt hebben een sterke stijging van migratie als gevolg.
##### Argument 2: Er is sprake van een zichtbaar verband tussen migratiecijfers een slechte leefomstandigheden maar een slechte leefomstandigheid heeft niet altijd een verhoging van migratie als gevolg.


#### Tweede perspectief: 
Migratie heeft niet per se te maken met hoe slecht het met een land gaat maar eerder met hoe goed het met de buurlanden gaat.

##### Eerste argument: Mortality Rate en Migratie 
##### Tweede argument: gemiddeld BBP per persoon en emigratiepercentage trendline
##### Derde argument: buurlandverschillen


In [1]:
import pandas as pd
import plotly.express as px
import plotly.graph_objs as go
from plotly.offline import init_notebook_mode
from plotly.subplots import make_subplots
init_notebook_mode(connected=True)
from IPython.display import display, HTML
import json
import uuid

## Dataset en Preprocessing

Om onze argumenten te onderbouwen gebruiken we meerdere datasets die onze punten versterken. De dataset die centraal achter dit onderzoek staat is de dataset over wereldwijde migratie van de World Bank Group(2025) Deze dataset heeft meerdere variabelen die aangegeven zijn in de output hieronder. Alle jaartallen gebruiken data verzameld over een periode van 10 jaar. 
(Link naar de database https://databank.worldbank.org/source/global-bilateral-migration)


In [2]:
file = r"P_Data_Extract_From_Global_Bilateral_Migration.xlsx"
df = pd.read_excel(file)
df.head()


ImportError: Missing optional dependency 'openpyxl'.  Use pip or conda to install openpyxl.

De tweede dataset die we gebruiken is de dataset over de ontwikkeling van landen over tijd aan de hand van levensstandaarden (world Bank Group, 2025). Het succes van een land is hier in veel verschillende methodes af te lezen. Door het grote aantal variabelen hebben we gekozen voor de meest belangrijke variabelen met de grootste hoeveelheid data. Door te kijken naar de stijgingen of dalingen in de dataset kunnen wij concluderen hoe een land zich over een periode van jaren/decennia ontwikkeld.
(Link naar de database: https://databank.worldbank.org/source/world-development-indicators)

In [None]:
file2 = r"P_Data_Extract_From_World_Development_Indicators.xlsx"
df = pd.read_excel(file2)
df.head()

De derde dataset die we gebruiken is de dataset met de inwonersaantallen per land. Aan de hand van deze dataset kunnen we de migratiecijfers vergelijken met de inwonersaantallen van het betreffende land. Dit heeft de voordelen dat inwoner aantallen niet een vertekend beeld geven in het onderzoek
(Link naar de database:
https://data.worldbank.org/indicator/SP.POP.TOTL)

De laatste datasets die gebruikt worden als ondersteuning van onze perspectieven zijn de datasets “bbb.xlsx, gdp_per_inwoner.xlsx en longitude-latitude.xlsx”. bbb.xlsx is een dataset die de sterftecijfers per land weergeeft over een tijdsperiode. Deze hebben we los gemaakt uit world development indicators.

gdp_per_inwoner.xlsx komt uit de World Bank Group (2025) en geeft het gemiddelde bruto binnenlands product (BBP/GDP) aan per inwoner over een tijdsperiode.

Longitude-latitude.xlsx is een dataset die uit Google Datasets(2025) komt. De dataset geeft de coördinaten van alle landen in de wereld aan.

We hebben onze datasets niet echt verwerkt voordat we gingen werken aan de visualisaties. We hebben dit bij elke visualisatie apart gedaan in plaats van in één keer aan het begin. Dit komt vooral omdat we allemaal appart de data hadden verwerkt voor onze eigen visualisaties.


In [None]:
import pandas as pd
import plotly.graph_objects as go


df = pd.read_excel('P_Data_Extract_From_Global_Bilateral_Migration.xlsx')
df.columns = df.columns.str.strip()
coords = pd.read_csv('longitude-latitude.csv')
coords = coords[['ISO-ALPHA-3', 'Latitude', 'Longitude']].rename(columns={'ISO-ALPHA-3': 'Code'}).drop_duplicates()


df = df.dropna(subset=['Country Origin Name', 'Country Origin Code'])
year_columns = [col for col in df.columns if '[' in col and ']' in col]

for year in year_columns:
    df[year] = pd.to_numeric(df[year], errors='coerce').fillna(0)

valid_countries = sorted(df['Country Origin Name'].unique())


fig = go.Figure()

default_country = valid_countries[0] if valid_countries else None
default_year = year_columns[0] if year_columns else None
default_year_str = default_year.split('[')[1].split(']')[0] if default_year else None


for country in valid_countries:
    for year_col in year_columns:
        year = year_col.split('[')[1].split(']')[0]

        country_df = df[df['Country Origin Name'] == country].copy()
        country_df = country_df.rename(columns={year_col: 'Migratie'})
        country_df = country_df.merge(coords, left_on='Country Origin Code', right_on='Code', how='left')
        country_df = country_df.rename(columns={'Latitude': 'Lat_O', 'Longitude': 'Lon_O'}).drop(columns='Code')
        country_df = country_df.merge(coords, left_on='Country Dest Code', right_on='Code', how='left')
        country_df = country_df.rename(columns={'Latitude': 'Lat_D', 'Longitude': 'Lon_D'}).drop(columns='Code')
        country_df = country_df.dropna(subset=['Lat_O', 'Lon_O', 'Lat_D', 'Lon_D'])

        lats, lons, names = [], [], []

        for _, row in country_df.iterrows():
            if float(row['Migratie']) > 0:
                lats.extend([row['Lat_O'], row['Lat_D'], None])
                lons.extend([row['Lon_O'], row['Lon_D'], None])
                names.extend([f"{row['Country Dest Name']} ({int(float(row['Migratie']))})"] * 2 + [None])

        fig.add_trace(
            go.Scattergeo(
                lat=lats,
                lon=lons,
                hovertext=names,
                mode='lines',
                line=dict(width=1, color='red'),
                name=f"{country} ({year})",
                visible=(country == default_country and year == default_year_str)
            )
        )


def make_visibility(selected_country, selected_year):
    visibility = []
    for trace in fig.data:
        trace_country = trace.name.split(' (')[0]
        trace_year = trace.name.split('(')[-1][:-1]
        visibility.append(trace_country == selected_country and trace_year == selected_year)
    return visibility


combo_buttons = []
for country in valid_countries:
    for year_col in year_columns:
        year = year_col.split('[')[1].split(']')[0]
        visibility = make_visibility(country, year)
        combo_buttons.append(
            dict(
                label=f"{country} - {year}",
                method="update",
                args=[
                    {"visible": visibility},
                    {"title": f"Migratiestromen vanuit {country} in {year}"}
                ]
            )
        )


fig.update_layout(
    title=f'Migratiestromen vanuit {default_country} in {default_year_str}',
    geo=dict(
        projection_type='natural earth',
        showland=True,
        landcolor='rgb(243, 243, 243)',
        countrycolor='rgb(204, 204, 204)',
        fitbounds="locations",
        lataxis_range=[-90, 90],
        lonaxis_range=[-180, 180]
    ),
    updatemenus=[
        dict(
            buttons=combo_buttons,
            direction="down",
            pad={"r": 10, "t": 10},
            showactive=True,
            x=0.1,
            xanchor="left",
            y=1.05,  
            yanchor="top"
        )
    ],
    height=700,
    margin=dict(r=0, t=80, l=0, b=0),
    dragmode=False  
)


fig.show(config={'scrollZoom': False, 'staticPlot': True})



> Figuur 1: Een wereldwijde visualisatie van de emigratiestromen (rood) naar landen van bestemming vanuit een enkel land van oorsprong. Deze visualisatie geeft de lezer een inkijk in wereldwijde bewegingspatronen van migranten.