# Milieugevolgen van de Uitstoot van Broeikasgassen
![image](images/home8.png)

In [None]:
import plotly.graph_objs as go
import plotly.express as px
import pandas as pd
import numpy as np
from scipy.stats import pearsonr

nd_df = pd.read_csv('https://raw.githubusercontent.com/Elijah-1/IV-dataset-emissions/main/disaster-events%20new.csv')
ghg_df = pd.read_csv('https://raw.githubusercontent.com/Elijah-1/IV-dataset-emissions/main/transformed_data_separate_columns.csv')

#try:
    #disaster_data_country = pd.read_csv('https://raw.githubusercontent.com/Elijah-1/IV-dataset-emissions/main/1970-2021_DISASTERS.xlsx%20-%20emdat%20data.csv',on_bad_lines='skip')
#except pd.errors.ParserError as e:
    #print(f"Error parsing disaster data: {e}")

# Load the emissions data
#emissions_data_country = pd.read_csv('https://raw.githubusercontent.com/Elijah-1/IV-dataset-emissions/main/global-co2-fossil-plus-land-use.csv')

# remove last year and 1970- years from natural disaster dataset
nd_df = nd_df[nd_df['Year'] >= 1970]
nd_df = nd_df[nd_df['Year'] != 2023]
nd_df = nd_df[nd_df['Year'] != 2024]

# emissions only all per year
ghg_all_df = ghg_df[ghg_df['Substance'] == 'ALL'][['Year', 'Emissions']]

# emissions excluding all per year
ghg_ex_df = ghg_df[ghg_df['Substance'] != 'ALL']

# natural disasters only all disasters per year
nd_all_df = nd_df[nd_df['Entity'] == 'All disasters'][['Year', 'Disasters']]

# natural disasters excluding all disasters {wildcard} per year
nd_ex_df = nd_df[~nd_df['Entity'].str.startswith('All disasters')]

# Extract disaster data for "all disasters"
nd_all_disasters_df = nd_df[nd_df['Entity'] == 'All disasters']

# merged
merged_all_df = pd.merge(ghg_all_df, nd_all_df, on='Year', how='inner')

disaster_counts = nd_ex_df.groupby('Entity')['Disasters'].sum().reset_index()

De wereld wordt steeds meer bedreigd door natuurrampen, een probleem dat verergerd wordt door de groeiende uitstoot van broeikasgassen. Mensen die in kwetsbare gebieden wonen, zijn ervan overtuigd dat de toename in frequentie en hevigheid van deze rampen direct verband houdt met de stijgende emissies. Dit heeft verwoestende effecten op hun levens, eigendommen en lokale economieën. Studies tonen aan dat broeikasgassen, veroorzaakt door menselijke activiteiten, de klimaatverandering versnellen. Dit leidt tot extremere weersomstandigheden zoals overstromingen en hittegolven. Anderen beweren echter dat veel van deze veranderingen te wijten zijn aan natuurlijke variaties in het klimaat en dat de impact van broeikasgassen wordt overdreven en dat adaptieve strategieën en technologieën voldoende zijn om eventuele negatieve effecten te mitigeren. Deze uiteenlopende perspectieven suggereren dat er verschillen in interpretatie en prioriteit zijn bij het aanpakken van de gevolgen van klimaatverandering.

### Perspectief 1
De uitstoot van broeikasgassen heeft een significante invloed op de frequentie en intensiteit van natuurrampen.

##### Argumenten
1. De meest voorkomende natuurramp is overstroming, die wordt veroorzaakt door de verhoogde temperatuur waardoor gletsjers smelten (zie Grafiek 2 & relevante literatuur).
  * Uitleg: Door de stijgende temperaturen smelten gletsjers sneller, wat leidt tot een toename van het waterniveau in rivieren en oceanen. Dit veroorzaakt vaker overstromingen, wat een directe impact heeft op gemeenschappen en infrastructuren.
2. De positieve Pearson-correlatiecoëfficiënten laten zien dat er een positief verband is tussen het aantal natuurrampen en de uitstoot van broeikasgassen.
  * Uitleg: Statistische analyses tonen aan dat er een positieve correlatie bestaat tussen de toename van broeikasgasuitstoot en de frequentie van natuurrampen. Dit suggereert dat hogere uitstootniveaus bijdragen aan een verhoogde kans op natuurrampen.

### Perspectief 2
Het tweede perspectief is dat de uitstoot van broeikasgassen een minimale invloed heeft op natuurrampen.

##### Argumenten
1. Hoewel de uitstoot van broeikasgassen over de jaren is gestegen, is het aantal natuurrampen niet significant toegenomen (zie Grafiek 1 & 4).
  * Uitleg: Ondanks de gestage toename van broeikasgasuitstoot, blijft het aantal natuurrampen relatief constant. Dit wijst erop dat andere factoren mogelijk een grotere rol spelen in het veroorzaken van natuurrampen dan de uitstoot van broeikasgassen.
2. Het zwakke positieve verband tussen natuurrampen en de uitstoot van broeikasgassen kan worden verklaard door andere factoren.
  * Uitleg: Hoewel er een zwakke positieve correlatie bestaat, kan deze relatie worden beïnvloed door andere variabelen zoals natuurlijke klimaatcycli, vulkanische activiteit, en veranderingen in landgebruik. Deze factoren kunnen de waargenomen toename in natuurrampen beter verklaren dan de uitstoot van broeikasgassen alleen.
3. (Zwak) Power Industry veroorzaakt de meeste broeikasgasuitstoot maar is onmisbaar voor landen, waardoor het reduceren ervan problematisch is vanwege economische en maatschappelijke afhankelijkheid..
  * De power industry veroorzaakt de meeste broeikasgasuitstoot vanwege het gebruik van fossiele brandstoffen zoals steenkool en aardgas. Ondanks deze impact is de sector essentieel voor economische groei, industriële productie en dagelijkse functies zoals elektriciteit voor huishoudens en bedrijven. Dit maakt het verminderen van de uitstoot uitdagend, omdat landen afhankelijk zijn van de continuïteit van de elektriciteitsindustrie voor hun basisbehoeften en economische stabiliteit.



In [None]:
# Assuming nd_ex_df is already defined
disaster_types = nd_ex_df['Entity'].unique()
colors = px.colors.qualitative.T10[:len(disaster_types)]
color_map = {disaster: colors[i % len(colors)] for i, disaster in enumerate(disaster_types)}

# Create the stacked bar plot
fig_bar = go.Figure()

for disaster in disaster_types:
    disaster_data = nd_ex_df[nd_ex_df['Entity'] == disaster]
    fig_bar.add_trace(go.Bar(
        x=disaster_data['Year'],
        y=disaster_data['Disasters'],
        name=disaster,
        marker=dict(color=color_map[disaster])
    ))

fig_bar.update_layout(
    barmode='stack',
    title='Number of Disasters per Type per Year',
    xaxis=dict(title='Year', titlefont=dict(size=14), tickfont=dict(size=12)),
    yaxis=dict(title='Number of Disasters', titlefont=dict(size=14), tickfont=dict(size=12)),
    legend=dict(
        title='Disaster Type',
        font=dict(size=14),
        orientation='h',
        yanchor='top',
        y=-0.3,  # Adjust this value to move the legend further below the graph
        xanchor='center',
        x=0.5
    ),
    height=600 # Increase height for better visibility
)

fig_bar.show()

Deze grafiek laat het aantal natuurrampen zien van 1970 tot 2022, onderverdeeld in verschillende categorieën. Er is een duidelijke toename te zien van het aantal natuurrampen tussen 1970 en 2000. Na 2000 is er echter geen significante stijging of daling meer waarneembaar, wat resulteert in een vergelijkbaar aantal natuurrampen in 2022 ten opzichte van 2000.

In [None]:
fig_pie = go.Figure(go.Pie(
    labels=disaster_counts['Entity'],
    values=disaster_counts['Disasters'],
    hole=0.8,
    marker=dict(colors=[color_map[disaster] for disaster in disaster_counts['Entity']]),
    textposition='outside',
    textinfo='percent'
))

fig_pie.update_layout(
    title_text='Occurrences of Each Disaster',
)

fig_pie.show()

Grafiek 2 is een cirkeldiagram dat de verdeling van typen natuurrampen laat zien van 1970 tot 2022. Uit de grafiek blijkt dat overstromingen de meest voorkomende natuurramp zijn, gevolgd door extreme weersomstandigheden. Deze twee typen natuurrampen kunnen worden veroorzaakt door de stijgende broeikasgasuitstoot, die leidt tot hogere temperaturen.

In [None]:
fig = go.Figure()
fig.add_trace(go.Scatter(x=ghg_all_df['Year'], y=ghg_all_df['Emissions'], mode='lines+markers', name='Emissions'))
fig.update_layout(
    title='Global Greenhouse Gas Emissions Over Years',
    xaxis_title='Year',
    yaxis_title='Emissions',
    template='plotly_white',
   # paper_bgcolor='#d1e8d2',  # Background color for the whole output
   # plot_bgcolor='#d1e8d2', 
    margin=dict(l=50, r=50, b=115, t=100),  # Adjust margins as needed
    annotations=[
        dict(
            x=0.5,
            y=-0.33,
            xref='paper',
            yref='paper',
            text='Deze grafiek laat de trends zien in broeikasgasemissies van 1970 tot 2022. Over het algemeen vertoont de grafiek een toename van de <br> broeikasgasuitstoot. Met name valt op dat de stijging tussen 2000 en 2022 aanzienlijk sterker is dan tussen 1970 en 2000.',
            showarrow=False,
            align='center',
            font=dict(
                family='Arial',
                size=12,
                color='black'
            )
        )
    ]
)

fig.show()

In [None]:
aggregated_df = ghg_ex_df.groupby(['Year', 'Sector'], as_index=False)['Emissions'].sum()

# Pivot the dataframe to have years as rows and sectors as columns
pivot_df = aggregated_df.pivot(index='Year', columns='Sector', values='Emissions')

# Create the figure
fig = go.Figure()

# Add traces for each sector
for sector in pivot_df.columns:
    fig.add_trace(go.Scatter(
        x=pivot_df.index,
        y=pivot_df[sector],
        mode='lines+markers',
        name=sector,
    ))

# Update layout
fig.update_layout(
    title="GHG Emissions by Sector (1970-2022)",
    xaxis_title="Year",
    yaxis_title="Emissions",
    legend_title="Sector",
    hovermode="x",
    template="plotly_white",
    legend=dict(
        orientation="h",
        yanchor="top",
        y=-0.2,  # Adjust this value to move the legend further down
        xanchor="center",
        x=0.5
    ),
    annotations=[
        dict(
            xref='paper', yref='paper',
            x=0.5, y=-0.45,
            showarrow=False,
            text="De grafiek toont de uitstoot van broeikasgassen (GHG) per sector van 1970 tot 2022, met sectoren zoals landbouw, <br> gebouwen, brandstofwinning, industriële verbranding, de energiesector, processen, transport en afval.",
            font=dict(size=12),
            xanchor='center',
            yanchor='top'
        )
    ],
    margin=dict(l=20, r=20, t=80, b=170)
)

# Show the figure
fig.show()

Duidelijke trends zijn zichtbaar: de energiesector vertoont een significante toename in uitstoot, terwijl sectoren als afval en transport relatief stabiel zijn gebleven.
De grafiek biedt inzicht in de historische ontwikkelingen van GHG-uitstoot per sector. Deze informatie is cruciaal voor het ontwikkelen van strategieën tegen klimaatverandering en helpt beleidsmakers en onderzoekers om beter geïnformeerde beslissingen te nemen.

In [None]:
sectors = ghg_ex_df['Sector'].unique()
disaster_types = nd_ex_df['Entity'].unique()

def calculate_pearson(df1, df2, sector):
    correlations = []
    for disaster in disaster_types:
        merged_df = pd.merge(
            df1[(df1['Sector'] == sector)][['Year', 'Emissions']],
            df2[(df2['Entity'] == disaster)][['Year', 'Disasters']],
            on='Year'
        )
        if not merged_df.empty:
            corr, _ = pearsonr(merged_df['Emissions'], merged_df['Disasters'])
            correlations.append(corr)
        else:
            correlations.append(None)
    return correlations

def calculate_all_disasters_pearson(df1, df2, sector):
    merged_df = pd.merge(
        df1[(df1['Sector'] == sector)][['Year', 'Emissions']],
        df2[['Year', 'Disasters']],
        on='Year'
    )
    if not merged_df.empty:
        corr, _ = pearsonr(merged_df['Emissions'], merged_df['Disasters'])
        return corr
    else:
        return None

# Initial calculation for the first sector
initial_sector = sectors[0]
correlations = calculate_pearson(ghg_ex_df, nd_ex_df, initial_sector)
all_disasters_correlation = calculate_all_disasters_pearson(ghg_ex_df, nd_all_disasters_df, initial_sector)

# Define colors
colors = px.colors.qualitative.T10

# Create the initial bar plot
fig = go.Figure(data=[
    go.Bar(name='Individual Disasters', x=disaster_types, y=correlations, marker_color=colors),
    go.Bar(name='All Disasters', x=['All Disasters'], y=[all_disasters_correlation], marker_color=colors[1])
])

fig.update_layout(
    title=f'Pearson Correlation for all the Sectors',
    xaxis_title='Disaster Type',
    yaxis_title='Pearson Correlation Coefficient',
    barmode='group',
    showlegend=False  # Remove the legend
)

# Create the dropdown menu
dropdown_buttons = [
    dict(label=sector,
         method='update',
         args=[{
             'y': [calculate_pearson(ghg_ex_df, nd_ex_df, sector),
                   [calculate_all_disasters_pearson(ghg_ex_df, nd_all_disasters_df, sector)]],
             'marker': [
                 {'color': colors[:len(disaster_types)]},  # Colors for individual disasters
                 {'color': [colors[1]]}  # Color for all disasters
             ],
             'title': f'Pearson Correlation for {sector} Sector'
         }])
    for sector in sectors
]

fig.update_layout(
    updatemenus=[
        dict(
            buttons=dropdown_buttons,
            direction='down',
            pad={'r': 10, 't': 10},
            showactive=True,
            x=0.1,
            xanchor='left',
            y=1.1,
            yanchor='top'
        )
    ],
    annotations=[
        dict(
            xref='paper', yref='paper',
            x=0.5, y=-0.5,
            showarrow=False,
            text="De grafieken tonen de Pearson-correlatiecoëfficiënten voor verschillende rampen en <br> hun impact op diverse sectoren. Met de knop kun je selecteren welke sector je wilt bekijken.",
            font=dict(size=12),
            xanchor='center',
            yanchor='top'
        )
    ],
    margin=dict(l=20, r=20, t=80, b=180)
)

fig.show()

Extreem weer en overstromingen hebben consequent de hoogste positieve correlaties in meerdere sectoren, waaronder landbouw, brandstofwinning, industriële verbranding, de energiesector, processen, transport en afval. Dit wijst erop dat deze rampen de grootste invloed hebben op deze sectoren. In de landbouwsector vertonen extreem weer en overstromingen de grootste impact, terwijl droogte een gematigde positieve correlatie heeft. Bij gebouwen zijn aardbevingen en extreem weer het meest invloedrijk. Over het geheel genomen benadrukken de grafieken dat extreem weer en overstromingen de grootste bedreigingen vormen voor diverse economische sectoren, wat cruciale informatie biedt voor beleidsmakers en onderzoekers bij het ontwikkelen van veerkracht strategieën.

In [None]:

fig = go.Figure()
fig.add_trace(go.Scatter(
    x=merged_all_df['Emissions'], 
    y=merged_all_df['Disasters'],
    mode='markers', 
    name='Emissions vs. Disasters',
    marker=dict(
        color=merged_all_df['Year'], 
        size=10, 
        colorscale='Viridis', 
        showscale=True
    )
))

# Update layout
fig.update_layout(
    title='Emissions vs. Disasters',
    xaxis_title='Emissions',
    yaxis_title='Disasters',
    template='plotly_white',
    annotations=[
        dict(
            xref='paper', yref='paper',
            x=0.5, y=-0.20,
            showarrow=False,
            text="Deze grafiek toont de relatie tussen jaarlijkse broeikasgasemissies en het aantal natuurrampen van 1970 tot 2022.<br> Elk punt vertegenwoordigt een jaar, waarbij de kleurgradaties de tijdsprogressie aangeven.",
            font=dict(size=12),
            xanchor='center',
            yanchor='top'
        )
    ],
    margin=dict(l=20, r=20, t=80, b=115)
)

# Show figure
fig.show()

**DRAFT**

disaster_data_filtered = disaster_data_country[(disaster_data_country['Year'] >= 1970) & (disaster_data_country['Year'] <= 2022)]

# Aggregate the number of disasters per country
disasters_per_country = disaster_data_filtered.groupby('Country')['Seq'].sum().reset_index()

# Prepare emissions data (filtering and renaming 'Entity' to 'Country')
emissions_data_filtered = emissions_data_country[(emissions_data_country['Year'] >= 1970) & (emissions_data_country['Year'] <= 2022)]
emissions_data_filtered = emissions_data_filtered.rename(columns={'Entity': 'Country'})

# Merge the datasets to include emissions information
merged_data = pd.merge(disasters_per_country, emissions_data_filtered, on='Country', how='left')

fig = px.choropleth(
    merged_data,
    locations='Country',
    locationmode='country names',
    color='Seq',  # Use the aggregated disaster count
    hover_name='Country',
    hover_data={'Annual CO₂ emissions including land-use change': True},  # Adjust column name if needed
    title='Total Disasters per Country (1970-2022)',
    projection='natural earth',
)

# Update layout to include emissions data on click
fig.update_layout(
    clickmode='event+select',
    hoverlabel=dict(bgcolor="white", font_size=16)
)

# Add callback for displaying emissions on click (if needed)
#fig.show()