# <center>Praxisprojekt - Datenvisualisierung</center>
## <center>Karin Wiedemann und Lisa Beller</center>


In [2]:
# Modulimporte
import pandas as pd
import plotly.express as px
import seaborn as sns
import matplotlib.pyplot as plt
from collections import defaultdict

## Aufgabenstellung

#### Glücklichkeit über die Welt verteilt
Gegeben ist ein Datensatz über die Glücklichkeit der Bewohner von 156 Ländern der Welt, zusammen mit weiteren vermeintlichen Einflussfaktoren in den Jahren 2018 und 2019.
- Overall rank: Rangfolge der Länder nach Glücklichkeit
- Country or region: Ländernamen
- Score: Glücklichkeitswert
- GDP per capita: BIP pro Kopf
- Social support: Stärke der Sozialleistungen
- Healthy life expectancy: Wert über die Lebenserwartung
- Freedom to make life choices: Wert über die Möglichkeit der freien Entfaltung
- Generosity: Wert über die Großzügigkeit
- Perceptions of corruption: Die Bewertung der Korruptionswahrnehmung in verschiedenen Ländern.
  
Analysiere den Datensatz und finde heraus, welchen Einfluss die einzelnen Faktoren auf die Glücklichkeit der Bewohner hat. Finde außerdem heraus, ob es einen Zusammenhang zwischen verschiedenen Faktoren gibt.

## Informationen zum World Happiness Report 2024

#### Länder
**Beschreibung:**  
156 Länder im Datensatz.

---

#### Jahre
**Beschreibung:**  
Zeitraum von 2005 bis 2023.

---

#### Glücklichkeitswert
**Beschreibung:**  
Durchschnittlicher Glücklichkeitswert eines Landes, basierend auf verschiedenen Faktoren. Teilnehmer werden dazu befragt, wie sie ihr eigenes Leben auf einer Skala von 0 bis 10 bewerten, wobei 0 das schlechteste und 10 das bestmögliche Leben repräsentiert. Zusätzlich werden weitere Faktoren untersucht, die das Glücksniveau beeinflussen können.

**Schlüsselfragen und Metriken im World Happiness Report:**

- **Cantril-Lebensleiter (Cantril Ladder)**:
    - **Frage**: „Stellen Sie sich eine Leiter vor, auf der die bestmögliche Lebensqualität, die Sie sich vorstellen können, die oberste Sprosse (10) und die schlechteste die unterste Sprosse (0) ist. Auf welcher Sprosse der Leiter würden Sie sich persönlich aktuell sehen?“
    - Diese Frage gibt den **Happiness Score**, der als zentraler Indikator im Report verwendet wird.

Zusätzlich werden folgende Faktoren verwendet, um das Glück eines Landes zu erklären:

- **BIP pro Kopf**: Maßstab für den wirtschaftlichen Wohlstand.
- **Soziale Unterstützung**: Starke soziale Netzwerke fördern das Glück.

---

#### BIP pro Kopf
**Beschreibung:**  
Wirtschaftlicher Wohlstand hat einen großen Einfluss auf das Glück. Hier wird das Bruttoinlandsprodukt (BIP) pro Kopf als Maßstab verwendet.

---

#### Soziale Unterstützung
**Beschreibung:**  
- **Frage**: „Wenn Sie in Schwierigkeiten geraten, haben Sie Familie oder Freunde, auf die Sie zählen können?“
- Dies misst das Maß an Unterstützung, das Menschen in Krisenzeiten von ihrem sozialen Umfeld erhalten.

---

#### Gesunde Lebenserwartung
**Beschreibung:**  
Die Lebenserwartung wird als Indikator für das Gesundheitsniveau und den Zugang zu Gesundheitsdiensten verwendet. Je gesünder die Bevölkerung, desto glücklicher ist sie im Allgemeinen.

---

#### Freiheit bei Lebensentscheidungen
**Beschreibung:**  
- **Frage**: „Sind Sie zufrieden mit der Freiheit, die Sie haben, um wichtige Lebensentscheidungen zu treffen?“
- Dies misst das Gefühl der persönlichen Freiheit und Autonomie.

---

#### Großzügigkeit
**Beschreibung:**  
- **Frage**: „Haben Sie im letzten Monat Geld an eine Wohltätigkeitsorganisation gespendet?“
- Dies misst die Neigung der Menschen, anderen zu helfen und an gemeinnützige Aktivitäten teilzunehmen.

---

#### Wahrnehmung von Korruption
**Beschreibung:**  
- **Frage**: „Wie korrupt halten Sie Ihre Regierung und Unternehmen in Ihrem Land?“
- Diese Frage misst das Vertrauen in die Regierung und das Geschäftsleben. Ein geringes Maß an Korruption ist stark mit höherem Glück verbunden.

---

#### Positive Emotionen
**Beschreibung:**  
Zum Beispiel wird gefragt, wie oft die Teilnehmer am Vortag Lachen oder Freude erlebt haben.

---

#### Negative Emotionen
**Beschreibung:**  
Fragen richten sich danach, wie oft Teilnehmer Gefühle von Stress, Wut oder Sorge empfunden haben.

---

#### World Happiness Report
**Datenquelle**: [World Happiness Report 2023](https://worldhappiness.report/data/)  
**Zusammenfassung**:  
Die Kernfrage des Berichts misst den subjektiven **Happiness Score** über die **Cantril-Lebensleiter**. Dieser Score wird dann mit einer Vielzahl von wirtschaftlichen, sozialen und persönlichen Faktoren korreliert, um zu erklären, warum Menschen in bestimmten Ländern glücklicher sind als in anderen. Diese Faktoren umfassen unter anderem:

- BIP pro Kopf
- Soziale Unterstützung
- Lebenserwartung
- Persönliche Freiheit
- Großzügigkeit
- Vertrauen in Institutionen (Korruptionswahrnehmung)

Die **World Happiness Report-Daten** geben also eine umfassende Darstellung darüber, wie Menschen ihr Leben empfinden und welche Rahmenbedingungen dieses Empfinden beeinflussen.


## Daten 

In [61]:
# Informationstabelle erstellen für Dashboard
infos = [
    {"name": "Länder", 
     "description": "165 Länder im Datensatz.", 
     "color": "#8A2185"},

    {"name": "Jahre", 
     "description": "Zeitraum von 2005 bis 2023.", 
     "color": "#C43BA5"},

    {"name": "Glücklichkeitswert", 
     "description": "Datengrundlage: Score 'Life Ladder', weicht vom Score 'Ladder Score' ab \n"
                    "Durchschnittlicher Glücklichkeitswert eines Landes, basierend auf verschiedenen Faktoren.\n"
                    "Teilnehmer werden dazu befragt, wie sie ihr eigenes Leben auf einer Skala von 0 bis 10 bewerten, wobei 0 das schlechteste und 10 das bestmögliche Leben repräsentiert.\n\n"
                    "Zusätzlich werden folgende Faktoren untersucht, die das Glücksniveau beeinflussen können:\n"
                    "1. **Cantril-Lebensleiter (Cantril Ladder):**\n"
                    "   - Frage: „Stellen Sie sich eine Leiter vor, auf der die bestmögliche Lebensqualität, die Sie sich vorstellen können, die oberste Sprosse (10) und die schlechteste die unterste Sprosse (0) ist.\n"
                    "   - Auf welcher Sprosse der Leiter würden Sie sich persönlich aktuell sehen?“\n"
                    "   - Diese Frage gibt den Happiness Score an, der als zentraler Indikator im Report verwendet wird.\n\n"
                    "Neben der subjektiven Lebensbewertung werden folgende Faktoren verwendet, um das Glück eines Landes zu erklären:\n"
                    "   - BIP pro Kopf\n"
                    "   - Soziale Unterstützung\n"
                    "   - Gesunde Lebenserwartung\n"
                    "   - Freiheit bei Lebensentscheidungen\n"
                    "   - Großzügigkeit\n"
                    "   - Wahrnehmung von Korruption\n", 
     "color": "#E654B7"},

    {"name": "BIP pro Kopf", 
     "description": "Wirtschaftlicher Wohlstand hat einen großen Einfluss auf das Glück. Hier wird das Bruttoinlandsprodukt (BIP) pro Kopf als Maßstab verwendet.", 
     "color": "#b59231"},

    {"name": "Soziale Unterstützung", 
     "description": "Frage: „Wenn Sie in Schwierigkeiten geraten, haben Sie Familie oder Freunde, auf die Sie zählen können?\"\n"
                    "Dies misst das Maß an Unterstützung, das Menschen in Krisenzeiten von ihrem sozialen Umfeld erhalten.", 
     "color": "#F5C400"},

    {"name": "Gesunde Lebenserwartung", 
     "description": "Die Lebenserwartung wird als Indikator für das Gesundheitsniveau und den Zugang zu Gesundheitsdiensten verwendet.\n"
                    "Je gesünder die Bevölkerung, desto glücklicher ist sie im Allgemeinen.", 
     "color": "#DA8D00"},

    {"name": "Freiheit bei Lebensentscheidungen", 
     "description": "Frage: „Sind Sie zufrieden mit der Freiheit, die Sie haben, um wichtige Lebensentscheidungen zu treffen?\"\n"
                    "Dies misst das Gefühl der persönlichen Freiheit und Autonomie.", 
     "color": "#D9598E"},

    {"name": "Großzügigkeit", 
     "description": "Frage: „Haben Sie im letzten Monat Geld an eine Wohltätigkeitsorganisation gespendet?\"\n"
                    "Dies misst die Neigung der Menschen, anderen zu helfen und an gemeinnützigen Aktivitäten teilzunehmen.", 
     "color": "#FFA849"},

    {"name": "Wahrnehmung von Korruption", 
     "description": "Frage: „Wie korrupt halten Sie Ihre Regierung und Unternehmen in Ihrem Land?\"\n"
                    "Diese Frage misst das Vertrauen in die Regierung und das Geschäftsleben.\n"
                    "Ein geringes Maß an Korruption ist stark mit höherem Glück verbunden.", 
     "color": "#c9a26b"},

    {"name": "Positive Emotionen", 
     "description": "Zum Beispiel wird gefragt, wie oft die Teilnehmer am Vortag Lachen oder Freude erlebt haben.", 
     "color": "#A8357E"},

    {"name": "Negative Emotionen", 
     "description": "Fragen richten sich danach, wie oft Teilnehmer Gefühle von Stress, Wut oder Sorge empfunden haben.", 
     "color": "#E68C2C"},

    {"name": "World Happiness Report", 
     "description": "Datenquelle: World Happiness Report 2023 (https://worldhappiness.report/data/)\n\n"
                    "Datengrundlage'Data for Table 2.1' \n"
                    "Zusammenfassung: Die Kernfrage des Berichts misst den subjektiven Happiness Score über die Cantril-Lebensleiter. \n\n"
                    "Dieser Score wird mit folgenden Faktoren korreliert:\n"
                    "   - BIP pro Kopf\n"
                    "   - Soziale Unterstützung\n"
                    "   - Lebenserwartung\n"
                    "   - Persönliche Freiheit\n"
                    "   - Großzügigkeit\n"
                    "   - Vertrauen in Institutionen (Korruptionswahrnehmung).\n", 
     "color": "#A64A2E"}
]

# DataFrame erstellen
df_categories = pd.DataFrame(infos)

# Als CSV speichern
csv_file_path = df_categories.to_csv("infobox.csv", index=False)

infobox = pd.read_csv("infobox.csv")
infobox

Unnamed: 0,name,description,color
0,Länder,165 Länder im Datensatz.,#8A2185
1,Jahre,Zeitraum von 2005 bis 2023.,#C43BA5
2,Glücklichkeitswert,"Datengrundlage: Score 'Life Ladder', weicht vo...",#E654B7
3,BIP pro Kopf,Wirtschaftlicher Wohlstand hat einen großen Ei...,#b59231
4,Soziale Unterstützung,"Frage: „Wenn Sie in Schwierigkeiten geraten, h...",#F5C400
5,Gesunde Lebenserwartung,Die Lebenserwartung wird als Indikator für das...,#DA8D00
6,Freiheit bei Lebensentscheidungen,"Frage: „Sind Sie zufrieden mit der Freiheit, d...",#D9598E
7,Großzügigkeit,Frage: „Haben Sie im letzten Monat Geld an ein...,#FFA849
8,Wahrnehmung von Korruption,Frage: „Wie korrupt halten Sie Ihre Regierung ...,#c9a26b
9,Positive Emotionen,"Zum Beispiel wird gefragt, wie oft die Teilneh...",#A8357E


In [4]:
# Daten importieren
# Datensatzquelle: World Happiness Report 2024
# 1. Datensatz: Data for Table 2.1

glueck = pd.read_csv('whr-2024.csv', sep=';', decimal=',')

# Überblick des Datensatzes
display(glueck.info())
display(glueck.describe())
display(glueck.head())

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2363 entries, 0 to 2362
Data columns (total 11 columns):
 #   Column                            Non-Null Count  Dtype  
---  ------                            --------------  -----  
 0   Country name                      2363 non-null   object 
 1   year                              2363 non-null   int64  
 2   Life Ladder                       2363 non-null   float64
 3   Log GDP per capita                2335 non-null   float64
 4   Social support                    2350 non-null   float64
 5   Healthy life expectancy at birth  2300 non-null   float64
 6   Freedom to make life choices      2327 non-null   float64
 7   Generosity                        2282 non-null   float64
 8   Perceptions of corruption         2238 non-null   float64
 9   Positive affect                   2339 non-null   float64
 10  Negative affect                   2347 non-null   float64
dtypes: float64(9), int64(1), object(1)
memory usage: 203.2+ KB


None

Unnamed: 0,year,Life Ladder,Log GDP per capita,Social support,Healthy life expectancy at birth,Freedom to make life choices,Generosity,Perceptions of corruption,Positive affect,Negative affect
count,2363.0,2363.0,2335.0,2350.0,2300.0,2327.0,2282.0,2238.0,2339.0,2347.0
mean,2014.76386,5.483566,9.399671,0.809369,63.401828,0.750282,9.8e-05,0.743971,0.651882,0.273151
std,5.059436,1.125522,1.152069,0.121212,6.842644,0.139357,0.161388,0.184865,0.10624,0.087131
min,2005.0,1.281,5.527,0.228,6.72,0.228,-0.34,0.035,0.179,0.083
25%,2011.0,4.647,8.5065,0.744,59.195,0.661,-0.112,0.687,0.572,0.209
50%,2015.0,5.449,9.503,0.8345,65.1,0.771,-0.022,0.7985,0.663,0.262
75%,2019.0,6.3235,10.3925,0.904,68.5525,0.862,0.09375,0.86775,0.737,0.326
max,2023.0,8.019,11.676,0.987,74.6,0.985,0.7,0.983,0.884,0.705


Unnamed: 0,Country name,year,Life Ladder,Log GDP per capita,Social support,Healthy life expectancy at birth,Freedom to make life choices,Generosity,Perceptions of corruption,Positive affect,Negative affect
0,Afghanistan,2008,3.724,7.35,0.451,50.5,0.718,0.164,0.882,0.414,0.258
1,Afghanistan,2009,4.402,7.509,0.552,50.8,0.679,0.187,0.85,0.481,0.237
2,Afghanistan,2010,4.758,7.614,0.539,51.1,0.6,0.118,0.707,0.517,0.275
3,Afghanistan,2011,3.832,7.581,0.521,51.4,0.496,0.16,0.731,0.48,0.267
4,Afghanistan,2012,3.783,7.661,0.521,51.7,0.531,0.234,0.776,0.614,0.268


In [5]:
# Spaltenumbenennug
glueck.columns = [
    "Land",          
    "Jahr", 
    "Glücklichkeitswert",                
    "BIP pro Kopf", 
    "Soziale Unterstützung",          
    "Gesunde Lebenserwartung",                               
    "Entscheidungsfreiheit",
    "Großzügigkeit",                                                           
    "Korruptionwahrnehmung",
    "Positiver Effekt",
    "Negativer Effekt"]          
glueck.head()

Unnamed: 0,Land,Jahr,Glücklichkeitswert,BIP pro Kopf,Soziale Unterstützung,Gesunde Lebenserwartung,Entscheidungsfreiheit,Großzügigkeit,Korruptionwahrnehmung,Positiver Effekt,Negativer Effekt
0,Afghanistan,2008,3.724,7.35,0.451,50.5,0.718,0.164,0.882,0.414,0.258
1,Afghanistan,2009,4.402,7.509,0.552,50.8,0.679,0.187,0.85,0.481,0.237
2,Afghanistan,2010,4.758,7.614,0.539,51.1,0.6,0.118,0.707,0.517,0.275
3,Afghanistan,2011,3.832,7.581,0.521,51.4,0.496,0.16,0.731,0.48,0.267
4,Afghanistan,2012,3.783,7.661,0.521,51.7,0.531,0.234,0.776,0.614,0.268


In [6]:
# Kontinente hinzufügen

region_dict = {
    # Afrika
    'Algeria': 'Nordafrika', 'Angola': 'Zentralafrika', 'Benin': 'Westafrika', 
    'Botswana': 'Südliches Afrika', 'Burkina Faso': 'Westafrika', 'Burundi': 'Ostafrika', 
    'Cameroon': 'Zentralafrika', 'Central African Republic': 'Zentralafrika', 'Chad': 'Zentralafrika', 
    'Comoros': 'Ostafrika', 'Congo (Brazzaville)': 'Zentralafrika', 'Congo (Kinshasa)': 'Zentralafrika', 
    'Djibouti': 'Ostafrika', 'Egypt': 'Nordafrika', 'Eswatini': 'Südliches Afrika', 
    'Ethiopia': 'Ostafrika', 'Gabon': 'Zentralafrika', 'Gambia': 'Westafrika', 
    'Ghana': 'Westafrika', 'Guinea': 'Westafrika', 'Ivory Coast': 'Westafrika', 
    'Kenya': 'Ostafrika', 'Lesotho': 'Südliches Afrika', 'Liberia': 'Westafrika', 
    'Libya': 'Nordafrika', 'Madagascar': 'Ostafrika', 'Malawi': 'Ostafrika', 
    'Mali': 'Westafrika', 'Mauritania': 'Nordafrika', 'Mauritius': 'Ostafrika', 
    'Morocco': 'Nordafrika', 'Mozambique': 'Ostafrika', 'Namibia': 'Südliches Afrika', 
    'Niger': 'Westafrika', 'Nigeria': 'Westafrika', 'Rwanda': 'Ostafrika', 
    'Senegal': 'Westafrika', 'Sierra Leone': 'Westafrika', 'Somalia': 'Ostafrika', 
    'Somaliland region': 'Ostafrika', 'South Africa': 'Südliches Afrika', 'South Sudan': 'Ostafrika', 
    'Sudan': 'Nordafrika', 'Tanzania': 'Ostafrika', 'Togo': 'Westafrika', 
    'Uganda': 'Ostafrika', 'Zambia': 'Ostafrika', 'Zimbabwe': 'Südliches Afrika',

    # Asien
    'Afghanistan': 'Südasien', 'Armenia': 'Zentralasien', 'Azerbaijan': 'Zentralasien', 
    'Bahrain': 'Westasien', 'Bangladesh': 'Südasien', 'Bhutan': 'Südasien', 
    'Cambodia': 'Südostasien', 'China': 'Ostasien', 'Georgia': 'Zentralasien', 
    'India': 'Südasien', 'Indonesia': 'Südostasien', 'Iran': 'Westasien', 
    'Iraq': 'Westasien', 'Israel': 'Westasien', 'Japan': 'Ostasien', 
    'Jordan': 'Westasien', 'Kazakhstan': 'Zentralasien', 'Kuwait': 'Westasien', 
    'Kyrgyzstan': 'Zentralasien', 'Laos': 'Südostasien', 'Lebanon': 'Westasien', 
    'Malaysia': 'Südostasien', 'Maldives': 'Südasien', 'Mongolia': 'Ostasien', 
    'Myanmar': 'Südostasien', 'Nepal': 'Südasien', 'Oman': 'Westasien', 
    'Pakistan': 'Südasien', 'Philippines': 'Südostasien', 'Qatar': 'Westasien', 
    'Saudi Arabia': 'Westasien', 'Singapore': 'Südostasien', 'South Korea': 'Ostasien', 
    'Sri Lanka': 'Südasien', 'State of Palestine': 'Westasien', 'Syria': 'Westasien', 
    'Taiwan Province of China': 'Ostasien', 'Tajikistan': 'Zentralasien', 'Thailand': 'Südostasien', 
    'Turkiye': 'Westasien', 'Uzbekistan': 'Zentralasien', 'Vietnam': 'Südostasien', 
    'Yemen': 'Westasien',

    # Europa
    'Albania': 'Südeuropa', 'Austria': 'Westeuropa', 'Belarus': 'Osteuropa', 
    'Belgium': 'Westeuropa', 'Bosnia and Herzegovina': 'Südeuropa', 'Bulgaria': 'Osteuropa', 
    'Croatia': 'Südeuropa', 'Cyprus': 'Südeuropa', 'Czechia': 'Osteuropa', 
    'Denmark': 'Nordeuropa', 'Estonia': 'Nordeuropa', 'Finland': 'Nordeuropa', 
    'France': 'Westeuropa', 'Germany': 'Westeuropa', 'Greece': 'Südeuropa', 
    'Hungary': 'Osteuropa', 'Iceland': 'Nordeuropa', 'Ireland': 'Nordeuropa', 
    'Italy': 'Südeuropa', 'Kosovo': 'Südeuropa', 'Latvia': 'Nordeuropa', 
    'Lithuania': 'Nordeuropa', 'Luxembourg': 'Westeuropa', 'Malta': 'Südeuropa', 
    'Moldova': 'Osteuropa', 'Montenegro': 'Südeuropa', 'Netherlands': 'Westeuropa', 
    'North Macedonia': 'Südeuropa', 'Norway': 'Nordeuropa', 'Poland': 'Osteuropa', 
    'Portugal': 'Südeuropa', 'Romania': 'Osteuropa', 'Russia': 'Osteuropa', 
    'Serbia': 'Südeuropa', 'Slovakia': 'Osteuropa', 'Slovenia': 'Südeuropa', 
    'Spain': 'Südeuropa', 'Sweden': 'Nordeuropa', 'Switzerland': 'Westeuropa', 
    'Ukraine': 'Osteuropa', 'United Kingdom': 'Nordeuropa',

    # Amerika
    'Argentina': 'Südamerika', 'Belize': 'Mittelamerika', 'Bolivia': 'Südamerika', 
    'Brazil': 'Südamerika', 'Canada': 'Nordamerika', 'Chile': 'Südamerika', 
    'Colombia': 'Südamerika', 'Costa Rica': 'Mittelamerika', 'Cuba': 'Mittelamerika', 
    'Dominican Republic': 'Mittelamerika', 'Ecuador': 'Südamerika', 'El Salvador': 'Mittelamerika', 
    'Guatemala': 'Mittelamerika', 'Guyana': 'Südamerika', 'Haiti': 'Mittelamerika', 
    'Honduras': 'Mittelamerika', 'Jamaica': 'Mittelamerika', 'Mexico': 'Mittelamerika', 
    'Nicaragua': 'Mittelamerika', 'Panama': 'Mittelamerika', 'Paraguay': 'Südamerika', 
    'Peru': 'Südamerika', 'Suriname': 'Südamerika', 'Trinidad and Tobago': 'Mittelamerika', 
    'United States': 'Nordamerika', 'Uruguay': 'Südamerika', 'Venezuela': 'Südamerika',

    # Ozeanien
    'Australia': 'Ozeanien', 'New Zealand': 'Ozeanien', 'Papua New Guinea': 'Ozeanien'
}

glueck["Region"] = glueck["Land"].map(region_dict)

# Ein neues Dictionary erstellen, um die Kontinente und ihre Länder zu speichern
continent_dict = defaultdict(list)

# Regionen grob nach Kontinenten gruppieren
region_to_continent = {
    'Nordafrika': 'Afrika', 'Zentralafrika': 'Afrika', 'Westafrika': 'Afrika', 'Ostafrika': 'Afrika', 'Südliches Afrika': 'Afrika',
    'Südasien': 'Asien', 'Zentralasien': 'Asien', 'Westasien': 'Asien', 'Südostasien': 'Asien', 'Ostasien': 'Asien',
    'Südeuropa': 'Europa', 'Westeuropa': 'Europa', 'Osteuropa': 'Europa', 'Nordeuropa': 'Europa',
    'Nordamerika': 'Amerika', 'Mittelamerika': 'Amerika', 'Südamerika': 'Amerika',
    'Ozeanien': 'Ozeanien'
}

# Durch das ursprüngliche region_dict iterieren und den Ländern Kontinente zuweisen
for land, region in region_dict.items():
    kontinent = region_to_continent.get(region)
    if kontinent:
        continent_dict[kontinent].append(land)

# Ausgabe der Länder nach Kontinent
for kontinent, laender in continent_dict.items():
    print(f"{kontinent}: {laender}")

# Als neue CSV abspeichern
glueck.to_csv('whr_2024_update.csv', sep=';', decimal=',')
glueck.head()

Afrika: ['Algeria', 'Angola', 'Benin', 'Botswana', 'Burkina Faso', 'Burundi', 'Cameroon', 'Central African Republic', 'Chad', 'Comoros', 'Congo (Brazzaville)', 'Congo (Kinshasa)', 'Djibouti', 'Egypt', 'Eswatini', 'Ethiopia', 'Gabon', 'Gambia', 'Ghana', 'Guinea', 'Ivory Coast', 'Kenya', 'Lesotho', 'Liberia', 'Libya', 'Madagascar', 'Malawi', 'Mali', 'Mauritania', 'Mauritius', 'Morocco', 'Mozambique', 'Namibia', 'Niger', 'Nigeria', 'Rwanda', 'Senegal', 'Sierra Leone', 'Somalia', 'Somaliland region', 'South Africa', 'South Sudan', 'Sudan', 'Tanzania', 'Togo', 'Uganda', 'Zambia', 'Zimbabwe']
Asien: ['Afghanistan', 'Armenia', 'Azerbaijan', 'Bahrain', 'Bangladesh', 'Bhutan', 'Cambodia', 'China', 'Georgia', 'India', 'Indonesia', 'Iran', 'Iraq', 'Israel', 'Japan', 'Jordan', 'Kazakhstan', 'Kuwait', 'Kyrgyzstan', 'Laos', 'Lebanon', 'Malaysia', 'Maldives', 'Mongolia', 'Myanmar', 'Nepal', 'Oman', 'Pakistan', 'Philippines', 'Qatar', 'Saudi Arabia', 'Singapore', 'South Korea', 'Sri Lanka', 'State of 

Unnamed: 0,Land,Jahr,Glücklichkeitswert,BIP pro Kopf,Soziale Unterstützung,Gesunde Lebenserwartung,Entscheidungsfreiheit,Großzügigkeit,Korruptionwahrnehmung,Positiver Effekt,Negativer Effekt,Region
0,Afghanistan,2008,3.724,7.35,0.451,50.5,0.718,0.164,0.882,0.414,0.258,Südasien
1,Afghanistan,2009,4.402,7.509,0.552,50.8,0.679,0.187,0.85,0.481,0.237,Südasien
2,Afghanistan,2010,4.758,7.614,0.539,51.1,0.6,0.118,0.707,0.517,0.275,Südasien
3,Afghanistan,2011,3.832,7.581,0.521,51.4,0.496,0.16,0.731,0.48,0.267,Südasien
4,Afghanistan,2012,3.783,7.661,0.521,51.7,0.531,0.234,0.776,0.614,0.268,Südasien


In [47]:
# 2. Datensatz im Vergleich
# Data for Figure 2.1 (aufbereitete Daten, Ladder Score weicht von Life Ladder ab)
glueck_figure_2023 = pd.read_csv("DataForFigure2.1+with+sub+bars+2024.csv",
                            sep=';', decimal=',')
glueck_figure_2023


Unnamed: 0,Country name,Ladder score,upperwhisker,lowerwhisker,Explained by: Log GDP per capita,Explained by: Social support,Explained by: Healthy life expectancy,Explained by: Freedom to make life choices,Explained by: Generosity,Explained by: Perceptions of corruption,Dystopia + residual
0,Finland,7.741,7.815,7.667,1.844,1.572,0.695,0.859,0.142,0.546,2.082
1,Denmark,7.583,7.665,7.500,1.908,1.520,0.699,0.823,0.204,0.548,1.881
2,Iceland,7.525,7.618,7.433,1.881,1.617,0.718,0.819,0.258,0.182,2.050
3,Sweden,7.344,7.422,7.267,1.878,1.501,0.724,0.838,0.221,0.524,1.658
4,Israel,7.341,7.405,7.277,1.803,1.513,0.740,0.641,0.153,0.193,2.298
...,...,...,...,...,...,...,...,...,...,...,...
138,Congo (Kinshasa),3.295,3.462,3.128,0.534,0.665,0.262,0.473,0.189,0.072,1.102
139,Sierra Leone,3.245,3.366,3.124,0.654,0.566,0.253,0.469,0.181,0.053,1.068
140,Lesotho,3.186,3.469,2.904,0.771,0.851,0.000,0.523,0.082,0.085,0.875
141,Lebanon,2.707,2.797,2.616,1.377,0.577,0.556,0.173,0.068,0.029,-0.073


In [58]:
# Gestapeltes Säulendiagramm aus alternativem Datensatz
def create_ladder_score_bar_chart(glueck_figure_2023):
    # Sortieren nach "Ladder score" und Top 10 Länder auswählen
    top_10_ladder = glueck_figure_2023.sort_values("Ladder score", ascending=True).head(10)

    # Erstellen eines horizontalen gestapelten Säulendiagramms für die Top 10 Länder
    fig = px.bar(
        top_10_ladder, 
        y='Country name',  # 'y' wird zu 'Country name' für horizontale Ausrichtung
        x=[
            'Explained by: Log GDP per capita', 
            'Explained by: Social support', 
            'Explained by: Healthy life expectancy',
            'Explained by: Freedom to make life choices', 
            'Explained by: Generosity', 
            'Explained by: Perceptions of corruption',
            'Dystopia + residual'
        ], 
        title="Top 10 Länder nach Ladder Score 2023 mit erklärenden Faktoren",
        labels={"value": "Erklärung des Ladder Scores", "variable": "Erklärende Faktoren"},
        text_auto=True,
        barmode='stack',
        color_discrete_sequence=px.colors.sequential.Plasma  
    )

    # Layout des Diagramms
    fig.update_layout(
        template="plotly_white",
        yaxis_title="Land", 
        xaxis_title="Ladder Score - Erklärende Faktoren",
        title_x=0.5,  
        title_font=dict(size=20, family="Helvetica", color="black"),
        xaxis_title_font=dict(color="dimgray"),
        yaxis_title_font=dict(color="dimgray"),
        legend_title="Erklärende Faktoren",
        width=1200, 
        height=600
    )

    # Die deutschen Bezeichnungen für die erklärenden Faktoren
    fig.for_each_trace(lambda t: t.update(name=t.name.replace(
        'Explained by: Log GDP per capita', 'Logarithmus des BIP pro Kopf').replace(
        'Explained by: Social support', 'Soziale Unterstützung').replace(
        'Explained by: Healthy life expectancy', 'Gesunde Lebenserwartung').replace(
        'Explained by: Freedom to make life choices', 'Freiheit, Lebensentscheidungen zu treffen').replace(
        'Explained by: Generosity', 'Großzügigkeit').replace(
        'Explained by: Perceptions of corruption', 'Wahrnehmung von Korruption').replace(
        'Dystopia + residual', 'Negative und Positive Wahrnehmung')
    ))

    # Anzeigen des Diagramms
    return fig

# Funktion aufrufen
create_ladder_score_bar_chart(glueck_figure_2023)


## Diagramme

In [7]:
# Liniendiagramm für Glücklichkeitswert über die Jahre (mit Karte verknüpft)
def create_lineplot(glueck, land):
    glueck_auswahl_land = glueck[glueck["Land"]== land]
    fig = px.line(glueck_auswahl_land, x="Jahr", 
              y="Glücklichkeitswert", 
              color="Land", 
              title=f"Glücklichkeitswert in '{land}' über die Jahre {min(glueck['Jahr'])} bis {max(glueck['Jahr'])}")

    fig.update_layout(
            xaxis_title="Jahr", 
            yaxis_title="Glücklichkeitswert",
            title_x=0.5,  
            title_font=dict(size=20, family="Helvetica", color="black"),
            xaxis_title_font=dict(color='dimgray'),  
            yaxis_title_font=dict(color='dimgray'),
            width=1000, 
            height=600,
            xaxis=dict(
        range=[2005, 2024],
        tickvals=[i for i in range(2005, 2024)],
        tickangle=45)
    )

    return fig.show()

create_lineplot(glueck,"Finland")

In [8]:
# Streudiagramm der Abhängigkeit von Entscheidungsfreiheit und Positiver Effekt
def scatter_freedom_positivity():
    fig = px.scatter(glueck, 
                x="Entscheidungsfreiheit", 
                y="Positiver Effekt",
                trendline="ols",
                trendline_color_override="red",
                hover_data={'Land': True, 'Jahr': True})

    fig.update_layout(
            title="Abhängigkeit von Entscheidungsfreiheit und Positiver Effekt",
            template="plotly_white",
            xaxis_title="Entscheidungsfreiheit", 
            yaxis_title="Positiver Effekt",
            title_x=0.5,  
            title_font=dict(size=20, family="Helvetica", color="black"),
            xaxis_title_font=dict(color="dimgray"),
            yaxis_title_font=dict(color="dimgray"),
            width=900, 
            height=600)

    return fig

In [9]:
# Korrelationskoeffizienten zwischen Entscheidungsfreiheit und Positiver Effekt
def calculate_correlation_2(glueck):
    corr_coefficient = glueck['Entscheidungsfreiheit'].corr(glueck['Positiver Effekt'])
    return print(f"Der Korrelationskoeffizient zwischen Entscheidungsfreiheit und Positiver Effekt ist: {corr_coefficient:.2f}")

calculate_correlation_2(glueck)

Der Korrelationskoeffizient zwischen Entscheidungsfreiheit und Positiver Effekt ist: 0.58


In [10]:
# Punktediagramm für Abhängigkeit von BIP pro Kopf zu Glücklichkeitswert
# ausreißer?
def scatter_bip_glueck(glueck):
    fig = px.scatter(glueck, 
                x="BIP pro Kopf", 
                y="Glücklichkeitswert",
                trendline="ols",
                trendline_color_override="red",
                hover_data={'Land': True, 'Jahr': True})

    fig.update_layout(
            title="Abhängigkeit von BIP pro Kopf zum Glücklichkeitswert",
            template="plotly_white",
            xaxis_title="BIP pro Kopf", 
            yaxis_title="Glücklichkeitswert",
            title_x=0.5,  
            title_font=dict(size=20, family="Helvetica", color="black"),
            xaxis_title_font=dict(color="dimgray"),
            yaxis_title_font=dict(color="dimgray"),
            width=900, 
            height=600)

    return fig

scatter_bip_glueck(glueck)

In [11]:
# Korrelationskoeffizienten zwischen BIP pro Kopf und Glücklichkeitswert
def calculate_correlation(glueck):
    corr_coefficient = glueck['BIP pro Kopf'].corr(glueck['Glücklichkeitswert'])
    return print(f"Der Korrelationskoeffizient zwischen BIP pro Kopf und Glücklichkeitswert ist: {corr_coefficient:.2f}")

##### Ausreißer Libanon
- BIP pro Kopf im Libanon erscheint relativ hoch 
- dort sind allerdings die strukturellen Probleme, die wirtschaftliche Instabilität, die politische Korruption und die schweren Krisen (Explosion von 2020, Pandemie) dafür verantwortlich, dass der Glücklichkeitswert der Bevölkerung sehr niedrig ist
- Das BIP pro Kopf allein spiegelt nicht die tatsächliche Lebensqualität wider, insbesondere in einem Land, das von mehreren tiefgreifenden Krisen betroffen ist.

In [12]:
# Säulendiagramm der Top 5 Länder in 2023
def top_5_2023(glueck):
    glueck = pd.read_csv("whr_2024_update.csv",
                        sep=';', decimal=',')
    glueck_top_5 = glueck[glueck["Jahr"]== 2023].sort_values("Glücklichkeitswert", ascending=False).head(5)
    fig = px.bar(glueck_top_5, 
             x='Land', 
             y='Glücklichkeitswert', 
             color='Region',
             color_discrete_sequence=px.colors.sequential.Plasma[::4])
    fig.update_layout(
    title="Glücklichkeitswert der Top 5 Länder in 2023",
    template="plotly_white",
    xaxis_title="Land", 
    yaxis_title="Glücklichkeitswert",
    title_x=0.5,  
    title_font=dict(size=20, family="Helvetica", color="black"),
    xaxis_title_font=dict(color="dimgray"),
    yaxis_title_font=dict(color="dimgray"),
    width=900, 
    height=600)

    return fig

top_5_2023(glueck)

In [42]:
# Säulendiagramm der Top 10 BIP-Länder in 2023 (ohne Ignorieren von 0-Werten)
def top_10_2023_bip(glueck):
    # Null- und NaN-Werte im BIP pro Kopf ignorieren, aber 0-Werte behalten
    glueck_filtered = glueck[glueck["Jahr"] == 2023].dropna(subset=["BIP pro Kopf"])
    
    # Top 10 Länder basierend auf BIP pro Kopf (einschließlich 0-Werten)
    glueck_top_10 = glueck_filtered.sort_values("BIP pro Kopf", ascending=False).head(10)
    
    # Erstellen des Säulendiagramms
    fig = px.bar(glueck_top_10, 
                 x='Land', 
                 y='BIP pro Kopf', 
                 color='BIP pro Kopf',
                 color_discrete_sequence=px.colors.sequential.Plasma,
                 text='BIP pro Kopf')

    # Layout des Diagramms
    fig.update_layout(
            title="BIP pro Kopf der Top 10 Länder in 2023",
            template="plotly_white",
            xaxis_title="Land", 
            yaxis_title="BIP pro Kopf",
            title_x=0.5,  
            title_font=dict(size=20, family="Helvetica", color="black"),
            xaxis_title_font=dict(color="dimgray"),
            yaxis_title_font=dict(color="dimgray"),
            width=900, 
            height=600)
    
    # Position des Textes (außerhalb der Balken)
    fig.update_traces(textposition='outside')

    return fig

# Funktion aufrufen
top_10_2023_bip(glueck)


In [14]:
# NaN Wert in der Spalte BIP in Afghanistan mit dem BIP Wert aus 2021 ersetzt
glueck_bottom_5 = glueck[glueck["Jahr"]== 2023].sort_values("Glücklichkeitswert", ascending=False).tail()
glueck_bottom_5.loc[14,"BIP pro Kopf"] = 7.325

In [15]:
# Säulendiagramm der Top 5 und der Bottom 5 Länder in 2023
def top_and_bottom_5_2023(glueck):
    glueck_top_5 = glueck[glueck["Jahr"]== 2023].sort_values("Glücklichkeitswert", ascending=False).head()
    glueck_bottom_5 = glueck[glueck["Jahr"]== 2023].sort_values("Glücklichkeitswert", ascending=False).tail()
    top_bottom_2023 = pd.concat([glueck_top_5, glueck_bottom_5], ignore_index=True)


    fig = px.bar(top_bottom_2023, 
             x='Land', 
             y='Glücklichkeitswert', 
             color='Glücklichkeitswert',
             color_discrete_sequence=px.colors.sequential.Plasma,
             text='Glücklichkeitswert')

    fig.update_layout(
            title="Glücklichkeitswert der Top 5 und der Bottom 5 Länder in 2023",
        template="plotly_white",
            xaxis_title="Land", 
            yaxis_title="Glücklichkeitswert",
            title_x=0.5,  
            title_font=dict(size=20, family="Helvetica", color="black"),
            xaxis_title_font=dict(color="dimgray"),
            yaxis_title_font=dict(color="dimgray"),
            width=900, 
            height=600)
    fig.update_traces(textposition='outside')

    return fig

top_and_bottom_5_2023(glueck)

In [27]:
# Säulendiagramm der Top 5 BIP und der Bottom 5 Länder in 2023
def top_and_bottom_5_2023_bip(glueck):
    # Null- und NaN-Werte im BIP pro Kopf ignorieren
    glueck_filtered = glueck[glueck["Jahr"] == 2023].dropna(subset=["BIP pro Kopf"])
    display(glueck_filtered.tail())
    # Top 5 Länder
    glueck_top_5 = glueck_filtered.sort_values("BIP pro Kopf", ascending=False).head()
    
    # Bottom 5 Länder
    glueck_bottom_5 = glueck_filtered.sort_values("BIP pro Kopf", ascending=False).tail()
    
    # Top 5 und Bottom 5 kombinieren
    top_bottom_2023 = pd.concat([glueck_top_5, glueck_bottom_5], ignore_index=True)

    # Erstellen des Säulendiagramms
    fig = px.bar(top_bottom_2023, 
                 x='Land', 
                 y='BIP pro Kopf', 
                 color='Land',
                 color_discrete_sequence=px.colors.sequential.Plasma,
                 text='BIP pro Kopf')

    fig.update_layout(
            title="BIP pro Kopf der Top 5 und der Bottom 5 Länder in 2023 (ohne NaN Werte)",
            template="plotly_white",
            xaxis_title="Land", 
            yaxis_title="BIP pro Kopf",
            title_x=0.5,  
            title_font=dict(size=20, family="Helvetica", color="black"),
            xaxis_title_font=dict(color="dimgray"),
            yaxis_title_font=dict(color="dimgray"),
            width=900, 
            height=600)
    
    fig.update_traces(textposition='outside')

    return fig

# Funktion aufrufen
top_and_bottom_5_2023_bip(glueck)


Unnamed: 0,Land,Jahr,Glücklichkeitswert,BIP pro Kopf,Soziale Unterstützung,Gesunde Lebenserwartung,Entscheidungsfreiheit,Großzügigkeit,Korruptionwahrnehmung,Positiver Effekt,Negativer Effekt,Region
2260,Uruguay,2023,6.662,10.122,0.908,67.5,0.904,-0.05,0.662,0.753,0.265,Südamerika
2277,Uzbekistan,2023,6.385,9.026,0.909,65.9,0.927,0.247,0.65,0.752,0.202,Zentralasien
2313,Vietnam,2023,6.325,9.392,0.845,65.7,0.956,-0.159,0.655,0.71,0.12,Südostasien
2344,Zambia,2023,3.686,8.115,0.664,56.1,0.854,0.092,0.814,0.653,0.359,Ostafrika
2362,Zimbabwe,2023,3.572,7.679,0.694,55.0,0.735,-0.069,0.757,0.61,0.179,Südliches Afrika


In [16]:
def karte_glueck_wert(glueck):
    glueck_2023 = glueck[glueck["Jahr"]== 2023] 
    fig = px.choropleth(glueck_2023, 
                        locations='Land', 
                        locationmode='country names', 
                        color='Glücklichkeitswert', 
                        hover_name='Land',
                        color_continuous_scale=px.colors.sequential.Plasma,  
                        labels={'Glücklichkeitswert': 'Glücklichkeitswert (Skala)'})
    
    fig.update_layout(
        title_text='Glücklichkeitswert nach Ländern', 
        title_x=0.5,  
        title_font=dict(size=20, family="Helvetica", color="black"),
                  xaxis_title_font=dict(color='dimgray'),  
                  yaxis_title_font=dict(color='dimgray'),
        geo=dict(
            showframe=False,                    # Keine Rahmengrenzen anzeigen
            showcoastlines=False,               # Keine Küstenlinien anzeigen
            projection_type='equirectangular'   # Projektionstyp der Karte
        ),
        width=1200,  
        height=600,  
        #margin={"r":0,"t":40,"l":0,"b":0},
        ) 
    
    # Farbskala (Colorbar) anpassen
    fig.update_coloraxes(
        colorbar=dict(
            thickness=20,           # Dicke der Farbskala 
            len=0.5,                # Länge der Farbskala 
            tickfont=dict(size=10)  # Schriftgröße der Farbskala
        ))
    
    return fig

karte_glueck_wert(glueck)