# Word Hapinness Visualisation
---
Program edukacyjny, którego celem jest wizualizacja poziomu szczęścia obywateli na całym świecie, a także oceny jakie czynniki najbardziej wpływają na zadowolenie obywateli. Dane wykorzystane w pracy pochodzą ze oficalnej strony Kaggle: https://www.kaggle.com/unsdsn/world-happiness#. 

W pracy wykorzystano następujące bibloteki:
<ul>
    <li>pandas</li>
    <li>pycountry_convert</li>
    <li>Plotly</li>
    <li>Seaborn</li>
</ul>

In [1]:
import pandas

## Opis danych
---
<ul>
    <li> <i>Overall rank</i> - ranking państwa</li>
    <li> <i>Country or region</i> - państwo bądź region</li>
    <li> <i>Score</i> - ocena od 0 do 10 na podstawie bezpośredniego pytania: Jak ocenia Pan/Pani swoje szczęście od 0 do 10 </li>
    <li> <i> GDP per capita</i> - produkt krajowy brutto na mieszkańca</li>
    <li> <i> Social support </i> - poziom opiek socjalnej</li>
    <li> <i> Healthy life expectancy</i> - średnia długość życia </li>
    <li> <i> Freedom to make life choice </i> - wolność wyboru </li>
    <li> <i> Generosity</i> - poziom zamożności </li>
    <li> <i> Perceptions of corruption </i> - poziom korupcji </li>
    

In [2]:
df = pd.read_csv('2019.csv')
df.set_index('Overall rank', inplace=True)

df.head()

NameError: name 'pd' is not defined

## Dodanie kontynentów
---
Wykorzystując biblioteke <i>pycountry_convert</i> do każdego kraju przypisano kontynent na którym on się znajduje. Następnie obliczono średnie wskaźników (<i>Score, GDP per capita,Social support, Healthy life expectancy, Freedom to make life choices, Generosity, Perceptions of corruption</i>) dla każdego kontynentu. Dane te posłużą do wizualizacji. 


In [None]:
def decode_name(name):
    if name == 'AF':
        return 'Africa'
    if name == 'AS':
        return 'Asia'
    if name == 'EU':
        return 'Europe'
    if name == 'NA':
        return 'North America'
    if name == 'OC':
        return 'Oceania'
    if name == 'SA':
        return 'South America'

In [None]:
import pycountry_convert as pc

continent_list = []
continent_name = ''
for index, row in df.iterrows():
    try:
        country_code = pc.country_name_to_country_alpha2(row['Country or region'], cn_name_format="default")
        continent_name = pc.country_alpha2_to_continent_code(country_code)
        continent_name = decode_name(continent_name)
        continent_list.append(continent_name)
    except:
        if row['Country or region'] == 'Trinidad & Tobago':
            continent_name = 'SA'
        if row['Country or region'] == 'Congo (Brazzaville)':
            continent_name = 'AF'
        if row['Country or region'] == 'Congo (Brazzaville)':
            continent_name = 'AF'
        if row['Country or region'] == 'Palestinian Territories':
            continent_name = 'AS'
        
        continent_name = decode_name(continent_name)
        continent_list.append(continent_name)

df.insert(1, "Continent", continent_list, True)
continent_df = df.groupby(['Continent']).mean()

continent_df

## Wizualizacja
---
Wykonano wykres słupkowy ilustrujący średnią wartość zadowolenia mieszkańca dla każdego kontynentu. Najwięszke zadowolenie jest w Oceanii, zaś najmniejsza w Afryce

In [None]:
continent_df2 = continent_df.reset_index()
graph = continent_df2.plot.barh(x='Continent', y='Score')
graph


## Stworzenie mapy
---
Wykorzystująć bibliotekę <i>Plotly</i> wykonano mapę wizualizującą poziom szcześcia w poszczególnych krajach

In [None]:
import plotly as pl
import plotly.graph_objs as gobj

In [None]:
data = dict(type = 'choropleth',
            locations = df['Country or region'],
            locationmode = 'country names',
            autocolorscale = False,
            colorscale = 'Portland',
            text= df['Country or region'],
            z=df['Score'],
            marker = dict(line = dict(color = 'rgb(255,255,255)',width = 1)),
            colorbar = {'title':'Colour Range','len':1,'lenmode':'fraction'})

layout = dict(geo = dict(scope='world'))
worldmap = gobj.Figure(data = [data],layout = layout)
worldmap

## Wykresy korelacji
---
 
W celu wizualizacji wpływu poszczególnych czynników na poziom szcześcia obywateli wykonano tablicę korelacji przy użyciu bibloteki <i>seaborn </i>


In [None]:
import seaborn as sn
import matplotlib.pyplot as plt

In [None]:
df.corr()

In [None]:
sn.heatmap(df.corr(), annot=True)
plt.show()