In [None]:
!pip install bubbly

In [None]:
import numpy as np
import pandas as pd

# for visualizations
import matplotlib.pyplot as plt
import seaborn as sns

plt.style.use('fivethirtyeight')

# for interactive visualizations
import plotly.offline as py
from plotly.offline import init_notebook_mode, iplot
import plotly.graph_objs as go

init_notebook_mode(connected=True)
from bubbly.bubbly import bubbleplot

In [None]:
data_2015 = pd.read_csv('../input/world-happiness/2015.csv')
data_2016 = pd.read_csv('../input/world-happiness/2016.csv')
data_2017 = pd.read_csv('../input/world-happiness/2017.csv')
data_2016.head()

In [None]:
# happiness score vs continents

plt.rcParams['figure.figsize'] = (15, 12)
sns.violinplot(data_2016['Happiness Score'], data_2016['Region'])
plt.show()


Корреляция между данными
--

In [None]:
plt.rcParams['figure.figsize'] = (20, 15)
sns.heatmap(data_2017.corr(), cmap='copper', annot=True)

plt.show()

На приведенной выше тепловой карте мы видим, что показатель счастья очень сильно коррелирует с экономикой,
здоровьем, удовлетворенностью семьи и в некоторой степени также связан со свободой,
но в среднем имеет очень низкую связь с доверием к правительству.

Корреляция для западной европы

In [None]:
plt.rcParams['figure.figsize'] = (20, 15)

d = data_2016.loc[lambda data_2016: data_2016['Region'] == 'Western Europe']
sns.heatmap(d.corr(), cmap='Wistia', annot=True)

plt.show()

Тепловая карта, особенно для Европы, может добавить еще одну вещь, помимо удовлетворенности семьи,
свободы, экономики и щедрости. Она также тесно связана с доверием к правительству.
Европейский регион пока что является самым счастливым регионом.

Корреляция для Восточной Азии

In [None]:
plt.rcParams['figure.figsize'] = (20, 15)

d = data_2016.loc[lambda data_2016: data_2016['Region'] == 'Eastern Asia']
sns.heatmap(d.corr(), cmap='Greys', annot=True)

plt.show()

Здесь ситуация ухудшается, поскольку корреляция отрицательна для многих важных факторов,
таких как экономика, здоровье, доверие к правительству. Это делает ситуацию критической.
Имеется положительные корреляции только со свободой, щедростью и семейным удовлетворением

Корреляция для Северной Америки

In [None]:
plt.rcParams['figure.figsize'] = (20, 15)

d = data_2016.loc[lambda data_2016: data_2016['Region'] == 'North America']
sns.heatmap(d.corr(), cmap='pink', annot=True)

plt.show()

Все тесно связано со счастьем в Америке. Среди множества стран мира. Америка, будучи очень большой страной,
все еще может сделать своих людей счастливыми. Америка занимает 10-е место в мировом рейтинге счастья.

Корреляция для Ближнего Востока и Северной Африки

In [None]:
plt.rcParams['figure.figsize'] = (20, 15)
d = data_2016.loc[lambda data_2016: data_2016['Region'] == 'Middle East and Northern Africa']
sns.heatmap(d.corr(), cmap='rainbow', annot=True)
plt.show()

Корреляции довольно хорошие, почти все важные факторы тесно связаны со счастьем.
Удовлетворенность семьи - самый важный фактор, так как это самый важный фактор счастья в этом регионе.

Корреляция для Южной Африки

In [None]:
plt.rcParams['figure.figsize'] = (20, 15)

d = data_2016.loc[lambda data_2016: data_2016['Region'] == 'Sub-Saharan Africa']
sns.heatmap(d.corr(), cmap='Blues', annot=True)

plt.show()

Ситуация очень плохая для региона к югу от Сахары, поскольку это самый несчастный регион в мире.
Корреляция с оценкой счастья очень низкая для таких характеристик, как щедрость, удовлетворенность семьей,
свобода и т.д. Почти все характеристики имеют корреляцию менее 0.5, что очень плохо.

Bubble charts
--

In [None]:
figure = bubbleplot(dataset=data_2015, x_column='Happiness Score', y_column='Generosity',
                    bubble_column='Country', size_column='Economy (GDP per Capita)', color_column='Region',
                    x_title="Happiness Score", y_title="Generosity", title='Happiness vs Generosity vs Economy',
                    x_logscale=False, scale_bubble=1, height=650)

py.iplot(figure, config={'scrollzoom': True})

In [None]:
figure = bubbleplot(dataset=data_2015, x_column='Happiness Score',
                    y_column='Trust (Government Corruption)',
                    bubble_column='Country', size_column='Economy (GDP per Capita)', color_column='Region',
                    x_title="Happiness Score", y_title="Trust", title='Happiness vs Trust vs Economy',
                    x_logscale=False, scale_bubble=1, height=650)

py.iplot(figure, config={'scrollzoom': True})

In [None]:
figure = bubbleplot(dataset=data_2016, x_column='Happiness Score', y_column='Health (Life Expectancy)',
                    bubble_column='Country', size_column='Economy (GDP per Capita)', color_column='Region',
                    x_title="Happiness Score", y_title="Health", title='Happiness vs Health vs Economy',
                    x_logscale=False, scale_bubble=1, height=650)

py.iplot(figure, config={'scrollzoom': True})

In [None]:
figure = bubbleplot(dataset = data_2015, x_column = 'Happiness Score', y_column = 'Family',
    bubble_column = 'Country', size_column = 'Economy (GDP per Capita)', color_column = 'Region',
    x_title = "Happiness Score", y_title = "Family", title = 'Happiness vs Family vs Economy',
    x_logscale = False, scale_bubble = 1, height = 650)

py.iplot(figure, config={'scrollzoom': True})

* Совершенно очевидно, что по мере увеличения рейтинга удовлетворенности семьи показатель счастья
увеличивается. Итак, можно сказать, что между ними есть прямая связь.
* Кроме того, европейские страны и Австралия - самые счастливые регионы. После Америки.
* В Американском регионе нет ни одной страны с низким индексом счастья.
* Страны Азии и Африки страдают от серьезных проблем, поэтому ни одна из азиатских или
африканских стран не занимает хороших позиций по индексу счастья.
* Некоторые страны Ближнего Востока счастливы, а некоторые - недовольны.

In [None]:
import plotly.figure_factory as ff

data = (
  {"label": "Happiness", "sublabel":"score",
   "range": [5, 6, 8], "performance": [5.5, 6.5], "point": [7]},
  {"label": "Economy", "sublabel": "score", "range": [0, 1, 2],
   "performance": [1, 1.5], "sublabel":"score","point": [1.5]},
  {"label": "Family","sublabel":"score", "range": [0, 1, 2],
   "performance": [1, 1.5],"sublabel":"score", "point": [1.3]},
  {"label": "Freedom","sublabel":"score", "range": [0, 0.3, 0.6],
   "performance": [0.3, 0.4],"sublabel":"score", "point": [0.5]},
  {"label": "Trust", "sublabel":"score","range": [0, 0.2, 0.5],
   "performance": [0.3, 0.4], "point": [0.4]}
)



fig = ff.create_bullet(
    data, titles='label', subtitles='sublabel', markers='point',
    measures='performance', ranges='range', orientation='v',
)
py.iplot(fig, filename='bullet chart from dict')

* Если значения для данных атрибутов лежат в темно-синей области, значит, это критическая область.
* Если значения для данных атрибутов лежат в голубой области, значит, он в хорошем состоянии.
* Если значения для данных атрибутов лежат выше или рядом с ромбом, то это лучшее состояние.
* Белые области изображают максимумы, которых можно было бы достичь.

In [None]:
d2015 = data_2015['Region'].value_counts()

label_d2015 = d2015.index
size_d2015 = d2015.values


colors = ['aqua', 'gold', 'yellow', 'crimson', 'magenta']

trace = go.Pie(
         labels = label_d2015, values = size_d2015, marker = dict(colors = colors), name = '2015', hole = 0.3)

data = [trace]

layout1 = go.Layout(
           title = 'Regions')

fig = go.Figure(data = data, layout = layout1)
py.iplot(fig)

* Есть только две страны из регионов
Северной Америки (США и Канада) и Австралии (Австралия и Новая Зеландия).
* Наибольшее количество стран находится в регионах к югу от Сахары,
а также в Центральной и Восточной Европе с 40 и 29 странами соответственно.


In [None]:
trace1 = [go.Choropleth(
               colorscale = 'Earth',
               locationmode = 'country names',
               locations = data_2017['Country'],
               text = data_2017['Country'],
               z = data_2017['Generosity'],
               )]

layout = dict(title = 'Generosity',
                  geo = dict(
                      showframe = True,
                      showocean = True,
                      showlakes = True,
                      showcoastlines = True,
                      projection = dict(
                          type = 'hammer'
        )))


projections = [ "equirectangular", "mercator", "orthographic", "natural earth","kavrayskiy7",
               "miller", "robinson", "eckert4", "azimuthal equal area","azimuthal equidistant",
               "conic equal area", "conic conformal", "conic equidistant", "gnomonic", "stereographic",
               "mollweide", "hammer", "transverse mercator", "albers usa", "winkel tripel" ]

buttons = [dict(args = ['geo.projection.type', y],
           label = y, method = 'relayout') for y in projections]
annot = list([ dict( x=0.1, y=0.8, text='Projection', yanchor='bottom',
                    xref='paper', xanchor='right', showarrow=False )])


# Update Layout Object

layout[ 'updatemenus' ] = list([ dict( x=0.1, y=0.8, buttons=buttons, yanchor='top' )])
layout[ 'annotations' ] = annot


fig = go.Figure(data = trace1, layout = layout)
py.iplot(fig)

* Низкая щедрость в больших странах, таких как Россия,
Китай и Индия, США, Австралия и Канада имеют высокие рейтинги щедрости.
* В Африке и Южной Америке очень низкие показатели щедрости в целом.

Топ 10 самых щедрых стран
--

In [None]:
data_2017[['Country', 'Generosity']].sort_values(by = 'Generosity',
                                                ascending = False).head(10)

In [None]:
trace1 = [go.Choropleth(
               colorscale = 'Cividis',
               locationmode = 'country names',
               locations = data_2017['Country'],
               text = data_2017['Country'],
               z = data_2017['Trust..Government.Corruption.'],
               )]

layout = dict(title = 'Trust in Governance',
                  geo = dict(
                      showframe = True,
                      showocean = True,
                      showlakes = True,
                      showcoastlines = True,
                      projection = dict(
                          type = 'hammer'
        )))


projections = [ "equirectangular", "mercator", "orthographic", "natural earth","kavrayskiy7",
               "miller", "robinson", "eckert4", "azimuthal equal area","azimuthal equidistant",
               "conic equal area", "conic conformal", "conic equidistant", "gnomonic", "stereographic",
               "mollweide", "hammer", "transverse mercator", "albers usa", "winkel tripel" ]

buttons = [dict(args = ['geo.projection.type', y],
           label = y, method = 'relayout') for y in projections]
annot = list([ dict( x=0.1, y=0.8, text='Projection', yanchor='bottom',
                    xref='paper', xanchor='right', showarrow=False )])


# Update Layout Object

layout[ 'updatemenus' ] = list([ dict( x=0.1, y=0.8, buttons=buttons, yanchor='top' )])
layout[ 'annotations' ] = annot


fig = go.Figure(data = trace1, layout = layout)
py.iplot(fig)

* Похоже, во всем мире нет доверия правительству, кроме Норвегии, Швеции и Финляндии.
* Канада, Саудовская Аравия, Германия, Великобритания, Сомали, Ирландия и Австралия также доверяют руководству
своих стран.

Топ 10 стран с высоким доверием к правительству
--


In [None]:
data_2017[['Country', 'Trust..Government.Corruption.']].sort_values(by = 'Trust..Government.Corruption.',
                                                                     ascending = False).head(10)

In [None]:
trace1 = [go.Choropleth(
               colorscale = 'Portland',
               locationmode = 'country names',
               locations = data_2017['Country'],
               text = data_2017['Country'],
               z = data_2017['Family'],
               )]

layout = dict(title = 'Family Satisfaction Index',
                  geo = dict(
                      showframe = True,
                      showocean = True,
                      showlakes = True,
                      showcoastlines = True,
                      projection = dict(
                          type = 'hammer'
        )))


projections = [ "equirectangular", "mercator", "orthographic", "natural earth","kavrayskiy7",
               "miller", "robinson", "eckert4", "azimuthal equal area","azimuthal equidistant",
               "conic equal area", "conic conformal", "conic equidistant", "gnomonic", "stereographic",
               "mollweide", "hammer", "transverse mercator", "albers usa", "winkel tripel" ]

buttons = [dict(args = ['geo.projection.type', y],
           label = y, method = 'relayout') for y in projections]
annot = list([ dict( x=0.1, y=0.8, text='Projection', yanchor='bottom',
                    xref='paper', xanchor='right', showarrow=False )])


# Update Layout Object

layout[ 'updatemenus' ] = list([ dict( x=0.1, y=0.8, buttons=buttons, yanchor='top' )])
layout[ 'annotations' ] = annot


fig = go.Figure(data = trace1, layout = layout)
py.iplot(fig)

* В Индии и Китае уровень удовлетворенности семей очень низок.
* Во всем мире уровень удовлетворенности семей довольно высок.
* У Центрально-Африканской Республики самый низкий показатель удовлетворенности семьи в мире.


Топ 10 стран по удовлетворенности семьи
--

In [None]:
data_2017[['Country', 'Family']].sort_values(by = 'Family', ascending = False).head(10)

In [None]:
trace1 = [go.Choropleth(
               colorscale = 'Viridis',
               locationmode = 'country names',
               locations = data_2017['Country'],
               text = data_2017['Country'],
               z = data_2017['Economy..GDP.per.Capita.'],
               )]

layout = dict(title = 'GDP in 2017',
                  geo = dict(
                      showframe = True,
                      showocean = True,
                      showlakes = True,
                      showcoastlines = True,
                      projection = dict(
                          type = 'hammer'
        )))


projections = [ "equirectangular", "mercator", "orthographic", "natural earth","kavrayskiy7",
               "miller", "robinson", "eckert4", "azimuthal equal area","azimuthal equidistant",
               "conic equal area", "conic conformal", "conic equidistant", "gnomonic", "stereographic",
               "mollweide", "hammer", "transverse mercator", "albers usa", "winkel tripel" ]

buttons = [dict(args = ['geo.projection.type', y],
           label = y, method = 'relayout') for y in projections]
annot = list([ dict( x=0.1, y=0.8, text='Projection', yanchor='bottom',
                    xref='paper', xanchor='right', showarrow=False )])


# Update Layout Object

layout[ 'updatemenus' ] = list([ dict( x=0.1, y=0.8, buttons=buttons, yanchor='top' )])
layout[ 'annotations' ] = annot


fig = go.Figure(data = trace1, layout = layout)
py.iplot(fig)

* Америка, Канада, Австралия, Саудовская Аравия, страны Европы - лидеры по экономике и ВВП.
* Небольшие страны, такие как Норвегия, Катар, Люксембург, имеют лучший показатель ВВП в мире.
* У большинства африканских стран очень низкий уровень ВВП.
* Индия, Пакистан, Мьянма имеют очень низкий ВВП в азиатских регионах.


Топ 10 стран с лучшей экономикой
--


In [None]:
data_2017[['Country', 'Economy..GDP.per.Capita.']].sort_values(by = 'Economy..GDP.per.Capita.',
            ascending = False).head(10)

In [None]:
trace1 = [go.Choropleth(
               colorscale = 'Picnic',
               locationmode = 'country names',
               locations = data_2017['Country'],
               text = data_2017['Country'],
               z = data_2017['Freedom'],
               )]

layout = dict(title = 'Freedom Index',
                  geo = dict(
                      showframe = True,
                      showocean = True,
                      showlakes = True,
                      showcoastlines = True,
                      projection = dict(
                          type = 'hammer'
        )))


projections = [ "equirectangular", "mercator", "orthographic", "natural earth","kavrayskiy7",
               "miller", "robinson", "eckert4", "azimuthal equal area","azimuthal equidistant",
               "conic equal area", "conic conformal", "conic equidistant", "gnomonic", "stereographic",
               "mollweide", "hammer", "transverse mercator", "albers usa", "winkel tripel" ]

buttons = [dict(args = ['geo.projection.type', y],
           label = y, method = 'relayout') for y in projections]
annot = list([ dict( x=0.1, y=0.8, text='Projection', yanchor='bottom',
                    xref='paper', xanchor='right', showarrow=False )])


# Update Layout Object

layout[ 'updatemenus' ] = list([ dict( x=0.1, y=0.8, buttons=buttons, yanchor='top' )])
layout[ 'annotations' ] = annot


fig = go.Figure(data = trace1, layout = layout)
py.iplot(fig)

* Похоже, Канада, Австралия и Европа - лучшие места на Земле для жизни. У них высокие баллы во всем.
В этом случае они также являются победителями.
* Европа в целом имеет очень высокий индекс свободы по сравнению с другими странами.
* Африканские страны, такие как Судан и Ангола, имеют самый низкий индекс свободы в мире.

Топ 10 самых свободных стран
--

In [None]:
data_2017[['Country', 'Freedom']].sort_values(by = 'Freedom', ascending = False).head(10)

In [None]:
trace1 = [go.Choropleth(
               colorscale = 'Electric',
               locationmode = 'country names',
               locations = data_2015['Country'],
               text = data_2015['Country'],
               z = data_2015['Happiness Rank'],
               )]

layout = dict(title = 'Happiness Rank',
                  geo = dict(
                      showframe = True,
                      showocean = True,
                      showlakes = True,
                      showcoastlines = True,
                      projection = dict(
                          type = 'hammer'
        )))


projections = [ "equirectangular", "mercator", "orthographic", "natural earth","kavrayskiy7",
               "miller", "robinson", "eckert4", "azimuthal equal area","azimuthal equidistant",
               "conic equal area", "conic conformal", "conic equidistant", "gnomonic", "stereographic",
               "mollweide", "hammer", "transverse mercator", "albers usa", "winkel tripel" ]

buttons = [dict(args = ['geo.projection.type', y],
           label = y, method = 'relayout') for y in projections]

annot = list([ dict( x=0.1, y=0.8, text='Projection', yanchor='bottom',
                    xref='paper', xanchor='right', showarrow=False )])


# Update Layout Object

layout[ 'updatemenus' ] = list([ dict( x=0.1, y=0.8, buttons=buttons, yanchor='top' )])
layout[ 'annotations' ] = annot


fig = go.Figure(data = trace1, layout = layout)
py.iplot(fig)

Топ 10 самых счастливых стран
--


In [None]:
data_2017[['Country','Happiness.Rank']].head(10)