# Explorando resultados del Informe Mundial de Felicidad (2021)

Mauricio Flores Jiménez

La Red de Soluciones para el Desarrollo Sostenible de la ONU publicó a inicios de año su noveno Informe Mundial de Felicidad. Como su nombre lo indica, el informe estima y analiza el nivel de felicidad que reportan las personas encuestadas de distintos países del mundo.

En este notebook usaremos librerías de Python para graficar algunos datos del Informe.

El primer paso será importar las librerías a usar.

In [1]:
import pandas as pd
import altair as alt

Ahora, carguemos la base de datos.

In [2]:
WHI = pd.read_csv("/Users/Mauricio/Desktop/Trabajos/Trabajo Final/World Happiness Index 2021.csv")

Veamos el contenido:

In [3]:
WHI

Unnamed: 0,Country name,Regional indicator,Ladder score,Standard error of ladder score,upperwhisker,lowerwhisker,Logged GDP per capita,Social support,Healthy life expectancy,Freedom to make life choices,Generosity,Perceptions of corruption,Ladder score in Dystopia,Explained by: Log GDP per capita,Explained by: Social support,Explained by: Healthy life expectancy,Explained by: Freedom to make life choices,Explained by: Generosity,Explained by: Perceptions of corruption,Dystopia + residual
0,Finland,Western Europe,7.842,0.032,7.904,7.780,10.775,0.954,72.000,0.949,-0.098,0.186,2.43,1.446,1.106,0.741,0.691,0.124,0.481,3.253
1,Denmark,Western Europe,7.620,0.035,7.687,7.552,10.933,0.954,72.700,0.946,0.030,0.179,2.43,1.502,1.108,0.763,0.686,0.208,0.485,2.868
2,Switzerland,Western Europe,7.571,0.036,7.643,7.500,11.117,0.942,74.400,0.919,0.025,0.292,2.43,1.566,1.079,0.816,0.653,0.204,0.413,2.839
3,Iceland,Western Europe,7.554,0.059,7.670,7.438,10.878,0.983,73.000,0.955,0.160,0.673,2.43,1.482,1.172,0.772,0.698,0.293,0.170,2.967
4,Netherlands,Western Europe,7.464,0.027,7.518,7.410,10.932,0.942,72.400,0.913,0.175,0.338,2.43,1.501,1.079,0.753,0.647,0.302,0.384,2.798
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
144,Lesotho,Sub-Saharan Africa,3.512,0.120,3.748,3.276,7.926,0.787,48.700,0.715,-0.131,0.915,2.43,0.451,0.731,0.007,0.405,0.103,0.015,1.800
145,Botswana,Sub-Saharan Africa,3.467,0.074,3.611,3.322,9.782,0.784,59.269,0.824,-0.246,0.801,2.43,1.099,0.724,0.340,0.539,0.027,0.088,0.648
146,Rwanda,Sub-Saharan Africa,3.415,0.068,3.548,3.282,7.676,0.552,61.400,0.897,0.061,0.167,2.43,0.364,0.202,0.407,0.627,0.227,0.493,1.095
147,Zimbabwe,Sub-Saharan Africa,3.145,0.058,3.259,3.030,7.943,0.750,56.201,0.677,-0.047,0.821,2.43,0.457,0.649,0.243,0.359,0.157,0.075,1.205


In [4]:
WHI.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 149 entries, 0 to 148
Data columns (total 20 columns):
 #   Column                                      Non-Null Count  Dtype  
---  ------                                      --------------  -----  
 0   Country name                                149 non-null    object 
 1   Regional indicator                          149 non-null    object 
 2   Ladder score                                149 non-null    float64
 3   Standard error of ladder score              149 non-null    float64
 4   upperwhisker                                149 non-null    float64
 5   lowerwhisker                                149 non-null    float64
 6   Logged GDP per capita                       149 non-null    float64
 7   Social support                              149 non-null    float64
 8   Healthy life expectancy                     149 non-null    float64
 9   Freedom to make life choices                149 non-null    float64
 10  Generosity    

En esta ocasión no se requerirá de todas las variables, así que se puede proceder a eliminar columnas.

In [5]:
WHI.drop(columns = ['Standard error of ladder score', 'upperwhisker', 'lowerwhisker', 'Ladder score in Dystopia', 
                    'Explained by: Log GDP per capita', 'Explained by: Social support', 'Explained by: Healthy life expectancy',
                    'Explained by: Freedom to make life choices', 'Explained by: Generosity',
                    'Explained by: Perceptions of corruption', 'Dystopia + residual'], inplace = True)

Sería preferible traducir los nombres de las columnas que quedaron.

In [6]:
Columnas_Traducido = {'Country name': 'País',
                      'Regional indicator': 'Región',
                      'Ladder score': 'Puntaje',
                      'Logged GDP per capita': 'PBI per cápita Log',
                      'Social support': 'Soporte social', 
                      'Healthy life expectancy': 'Esperanza de vida saludable',
                      'Freedom to make life choices': 'Libertad para decidir sobre su vida', 
                      'Generosity': 'Generosidad',
                      'Perceptions of corruption': 'Percepciones sobre corrupción'}

WHI.rename(columns = Columnas_Traducido, inplace = True)

¿En qué regiones se ha distribuido a los países?

In [7]:
WHI['Región'].value_counts()

Sub-Saharan Africa                    36
Western Europe                        21
Latin America and Caribbean           20
Central and Eastern Europe            17
Middle East and North Africa          17
Commonwealth of Independent States    12
Southeast Asia                         9
South Asia                             7
East Asia                              6
North America and ANZ                  4
Name: Región, dtype: int64

Otra variable a modificar. Hay que reconfigurar los valores para que el nombre de las regiones también esté en español.

In [8]:
WHI.replace({'Región': {'Sub-Saharan Africa': 'África subsahariana',
                        'Western Europe': 'Europa occidental',
                        'Latin America and Caribbean': 'Latinoamérica y el Caribe',
                        'Middle East and North Africa': 'Medio Oriente y África del Norte',
                        'Central and Eastern Europe': 'Europa central y oriental',
                        'Commonwealth of Independent States': 'Comunidad de Estados Independientes',
                        'Southeast Asia': 'Sudeste Asiático',
                        'South Asia': 'Asia del Sur',
                        'East Asia': 'Asia del Este',
                        'North America and ANZ': 'Norteamérica, Australia y Nueva Zelanda'}}, inplace = True)

Es un tanto extraño ver que el puntaje de felicidad esté en escala de 10. ¿Por qué no crear una nueva variable que tenga el puntaje en escala de 100?

In [9]:
WHI['Puntaje escala 100'] = WHI['Puntaje'] * 10

¿Cómo se ve la base de datos ahora?

In [10]:
WHI

Unnamed: 0,País,Región,Puntaje,PBI per cápita Log,Soporte social,Esperanza de vida saludable,Libertad para decidir sobre su vida,Generosidad,Percepciones sobre corrupción,Puntaje escala 100
0,Finland,Europa occidental,7.842,10.775,0.954,72.000,0.949,-0.098,0.186,78.42
1,Denmark,Europa occidental,7.620,10.933,0.954,72.700,0.946,0.030,0.179,76.20
2,Switzerland,Europa occidental,7.571,11.117,0.942,74.400,0.919,0.025,0.292,75.71
3,Iceland,Europa occidental,7.554,10.878,0.983,73.000,0.955,0.160,0.673,75.54
4,Netherlands,Europa occidental,7.464,10.932,0.942,72.400,0.913,0.175,0.338,74.64
...,...,...,...,...,...,...,...,...,...,...
144,Lesotho,África subsahariana,3.512,7.926,0.787,48.700,0.715,-0.131,0.915,35.12
145,Botswana,África subsahariana,3.467,9.782,0.784,59.269,0.824,-0.246,0.801,34.67
146,Rwanda,África subsahariana,3.415,7.676,0.552,61.400,0.897,0.061,0.167,34.15
147,Zimbabwe,África subsahariana,3.145,7.943,0.750,56.201,0.677,-0.047,0.821,31.45


Definiremos un tema estético para los gráficos a realizar.

In [18]:
def Tema_gráficos():
    
    return {
        "config" : {'background': '#fffbf0'}
            }

alt.themes.register('Tema1', Tema_gráficos)
alt.themes.enable('Tema1')

ThemeRegistry.enable('Tema1')

Bueno, momento de explorar lo que nos interesaba. ¿Qué tan (cor)relacionada estará la riqueza de un país con su felicidad? Tenderíamos a pensar que debe existir una fuerte correlación positiva entre ambas variables. Después de todo, la calidad de vida debería ser mejor en aquellos países que, en promedio, cuentan con ingresos más altos. La (cor)relación se podrá observar a través de un diagrama de dispersión. Si vemos que los puntos (países) se concentran siguiendo un patrón ascendente hacia la derecha, la (cor)relación será fuerte. Comprobemos si esto es así.

In [19]:
G1=alt.Chart(WHI).mark_point(filled=True).encode(
    x= alt.X('PBI per cápita Log:Q', title='PBI per cápita Log'),
    y= alt.Y('Puntaje escala 100:Q', title='Índice de Felicidad'),
    tooltip= ['País', 'Puntaje escala 100', 'PBI per cápita Log'],
    color= alt.Color('Región:N')
).properties(
    width=450,
    height=450,
    title={
      "text": ["Riqueza nacional e Índice de Felicidad"], 
      "subtitle": ["Fuente: World Happiness Report (2021)"],
      "color": "Black",
      "subtitleColor": "Black"}
)

G1.configure_axis(
    labelFont= 'Playfair Display',
    labelFontSize=12,
    labelColor= 'Black',
    titleFont= 'Playfair Display',
    titleFontSize=14
)

G1.configure_title(
    fontSize=22,
    font='Bree Serif',
    align= 'center',
    anchor='middle',
    subtitleFontSize=11,
    subtitleFont= 'Spectral',
    subtitlePadding= 6
)

En efecto, el gráfico confirma en términos generales la premisa de que a mayor riqueza mayor felicidad. Los países que están más abajo respecto al eje Y también se encuentran menos a la derecha respecto al eje X. No obstante, es cierto que la riqueza no es una condición suficiente para tener un puntaje alto en el índice. Si lo fuese todo no habría casos de países que, teniendo menores ingresos que otros, obtienen un mayor puntaje . Tómese como ejemplo a Luxemburgo y a Finlandia. Aunque el primero es más rico, el segundo tiene un mayor puntaje en el Índice de Felicidad y es, por cuarto año consecutivo, el país más feliz del mundo.

¿Qué arrojará un gráfico agrupado por regiones?

In [21]:
G2=alt.Chart(WHI).mark_bar().encode(
    x= alt.X('mean(Puntaje escala 100):Q', title='Índice de Felicidad'),
    y= alt.Y('Región:N', title='Región', sort='-x'),
    tooltip= ['Región', 'mean(Puntaje escala 100):Q', 'mean(PBI per cápita Log):Q'],
    color= alt.Color('Región:N', legend= None)
).properties(
    width=400,
    height=400,
    title={
      "text": ["Índice de Felicidad por región del mundo"], 
      "subtitle": ["Fuente: World Happiness Report (2021)"],
      "color": "Black",
      "subtitleColor": "Black"}
)

G2.configure_title(
    fontSize=22,
    font='Bree Serif',
    align= 'center',
    anchor='middle',
    subtitleFontSize=11,
    subtitleFont= 'Spectral',
    subtitlePadding= 6
)

La región más feliz del mundo es la conformada por Estados Unidos, Canadá, Australia y Nueva Zelanda. Dicho grupo logra superar a los países de Europa occidental. Sin embargo, sería bueno tener en cuenta que, mientras el primer grupo tiene tan solo 4 integrantes, el segundo bloque se compone de 21 y, como se ve en el primer gráfico, hay una mayor dispersión en el puntaje que obtienen los países de Europa occidental.

Adicionalmente, se puede observar con mayor claridad que el promedio regional de PBI per cápita (en escala logarítmica) no siempre es menor a medida que se baja en el ranking de Felicidad. Latinoamérica y el Caribe son el ejemplo más notorio.

Enfoquémosnos en Latinoamérica y el Caribe. ¿Cómo está el ranking al interior de la región?

In [22]:
WHI_LyC = WHI[WHI['Región'] == "Latinoamérica y el Caribe"]

In [23]:
G3A = alt.Chart(WHI_LyC).mark_bar(color='green').encode(
    x= alt.X('País:N', title='País', sort='-y'),
    y= alt.Y('Puntaje escala 100:Q', title='Índice de Felicidad'),
    color = alt.Color("País", legend=None, scale=alt.Scale(scheme='category20')),
    tooltip= ['País', 'Puntaje escala 100', 'PBI per cápita Log', 'Soporte social', 'Esperanza de vida saludable',
              'Libertad para decidir sobre su vida', 'Generosidad', 'Percepciones sobre corrupción']
)

G3B = alt.Chart(WHI_LyC).mark_rule(color='red').encode(
    y='mean(Puntaje escala 100):Q',
    tooltip=['mean(Puntaje escala 100):Q']
)

(G3A + G3B).properties(
    width=400,
    height=400,
    title={
      "text": ["Índice de Felicidad en Latinoamérica y el Caribe"], 
      "subtitle": ["Fuente: World Happiness Report (2021)"],
      "color": "Black",
      "subtitleColor": "Black"}
)

Quizás el dato más llamativo es que Guatemala sea el segundo país más feliz de la región. Siendo un país menos rico que Panamá, Chile, Uruguay y Argentina –por mencionar los más resaltantes–, se encuentra delante de ellos en el ranking. Viendo las puntaciones en los componentes del Índice, parecería que hay una mayor correlación entre la libertad para tomar decisiones sobre su vida y el Índice de Felicidad.

Por curiosidad, exploremos esa relación.

In [26]:
G4=alt.Chart(WHI_LyC).mark_point(filled=True).encode(
    x= alt.X('Libertad para decidir sobre su vida:Q', title='Libertad para decidir sobre su vida'),
    y= alt.Y('Puntaje escala 100:Q', title='Índice de Felicidad'),
    tooltip= ['País', 'Puntaje escala 100', 'Libertad para decidir sobre su vida'],
    color= alt.Color('País:N', scale=alt.Scale(scheme='category20'))
).interactive().properties(
    width=450,
    height=450,
    title={
      "text": ["Libertad de decisión sobre la propia vida e Índice de Felicidad"], 
      "subtitle": ["Fuente: World Happiness Report (2021)"],
      "color": "Black",
      "subtitleColor": "Black"}
)

G4.configure_axis(
    labelFont= 'Playfair Display',
    labelFontSize=12,
    labelColor= 'Black',
    titleFont= 'Playfair Display',
    titleFontSize=14
)

G4.configure_title(
    fontSize=22,
    font='Bree Serif',
    align= 'center',
    anchor='middle',
    subtitleFontSize=11,
    subtitleFont= 'Spectral',
    subtitlePadding= 6
)

Nuevamente, sorprende mucho la puntuación de Guatemala en el eje X –supera incluso a Uruguay– considerando los altos niveles de violencia que vive su población debido a la Mara Salvatrucha, porque se podría pensar que el crimen organizado tendría un mayor efecto negativo en la percepción que se tiene sobre la capacidad de tomar decidir libremente sobre su vida.

¡Gracias por visualizar este notebook!