# **LA FELICIDAD EN EL MUNDO**

<div style="text-align: center;">
    <img src="imagen.jpg" alt="Descripción de la imagen" />
</div>

### **ÍNDICE**
#### 1-Introducción: Variables utilizadas

####  2-Hipótesis

####  3-Subida del archivo csv

####  4-Tratamiento de nulos y de errores de puntos y comas

####  5-Añadimos variables necesarias para el análisis (continente, PIB per Cápita y nivel ingresos)

####  6-Análisis univariante

-Distribución de cada variable

-Boxplot de cada variable

-Estadísticas descriptivas de cada variable

-Países más felices y menos felices (evolución)

-Análisis de las tablas extraidas

####  7-Análisis bivariante

-Scatter plot de todas las variables con la variable de life ladder o índice de felicidad

-Line plot con evolución de las variables generosidad y social support después del covid

-Efecto variable PIB per cápita en el life ladder o índice de riqueza

####  8-Análisis multivariante

-Matriz correlación por continente

-Matriz correlación por país 

-Análisis de las matrices de correlación 
    
####  9-Conclusiones y resolución de hipótesis

## 1- INTRODUCCIÓN: VARIABLES A UTILIZAR

#### **1. Life Ladder**
Descripción: El "Life Ladder" (Escalera de la Vida) es una medida de bienestar subjetivo.
Escala: 0 a 10.

Interpretación:
0: Representa la peor vida posible según la percepción del individuo.
10: Representa la mejor vida posible según la percepción del individuo.

Cálculo: Se basa en la pregunta de la encuesta Gallup World Poll donde se pide a los encuestados que imaginen una escalera con peldaños numerados del 0 al 10 y que indiquen en qué peldaño se sienten actualmente.

#### **2. GDP per Capita**
Descripción: Producto Interno Bruto (PIB) per cápita ajustado por paridad de poder adquisitivo (PPA).

Medición: Se mide en dólares internacionales ajustados por PPA.

Cálculo: Utiliza datos del Banco Mundial y otras fuentes económicas para calcular el PIB per cápita, ajustando las diferencias en el costo de vida entre países.

#### **3. Social Support**
Descripción: Medida de la percepción de apoyo social.

Interpretación: Escala del 0 al 1

Cálculo: Basada en la pregunta de la encuesta Gallup World Poll: "Si te encuentras en dificultades, ¿tienes familiares o amigos con quienes puedas contar para recibir ayuda cuando la necesites, o no?". La proporción de personas que responden 
"sí" se utiliza para esta variable.

#### **4. Healthy Life Expectancy**
Descripción: Esperanza de vida saludable al nacer.

Medición: Años.

Cálculo: Combina datos de la Organización Mundial de la Salud (OMS) y otras fuentes de salud pública para calcular los años de vida esperados en buena salud.


#### **5. Freedom to Make Life Choices**
Descripción: Medida de la percepción de libertad para tomar decisiones sobre la vida.

Interpretación: Escala del 0 al 1

Cálculo: Basada en la pregunta de la encuesta Gallup World Poll: "¿Estás satisfecho o insatisfecho con tu libertad para 
elegir lo que haces con tu vida?". La proporción de personas que responden "satisfecho" se utiliza para esta variable.

#### **6. Generosity**
Descripción: Medida de la generosidad de la población.

Interpretación: Escala del 1 al -1
Cálculo: Basada en la pregunta de la encuesta Gallup World Poll: "¿Has donado dinero a una organización benéfica en el último mes?". La proporción de personas que responden "sí" se ajusta por el PIB per cápita.


#### **7. Perceptions of Corruption**
Descripción: Medida de la percepción de corrupción en el gobierno y negocios.

Interpretación: Escala del 0 al 1 (como más cerca de 1 más corrupción percibida)

Cálculo: Basada en la pregunta de la encuesta Gallup World Poll: "¿Está extendida la corrupción en el gobierno o no?" y "¿Está extendida la corrupción en los negocios o no?". La proporción de personas que responden "sí" a cualquiera de las preguntas se utiliza para esta variable.


#### **8. Positive Affect**
Descripción: Medida de las emociones positivas.

Interpretación: Escala del 0 al 1

Cálculo: Basada en preguntas de la encuesta Gallup World Poll sobre si los encuestados experimentaron ciertas emociones positivas (risa, disfrute, etc.) el día anterior a la encuesta. La proporción de respuestas positivas se utiliza para esta variable.


#### **9. Negative Affect**
Descripción: Medida de las emociones negativas.

Interpretación: Escala del 0 al 1

Cálculo: Basada en preguntas de la encuesta Gallup World Poll sobre si los encuestados experimentaron ciertas emociones negativas (preocupación, tristeza, etc.) el día anterior a la encuesta. La proporción de respuestas positivas se utiliza para esta variable.

## **2-HIPOTESIS**

1. Qué variables tienen un MAYOR efecto sobre el índice de felicidad o LIFE LADDER
2. Comparar diferentes países y la variable que tienen más efecto en el índice de felicidad o LIFE LADDER
3. Las variables de generosidad y apoyo social han crecido desde la pandemia en el año 2020. 
4. Los países que lideran una variable no tienen porque ser los más felices
5. Los 5 países MÁS felices del mundo tienen una ideología política basada en la socialdemocracia (busca apoyar las intervenciones estatales, tanto económicas como sociales, para promover mayor equidad económica e igualdad social en el marco de una economía capitalista)
6. Los países mucho menos desarrollados económicos (PIB más bajo) son los que tienen menor LIFE LADDER

## **3-IMPORTAR CSV Y LAS DIFERENTES BIBLIOTECAS**

In [13]:
import matplotlib.pyplot as plt
import pandas as pd
import pycountry
import pycountry_convert as pc
import numpy as np
import seaborn as sns


In [16]:
df_felicidad = pd.read_csv("./datos/ranking_felicidad.csv")
df_felicidad

Unnamed: 0,Country name,year,Life Ladder,Log GDP per capita,Social support,Healthy life expectancy at birth,Freedom to make life choices,Generosity,Perceptions of corruption,Positive affect,Negative affect
0,Afghanistan,2008,3724,7350,0451,50500,0718,0164,0882,0414,0258
1,Afghanistan,2009,4402,7509,0552,50800,0679,0187,0850,0481,0237
2,Afghanistan,2010,4758,7614,0539,51100,0600,0118,0707,0517,0275
3,Afghanistan,2011,3832,7581,0521,51400,0496,0160,0731,0480,0267
4,Afghanistan,2012,3783,7661,0521,51700,0531,0234,0776,0614,0268
...,...,...,...,...,...,...,...,...,...,...,...
2358,Zimbabwe,2019,2694,7698,0759,53100,0632,-0051,0831,0658,0235
2359,Zimbabwe,2020,3160,7596,0717,53575,0643,0003,0789,0661,0346
2360,Zimbabwe,2021,3155,7657,0685,54050,0668,-0079,0757,0610,0242
2361,Zimbabwe,2022,3296,7670,0666,54525,0652,-0073,0753,0641,0191


In [18]:
df_felicidad.info() # Para detectar nulos y valores que pueden dar errores en el futuro. Por ejemplo todos son objetos.


<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2363 entries, 0 to 2362
Data columns (total 11 columns):
 #   Column                            Non-Null Count  Dtype 
---  ------                            --------------  ----- 
 0   Country name                      2363 non-null   object
 1   year                              2363 non-null   int64 
 2   Life Ladder                       2363 non-null   object
 3   Log GDP per capita                2335 non-null   object
 4   Social support                    2350 non-null   object
 5   Healthy life expectancy at birth  2300 non-null   object
 6   Freedom to make life choices      2327 non-null   object
 7   Generosity                        2282 non-null   object
 8   Perceptions of corruption         2238 non-null   object
 9   Positive affect                   2339 non-null   object
 10  Negative affect                   2347 non-null   object
dtypes: int64(1), object(10)
memory usage: 203.2+ KB


## **4-Tratamiento de nulos y de errores**


In [19]:
# Convertimos todas las columnas que están como objeto por un error de puntos y comas. Vemos los resultados con el info()
columns_to_convert = ['Life Ladder', 'Log GDP per capita', 'Social support', 
                      'Healthy life expectancy at birth', 'Freedom to make life choices', 
                      'Generosity', 'Perceptions of corruption', 
                      'Positive affect', 'Negative affect']

for col in columns_to_convert:
    df_felicidad[col] = df_felicidad[col].str.replace(',', '.').astype(float)

In [20]:
df_felicidad.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2363 entries, 0 to 2362
Data columns (total 11 columns):
 #   Column                            Non-Null Count  Dtype  
---  ------                            --------------  -----  
 0   Country name                      2363 non-null   object 
 1   year                              2363 non-null   int64  
 2   Life Ladder                       2363 non-null   float64
 3   Log GDP per capita                2335 non-null   float64
 4   Social support                    2350 non-null   float64
 5   Healthy life expectancy at birth  2300 non-null   float64
 6   Freedom to make life choices      2327 non-null   float64
 7   Generosity                        2282 non-null   float64
 8   Perceptions of corruption         2238 non-null   float64
 9   Positive affect                   2339 non-null   float64
 10  Negative affect                   2347 non-null   float64
dtypes: float64(9), int64(1), object(1)
memory usage: 203.2+ KB


In [22]:
# Viendo que hay pocos valores nulos y que, además son valores numéricos rellenamos estos valores nulos con la MEDIA
columns_to_fill = [
    'Log GDP per capita', 'Social support', 'Healthy life expectancy at birth',
    'Freedom to make life choices', 'Generosity', 'Perceptions of corruption',
    'Positive affect', 'Negative affect'
]

# Rellenar los valores nulos con la media de cada columna
for column in columns_to_fill:
    mean_value = df_felicidad[column].mean()  # Obtener la media de la columna
    df_felicidad[column].fillna(mean_value, inplace=True)

The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  df_felicidad[column].fillna(mean_value, inplace=True)


In [24]:
# Aqui ya el dataframe queda listo para añadir más variables y para los diferentes tipos de análisis
df_felicidad.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2363 entries, 0 to 2362
Data columns (total 11 columns):
 #   Column                            Non-Null Count  Dtype  
---  ------                            --------------  -----  
 0   Country name                      2363 non-null   object 
 1   year                              2363 non-null   int64  
 2   Life Ladder                       2363 non-null   float64
 3   Log GDP per capita                2363 non-null   float64
 4   Social support                    2363 non-null   float64
 5   Healthy life expectancy at birth  2363 non-null   float64
 6   Freedom to make life choices      2363 non-null   float64
 7   Generosity                        2363 non-null   float64
 8   Perceptions of corruption         2363 non-null   float64
 9   Positive affect                   2363 non-null   float64
 10  Negative affect                   2363 non-null   float64
dtypes: float64(9), int64(1), object(1)
memory usage: 203.2+ KB


##  **5-Añadimos variables necesarias para el análisis**

In [25]:
# Para añadir variable CONTINENTE

# Función para obtener el nombre del continente a partir del nombre del país
def continentes(country_name):
    try:
        country_code = pycountry.countries.lookup(country_name).alpha_2
        continent_code = pc.country_alpha2_to_continent_code(country_code)
        continent_name = pc.convert_continent_code_to_continent_name(continent_code)
        return continent_name
    except LookupError:
        return None

# Agregar una nueva columna 'continent' con el nombre del continente
df_felicidad['continente'] = df_felicidad['Country name'].apply(continentes)

El **Banco Mundial** clasifica a los países en función de su PIB per cápita ajustado por PPA. En 2023, la clasificación del Banco Mundial para los ingresos es la siguiente:

· **Ingresos Altos**: PIB per cápita superior a $13,205 USD.

Ingresos Medios:

----**Medios Altos**: PIB per cápita entre $4,256 y $13,205 USD.

----**Medios Bajos**: PIB per cápita entre $1,046 y $4,255 USD.

· **Ingresos Bajos**: PIB per cápita inferior a $1,046 USD.

In [28]:
# Para dejar de tener un logaritmo y tener el PIB per cápita real de cada país y cada año
# Nos servirá para clasificar los países después y crear una nueva variable
df_felicidad['PIB per capita'] = np.exp(df_felicidad['Log GDP per capita'])

In [32]:
def categoria_ingresos(pib_per_capita):
    if pib_per_capita > 13205:
        return 'Ingresos Altos'
    elif 4257 <= pib_per_capita <= 13205:
        return 'Ingresos Medios Altos'
    elif 1046 <= pib_per_capita <= 4256:
        return 'Ingresos Medios Bajos'
    else:
        return 'Ingresos Bajos'

df_felicidad['categoria de ingresos'] = df_felicidad['PIB per capita'].apply(categoria_ingresos)

In [35]:
df_felicidad = df_felicidad.drop(columns=['Income Category'])

In [36]:
df_felicidad

Unnamed: 0,Country name,year,Life Ladder,Log GDP per capita,Social support,Healthy life expectancy at birth,Freedom to make life choices,Generosity,Perceptions of corruption,Positive affect,Negative affect,continente,PIB per capita,categoria de ingresos
0,Afghanistan,2008,3.724,7.350,0.451,50.500,0.718,0.164,0.882,0.414,0.258,Asia,1556.196528,Ingresos Medios Bajos
1,Afghanistan,2009,4.402,7.509,0.552,50.800,0.679,0.187,0.850,0.481,0.237,Asia,1824.388242,Ingresos Medios Bajos
2,Afghanistan,2010,4.758,7.614,0.539,51.100,0.600,0.118,0.707,0.517,0.275,Asia,2026.367378,Ingresos Medios Bajos
3,Afghanistan,2011,3.832,7.581,0.521,51.400,0.496,0.160,0.731,0.480,0.267,Asia,1960.588574,Ingresos Medios Bajos
4,Afghanistan,2012,3.783,7.661,0.521,51.700,0.531,0.234,0.776,0.614,0.268,Asia,2123.880247,Ingresos Medios Bajos
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
2358,Zimbabwe,2019,2.694,7.698,0.759,53.100,0.632,-0.051,0.831,0.658,0.235,Africa,2203.935710,Ingresos Medios Bajos
2359,Zimbabwe,2020,3.160,7.596,0.717,53.575,0.643,0.003,0.789,0.661,0.346,Africa,1990.219076,Ingresos Medios Bajos
2360,Zimbabwe,2021,3.155,7.657,0.685,54.050,0.668,-0.079,0.757,0.610,0.242,Africa,2115.401695,Ingresos Medios Bajos
2361,Zimbabwe,2022,3.296,7.670,0.666,54.525,0.652,-0.073,0.753,0.641,0.191,Africa,2143.081445,Ingresos Medios Bajos
