# Análisis Exploratorio de Datos: Felicidad Global 2011–2024

Este notebook realiza un análisis exploratorio sobre los factores que influyen en el nivel de felicidad de los países a lo largo del tiempo, utilizando datos del World Happiness Report.


In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

sns.set_theme(style="whitegrid")
plt.rcParams['figure.figsize'] = (10, 6)

In [2]:
# Ruta de los archivos de datos (dataset)
ruta = "../data/Data+for+Figure+2.1+(2011–2024).xlsx"

# cargar el archivo con pandas
df = pd.read_excel(ruta)

# Mostrar las primeras filas del dataframe para verificar que se ha cargado correctamente
print(df.head())

   Year  Rank Country name  Ladder score  upperwhisker  lowerwhisker  \
0  2024     1      Finland         7.736         7.810         7.662   
1  2023   143  Afghanistan         1.721         1.775         1.667   
2  2022   137  Afghanistan         1.859         1.923         1.795   
3  2021   146  Afghanistan         2.404         2.469         2.339   
4  2020   150  Afghanistan         2.523         2.596         2.449   

   Explained by: Log GDP per capita  Explained by: Social support  \
0                             1.749                         1.783   
1                             0.628                         0.000   
2                             0.645                         0.000   
3                             0.758                         0.000   
4                             0.370                         0.000   

   Explained by: Healthy life expectancy  \
0                                  0.824   
1                                  0.242   
2                   

In [7]:
# Ver el tamaño real del dataset

df.shape

(1969, 13)

In [None]:
# Ver el tamaño real del dataset

df.shape

(1969, 13)

### Ver las columnas con sus nombres y tipos de datos

In [None]:
df.dtypes

Year                                            int64
Rank                                            int64
Country name                                   object
Ladder score                                  float64
upperwhisker                                  float64
lowerwhisker                                  float64
Explained by: Log GDP per capita              float64
Explained by: Social support                  float64
Explained by: Healthy life expectancy         float64
Explained by: Freedom to make life choices    float64
Explained by: Generosity                      float64
Explained by: Perceptions of corruption       float64
Dystopia + residual                           float64
dtype: object

### Ver los primeros registros con todas las columnas visibles

In [10]:
with pd.option_context('display.max_columns', None):
    display(df.head(10))

Unnamed: 0,Year,Rank,Country name,Ladder score,upperwhisker,lowerwhisker,Explained by: Log GDP per capita,Explained by: Social support,Explained by: Healthy life expectancy,Explained by: Freedom to make life choices,Explained by: Generosity,Explained by: Perceptions of corruption,Dystopia + residual
0,2024,1,Finland,7.736,7.81,7.662,1.749,1.783,0.824,0.986,0.11,0.502,1.782
1,2023,143,Afghanistan,1.721,1.775,1.667,0.628,0.0,0.242,0.0,0.091,0.088,0.672
2,2022,137,Afghanistan,1.859,1.923,1.795,0.645,0.0,0.087,0.0,0.093,0.059,0.976
3,2021,146,Afghanistan,2.404,2.469,2.339,0.758,0.0,0.289,0.0,0.089,0.005,1.263
4,2020,150,Afghanistan,2.523,2.596,2.449,0.37,0.0,0.126,0.0,0.122,0.01,1.895
5,2019,153,Afghanistan,2.5669,2.62827,2.50553,0.300706,0.356434,0.266052,0.0,0.135235,0.001226,1.507236
6,2018,154,Afghanistan,3.203,,,,,,,,,
7,2017,145,Afghanistan,3.632,,,,,,,,,
8,2016,141,Afghanistan,3.794,,,,,,,,,
9,2015,154,Afghanistan,3.36,,,,,,,,,


#### Vemos cuantos países y años hay en total en el dataframe

In [12]:
print("Total de países:", df['Country name'].nunique())
print("Total de años:", df['Year'].nunique())

Total de países: 169
Total de años: 13


#### Vamos a documentar las columnas con el fin de poder explicar el significado de cada columna

### 🧾 Descripción de las columnas del dataset - World Happiness Report

| Columna                                 | Descripción                                                                 |
|-----------------------------------------|------------------------------------------------------------------------------|
| `Year`                                  | Año en el que se midieron los datos.                                        |
| `Country name`                          | Nombre del país.                                                            |
| `Ladder score`                          | Puntuación general de felicidad (escala 0 a 10).                            |
| `Rank`                                  | Posición del país en el ranking global de felicidad.                        |
| `upperwhisker` / `lowerwhisker`         | Límites superior e inferior del intervalo de confianza del `Ladder score`. |
| `Explained by: Log GDP per capita`      | Parte del score explicada por el ingreso per cápita del país (logarítmico).|
| `Explained by: Social support`          | Parte explicada por el apoyo social (familia, amigos, red de ayuda).       |
| `Explained by: Healthy life expectancy` | Parte explicada por la expectativa de vida saludable.                       |
| `Explained by: Freedom to make life choices` | Parte explicada por la libertad percibida para tomar decisiones.       |
| `Explained by: Generosity`              | Parte explicada por la generosidad (donaciones, altruismo).                |
| `Explained by: Perceptions of corruption` | Parte explicada por la corrupción percibida en gobierno/sociedad.        |
| `Dystopia + residual`                   | Valor residual para completar el `Ladder score` (modelo interno).          |


### ¿Qué estamos analizando?

Cada fila representa un país en un año determinado.  
El objetivo es entender qué factores (PIB, salud, libertad, etc.) están más relacionados con la felicidad de los países según el World Happiness Report.

La columna `Ladder score` es la puntuación total de felicidad, y las columnas que empiezan por `Explained by:` explican cómo se construye ese score.

Antes de seguir con limpieza o visualización, es importante tener claro **qué mide cada variable** y **qué tipo de análisis nos interesa realizar** (por ejemplo: comparaciones por país, evolución temporal, correlaciones entre factores...).
