# Caso de Uso: Predicción del Índice de Felicidad
### Objetivo
Construir un modelo que prediga el puntaje de felicidad de un país basándose en características como el PIB per cápita, 
esperanza de vida saludable, soporte social, percepción de corrupción, y más.

### Dataset
Usaremos el **World Happiness Report Dataset**, un conjunto de datos público que evalúa el bienestar de los países según varias métricas económicas y sociales.

### Paso 1: Cargar el Dataset y Exploración de Datos
Primero, cargaremos el dataset y exploraremos su contenido.
Instrucción: Completa las líneas para cargar el dataset y mostrar un resumen inicial.

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.tree import DecisionTreeRegressor
from sklearn.metrics import mean_squared_error, r2_score

# Cargar el dataset
url = 'https://raw.githubusercontent.com/datasciencedojo/datasets/master/WorldHappinessReport.csv'
df = pd.read_csv(url)
print("Primeras filas del dataset:")
print(df.head())

# Resumen estadístico
print("Resumen estadístico del dataset:")
print(df.describe())

### Paso 2: Análisis Exploratorio de Datos (EDA)
Instrucciones:
1. Identifica la distribución del puntaje de felicidad (`Happiness Score`) usando un histograma.
2. Analiza la relación entre las variables económicas y sociales con el puntaje de felicidad utilizando gráficos de dispersión.

### Paso 3: Preprocesamiento de Datos
Instrucciones:
1. Elimina columnas innecesarias (como `Country` y `Region`).
2. Rellena valores faltantes si los hay.
3. Divide los datos en características (`X`) y la variable objetivo (`y`).

### Paso 4: División del Dataset
Instrucciones:
1. Divide los datos en conjuntos de entrenamiento (80%) y prueba (20%).
2. Usa `train_test_split` con una semilla (`random_state`) para resultados reproducibles.

### Paso 5: Construcción y Evaluación del Modelo
Instrucciones:
1. Entrena un modelo de **Regresión Lineal** para predecir el puntaje de felicidad.
2. Calcula métricas como el error cuadrático medio (MSE) y el coeficiente de determinación ($R^2$).
3. Entrena un modelo de **Regresión de Árbol de Decisión** y evalúa sus métricas.
4. Compara ambos modelos.

### Paso 6: Visualización de Resultados
Instrucciones:
1. Grafica las predicciones de ambos modelos contra los valores reales del puntaje de felicidad.
2. Usa un gráfico de dispersión con una línea de referencia ideal (`predicciones = valores reales`).

### Paso 7: Conclusión
Instrucciones:
1. Compara las métricas de los dos modelos y discute cuál se desempeñó mejor.
2. Identifica posibles mejoras, como agregar más características o ajustar los hiperparámetros.