# 🧠 Ejemplo de Aprendizaje Supervisado en Python

En este notebook vamos a explicar, con código, cómo funciona un modelo de **aprendizaje supervisado**. 
Vamos a usar un modelo de **Regresión Logística** para predecir si una persona compra o no un producto según su edad y su ingreso.

Todo paso a paso, como debe ser 😎☕

In [None]:
# ============================================================
# 🧰 1️⃣ Importar librerías necesarias
# ============================================================
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, classification_report

print('Librerías cargadas con éxito ✅')

In [None]:
# ============================================================
# 📊 2️⃣ Crear el conjunto de datos
# ============================================================
# Cada fila representa una persona
# 'Edad' y 'Ingreso' son las características (X)
# 'Compra' es la variable a predecir (y)

datos = {
    'Edad': [22, 25, 47, 52, 46, 56, 55, 60, 38, 40],
    'Ingreso': [25000, 30000, 80000, 110000, 95000, 130000, 120000, 140000, 60000, 75000],
    'Compra': [0, 0, 1, 1, 1, 1, 1, 1, 0, 1]
}

df = pd.DataFrame(datos)
df

Como ves, tenemos un dataset pequeñito. La idea es que el modelo aprenda una relación entre edad, ingreso y la probabilidad de que una persona compre. 💸

In [None]:
# ============================================================
# ✂️ 3️⃣ Dividir los datos en entrenamiento y prueba
# ============================================================
# X: características (edad e ingreso)
# y: etiqueta (compra)

X = df[['Edad', 'Ingreso']]
y = df['Compra']

# 80% para entrenamiento, 20% para prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

print('Datos divididos correctamente 🧩')

In [None]:
# ============================================================
# 🤖 4️⃣ Entrenar el modelo
# ============================================================
modelo = LogisticRegression()
modelo.fit(X_train, y_train)

print('Modelo entrenado correctamente 💪')

In [None]:
# ============================================================
# 🔍 5️⃣ Evaluar el modelo
# ============================================================
# Predecimos los valores de prueba
y_pred = modelo.predict(X_test)

# Mostramos la precisión y reporte
print(f"Precisión del modelo: {accuracy_score(y_test, y_pred):.2f}")
print('\nReporte de clasificación:\n')
print(classification_report(y_test, y_pred))

In [None]:
# ============================================================
# 🧩 6️⃣ Probar con nuevos datos
# ============================================================
# Creamos nuevos ejemplos para probar el modelo
nuevos_datos = pd.DataFrame({
    'Edad': [28, 50, 42],
    'Ingreso': [28000, 120000, 70000]
})

predicciones = modelo.predict(nuevos_datos)
nuevos_datos['Compra_Predicha'] = predicciones
nuevos_datos

El modelo predice quién probablemente compraría y quién no, según la experiencia que tuvo con los datos anteriores. 🎯

**Así es que funciona el aprendizaje supervisado:**
1. Le mostramos ejemplos con respuestas correctas (entrenamiento 🧠)
2. Aprende patrones
3. Luego lo probamos con datos nuevos pa’ ver qué tan bien aprendió.

Y eso es todo, mi llave 💥