# 09.03 - Modelos de Clasificación

**Autor:** Miguel Angel Vazquez Varela  
**Nivel:** Intermedio  
**Tiempo estimado:** 45 min

---

## ¿Qué aprenderemos?

- Concepto de clasificación binaria y multiclase
- Regresión Logística (el modelo base de clasificación)
- Evaluación con Matriz de Confusión
- Métricas de clasificación: Accuracy, Precision, Recall y F1-Score

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import confusion_matrix, classification_report, accuracy_score

sns.set_theme(style="white")

---

## 1. Carga de Datos

Utilizaremos el famoso dataset `iris` para clasificar tipos de flores.

In [None]:
df = sns.load_dataset('iris')
df.head()

---

## 2. Entrenamiento del Modelo

Dividimos los datos y entrenamos una **Regresión Logística**.

In [None]:
X = df.drop('species', axis=1)
y = df['species']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

model = LogisticRegression(max_iter=200)
model.fit(X_train, y_train)
y_pred = model.predict(X_test)

---

## 3. Evaluación: Matriz de Confusión

La matriz de confusión nos permite ver dónde se está equivocando el modelo.

In [None]:
cm = confusion_matrix(y_test, y_pred)

plt.figure(figsize=(8, 6))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', 
            xticklabels=model.classes_, yticklabels=model.classes_)
plt.xlabel('Predicción')
plt.ylabel('Real')
plt.title('Matriz de Confusión')
plt.show()

---

## 4. Reporte de Clasificación

El reporte incluye métricas clave para cada clase.

In [None]:
print("Reporte de Clasificación:")
print(classification_report(y_test, y_pred))