# El score (puntuación)

El score (puntuación) es una medida de rendimiento que evalúa qué tan bien está funcionando un modelo. Hay diferentes tipos de scores dependiendo del tipo de problema:

## Clasificación:

In [None]:
# Accuracy Score (Precisión)
from sklearn.metrics import accuracy_score
accuracy = accuracy_score(y_true, y_pred)
# Mide el porcentaje de predicciones correctas

# F1 Score
from sklearn.metrics import f1_score
f1 = f1_score(y_true, y_pred)
# Media armónica entre precisión y recall

# Precision Score
from sklearn.metrics import precision_score
precision = precision_score(y_true, y_pred)
# Proporción de verdaderos positivos sobre total de positivos predichos

# Recall Score
from sklearn.metrics import recall_score
recall = recall_score(y_true, y_pred)
# Proporción de verdaderos positivos sobre total de positivos reales

## Regresión:

In [None]:
# R² Score (Coeficiente de determinación)
from sklearn.metrics import r2_score
r2 = r2_score(y_true, y_pred)
# Mide qué tan bien el modelo se ajusta a los datos

# Mean Squared Error (MSE)
from sklearn.metrics import mean_squared_error
mse = mean_squared_error(y_true, y_pred)
# Promedio de los errores al cuadrado

# Mean Absolute Error (MAE)
from sklearn.metrics import mean_absolute_error
mae = mean_absolute_error(y_true, y_pred)
# Promedio de los errores absolutos

In [2]:
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score
import numpy as np

In [None]:

def evaluar_modelo(y_true, y_pred):
    """
    Calcula múltiples métricas de evaluación
    """
    # Convertir probabilidades a clases (para clasificación binaria)
    y_pred_class = (y_pred > 0.5).astype(int)
    
    # Calcular métricas
    accuracy = accuracy_score(y_true, y_pred_class)
    precision = precision_score(y_true, y_pred_class)
    recall = recall_score(y_true, y_pred_class)
    f1 = f1_score(y_true, y_pred_class)
    
    # Calcular error cuadrático medio
    mse = np.mean((y_true - y_pred) ** 2)
    
    print(f"Accuracy: {accuracy:.4f}")
    print(f"Precision: {precision:.4f}")
    print(f"Recall: {recall:.4f}")
    print(f"F1-Score: {f1:.4f}")
    print(f"MSE: {mse:.4f}")
    
    return {
        'accuracy': accuracy,
        'precision': precision,
        'recall': recall,
        'f1': f1,
        'mse': mse
    }

# Ejemplo de uso
y_true = np.array([0, 1, 1, 0])  # Valores reales
y_pred = np.array([0.1, 0.9, 0.8, 0.2])  # Predicciones del modelo

scores = evaluar_modelo(y_true, y_pred)

Accuracy: 1.0000
Precision: 1.0000
Recall: 1.0000
F1-Score: 1.0000
MSE: 0.0250


## Interpretación de las métricas:

```markdown
**Accuracy (Precisión):** Mide el porcentaje de predicciones correctas realizadas por el modelo.

Rango: 0 a 1
1 es perfecto
Útil para clases balanceadas


**Precision (Precisión Positiva):** Proporción de verdaderos positivos sobre el total de positivos predichos:

Rango: 0 a 1
Mide falsos positivos
Importante cuando el costo de falsos positivos es alto


Recall (Sensibilidad):

Rango: 0 a 1
Mide falsos negativos
Importante cuando el costo de falsos negativos es alto


F1-Score:

Rango: 0 a 1
Balance entre precision y recall
Útil para clases desbalanceadas


R²:

Rango: -∞ a 1
1 es ajuste perfecto
Útil para regresión


MSE:

Rango: 0 a ∞
0 es perfecto
Penaliza errores grandes

```

## Ejemplo con validación cruzada:

```python
from sklearn.model_selection import cross_val_score
from sklearn.model_selection import KFold

def evaluar_con_cv(modelo, X, y, cv=5):
    """
    Evalúa el modelo usando validación cruzada
    """
    # Definir el evaluador de pliegues
    kf = KFold(n_splits=cv, shuffle=True, random_state=42)
    
    # Calcular scores para diferentes métricas
    accuracy_scores = cross_val_score(modelo, X, y, cv=kf, scoring='accuracy')
    precision_scores = cross_val_score(modelo, X, y, cv=kf, scoring='precision')
    recall_scores = cross_val_score(modelo, X, y, cv=kf, scoring='recall')
    f1_scores = cross_val_score(modelo, X, y, cv=kf, scoring='f1')
    
    # Imprimir resultados
    print(f"Accuracy: {accuracy_scores.mean():.4f} (+/- {accuracy_scores.std()*2:.4f})")
    print(f"Precision: {precision_scores.mean():.4f} (+/- {precision_scores.std()*2:.4f})")
    print(f"Recall: {recall_scores.mean():.4f} (+/- {recall_scores.std()*2:.4f})")
    print(f"F1-Score: {f1_scores.mean():.4f} (+/- {f1_scores.std()*2:.4f})")
    
    return {
        'accuracy': accuracy_scores,
        'precision': precision_scores,
        'recall': recall_scores,
        'f1': f1_scores
    }

```

## Ecuaciones principales de las métricas más utilizadas:

### Clasificación Binaria - Métricas Básicas:

```markdown
TP = True Positives (Verdaderos Positivos)
TN = True Negatives (Verdaderos Negativos)
FP = False Positives (Falsos Positivos)
FN = False Negatives (Falsos Negativos)
```

```math
\begin{align*}
\text{Accuracy} &= \frac{TP + TN}{TP + TN + FP + FN} \\
\text{Precision} &= \frac{TP}{TP + FP} \\
\text{Recall} &= \frac{TP}{TP + FN}\\
\text{F1-Score} &= 2 \cdot \frac{\text{Precision} \cdot \text{Recall}}{\text{Precision} + \text{Recall}}
\end{align*}
```

### Regresión:

```math
\begin{align*}
y &= \text{valor real} \\
\hat{y} &= \text{valor predicho} \\
n &= \text{número de muestras} \\
\bar{y} &= \text{media de los valores reales} \\
\end{align*}
```
```math
\begin{align*}
\\
\text{MSE (Error Cuadrático Medio)} &= \frac{1}{n} \sum (y - \hat{y})^2 \\
\\
\text{RMSE (Raíz del Error Cuadrático Medio)} &= \sqrt{\text{MSE}} \\
\\
\text{MAE (Error Absoluto Medio)} &= \frac{1}{n} \sum |y - \hat{y}| \\
\\
R^2 &= 1 - \frac{\sum (y - \hat{y})^2}{\sum (y - \bar{y})^2}
\end{align*}
```

# Curvas ROC y AUC:

```markdown
TPR (True Positive Rate) = Recall = TP / (TP + FN)
FPR (False Positive Rate) = FP / (FP + TN)

AUC = Área bajo la curva ROC (integral de TPR respecto a FPR)
```

## Log Loss (Cross-Entropy):

```math
\text{Log Loss} = -\frac{1}{n} \sum \left[ y \log(p) + (1-y) \log(1-p) \right] \\ 
\text{donde:}\\ 
y = \text{etiqueta real} (0 \text{ o } 1)\\ 
p = \text{probabilidad predicha}
```

### Métricas para Regresión Avanzadas:

```math
\begin{align*}
\text{MAPE (Error Porcentual Absoluto Medio)} &= \frac{100}{n} \sum \frac{|y - \hat{y}|}{|y|} \\

\text{MSLE (Error Cuadrático Logarítmico Medio)} &= \frac{1}{n} \sum \left[ \log(1 + y) - \log(1 + \hat{y}) \right]^2 \\

\text{R² Ajustado} &= 1 - \left[ \frac{(1 - R²)(n-1)}{n-p-1} \right] \\
\text{donde } p &= \text{número de predictores}
\end{align*}
```

### Métricas para Clasificación Multiclase:

```math
\begin{align*}
\text{Macro-Average Precision} &= \frac{1}{k} \sum (\text{Precision por clase}) \\
\text{donde } k &= \text{número de clases} \\

\text{Weighted-Average F1} &= \frac{\sum (\text{F1 por clase} \times \text{soporte por clase})}{\text{soporte total}}
\end{align*}
```

In [4]:
import numpy as np
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score

def calcular_metricas(y_true, y_pred):
    """
    Calcula múltiples métricas de clasificación
    """
    # Convertir a arrays numpy
    y_true = np.array(y_true)
    y_pred = np.array(y_pred)
    
    # Total de muestras
    n = len(y_true)
    
    # Matriz de confusión
    TP = np.sum((y_true == 1) & (y_pred == 1))
    TN = np.sum((y_true == 0) & (y_pred == 0))
    FP = np.sum((y_true == 0) & (y_pred == 1))
    FN = np.sum((y_true == 1) & (y_pred == 0))
    
    # Métricas básicas
    accuracy = (TP + TN) / (TP + TN + FP + FN)
    precision = TP / (TP + FP) if (TP + FP) > 0 else 0
    recall = TP / (TP + FN) if (TP + FN) > 0 else 0
    f1 = 2 * (precision * recall) / (precision + recall) if (precision + recall) > 0 else 0
    
    # Error cuadrático medio
    mse = np.mean((y_true - y_pred) ** 2)
    
    return {
        'accuracy': accuracy,
        'precision': precision,
        'recall': recall,
        'f1': f1,
        'mse': mse,
        'confusion_matrix': {
            'TP': TP,
            'TN': TN,
            'FP': FP,
            'FN': FN
        }
    }