# Ejercicio 1 - Análisis de Matriz de Confusión

Se entrenó una red neuronal multiperceptrón para resolver un problema de clasificación y al medir su desempeño sobre el conjunto de datos de entrenamiento se obtuvo la siguiente matriz de confusión:

|   | 17 | 0  | 1  | 0  | 1  |
|---|----|----|----|----|----|
|   | 0  | 12 | 0  | 0  | 0  |
|   | 0  | 0  | 12 | 0  | 0  |
|   | 2  | 0  | 0  | 38 | 0  |
|   | 0  | 8  | 0  | 0  | 61 |

In [None]:
import numpy as np
import pandas as pd
from sklearn.metrics import precision_score, recall_score, f1_score, accuracy_score

## Definimos la matriz de confusión

In [None]:
# Matriz de confusión del ejercicio
confusion_matrix = np.array([
    [17, 0, 1, 0, 1],
    [0, 12, 0, 0, 0],
    [0, 0, 12, 0, 0],
    [2, 0, 0, 38, 0],
    [0, 8, 0, 0, 61]
])

print("Matriz de Confusión:")
print(confusion_matrix)

## a) Información básica

In [None]:
# Número total de ejemplos utilizados en el entrenamiento
total_ejemplos = np.sum(confusion_matrix)
print(f"Número total de ejemplos: {total_ejemplos}")

# Número de clases
num_clases = confusion_matrix.shape[0]
print(f"\nNúmero de clases: {num_clases}")

# Precisión (accuracy) global
correctos = np.trace(confusion_matrix)  # Suma de la diagonal
accuracy = correctos / total_ejemplos
print(f"\nPrecisión (Accuracy) global: {accuracy:.4f} o {accuracy*100:.2f}%")

## Precisión (Precision) por clase

La precisión para cada clase se calcula como:
$$\text{Precision}_i = \frac{TP_i}{TP_i + FP_i} = \frac{\text{Diagonal}_i}{\text{Suma columna}_i}$$

In [None]:
# Cálculo de precisión por clase
precision_por_clase = []

for i in range(num_clases):
    tp = confusion_matrix[i, i]  # Verdaderos positivos (diagonal)
    fp = np.sum(confusion_matrix[:, i]) - tp  # Falsos positivos (suma de columna - diagonal)
    
    if (tp + fp) > 0:
        precision = tp / (tp + fp)
    else:
        precision = 0
    
    precision_por_clase.append(precision)
    print(f"Precisión de la Clase {i}: {precision:.4f} o {precision*100:.2f}%")

print(f"\nPrecisión promedio: {np.mean(precision_por_clase):.4f}")

## Sensibilidad (Recall) por clase

La sensibilidad o recall para cada clase se calcula como:
$$\text{Recall}_i = \frac{TP_i}{TP_i + FN_i} = \frac{\text{Diagonal}_i}{\text{Suma fila}_i}$$

In [None]:
# Cálculo de sensibilidad (recall) por clase
recall_por_clase = []

for i in range(num_clases):
    tp = confusion_matrix[i, i]  # Verdaderos positivos (diagonal)
    fn = np.sum(confusion_matrix[i, :]) - tp  # Falsos negativos (suma de fila - diagonal)
    
    if (tp + fn) > 0:
        recall = tp / (tp + fn)
    else:
        recall = 0
    
    recall_por_clase.append(recall)
    print(f"Sensibilidad (Recall) de la Clase {i}: {recall:.4f} o {recall*100:.2f}%")

print(f"\nSensibilidad promedio: {np.mean(recall_por_clase):.4f}")

## b) Identificar la clase con el mejor F1-score

El F1-score es la media armónica entre precisión y recall:
$$F1_i = 2 \times \frac{\text{Precision}_i \times \text{Recall}_i}{\text{Precision}_i + \text{Recall}_i}$$

In [None]:
# Cálculo del F1-score por clase
f1_por_clase = []

for i in range(num_clases):
    prec = precision_por_clase[i]
    rec = recall_por_clase[i]
    
    if (prec + rec) > 0:
        f1 = 2 * (prec * rec) / (prec + rec)
    else:
        f1 = 0
    
    f1_por_clase.append(f1)
    print(f"F1-score de la Clase {i}: {f1:.4f} o {f1*100:.2f}%")

# Identificar la clase con mejor F1-score
mejor_clase = np.argmax(f1_por_clase)
mejor_f1 = f1_por_clase[mejor_clase]

print(f"\n{'='*50}")
print(f"La clase con el mejor F1-score es: Clase {mejor_clase}")
print(f"Con un F1-score de: {mejor_f1:.4f} o {mejor_f1*100:.2f}%")
print(f"{'='*50}")

## Resumen en formato tabla

In [None]:
# Crear un DataFrame con los resultados
resultados = pd.DataFrame({
    'Clase': [f'Clase {i}' for i in range(num_clases)],
    'Precisión': [f'{p:.4f}' for p in precision_por_clase],
    'Sensibilidad (Recall)': [f'{r:.4f}' for r in recall_por_clase],
    'F1-Score': [f'{f:.4f}' for f in f1_por_clase]
})

print("\n" + "="*60)
print("RESUMEN DE MÉTRICAS POR CLASE")
print("="*60)
print(resultados.to_string(index=False))
print("="*60)

## Respuestas Completas

### a) Información solicitada:

1. **Cuántos ejemplos se utilizaron en el entrenamiento**: 152 ejemplos

2. **Cuántas clases puede reconocer este multiperceptrón**: 5 clases (Clase 0, 1, 2, 3 y 4)

3. **Precisión (accuracy) de la red sobre el conjunto de ejemplos completo**: 
   - Se calcula sumando los elementos de la diagonal (predicciones correctas) y dividiéndolo por el total
   - (17 + 12 + 12 + 38 + 61) / 152 = 140 / 152 ≈ 0.9211 o 92.11%

4. **Valores de precisión (precision) por cada clase**:
   - Clase 0: 17/19 ≈ 0.8947 (89.47%)
   - Clase 1: 12/20 = 0.6000 (60.00%)
   - Clase 2: 12/13 ≈ 0.9231 (92.31%)
   - Clase 3: 38/38 = 1.0000 (100.00%)
   - Clase 4: 61/62 ≈ 0.9839 (98.39%)

5. **Valores de sensibilidad (recall) por cada clase**:
   - Clase 0: 17/19 ≈ 0.8947 (89.47%)
   - Clase 1: 12/12 = 1.0000 (100.00%)
   - Clase 2: 12/12 = 1.0000 (100.00%)
   - Clase 3: 38/40 = 0.9500 (95.00%)
   - Clase 4: 61/69 ≈ 0.8841 (88.41%)

### b) Clase con el mejor valor de F1-score:

La **Clase 2** tiene el mejor F1-score con un valor de aproximadamente **0.9600 (96.00%)**