<a href="https://colab.research.google.com/github/HectorDelgadoJ/Laboratorio-5/blob/main/Laboratorio5.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Medidas de Desempeño en ML

En esta práctica, implementaremos una serie de métricas utilizadas para evaluar el rendimiento de los modelos de clasificación binaria. Estas métricas son esenciales para comprender la eficacia de un modelo, especialmente cuando se enfrentan clases desbalanceadas. A través de un conjunto de datos de prueba, calcularemos la matriz de confusión y derivaremos medidas como precisión, recall, F1-score, entre otras. Además, implementaremos estas funciones desde cero en Python, sin el uso de bibliotecas especializadas, lo que nos permitirá comprender mejor los fundamentos de cada métrica y su aplicación en escenarios reales de clasificación.

* Programa, sin bibliotecas, las funciones para calcular las siguientes medidas de desempeño:
1- Accuracy
2- Error.


In [2]:
# Función para calcular Accuracy y Error
def calculate_accuracy_error(y_true, y_pred):
    correct_predictions = sum(1 for true, pred in zip(y_true, y_pred) if true == pred)
    total_predictions = len(y_true)
    accuracy = correct_predictions / total_predictions
    error = 1 - accuracy
    return accuracy, error

* 3- Programa un método para calcular la matriz de confusión en datasets con dos clases y a partir de ésta calcula las siguientes medidas.
* a)Precision
* b)Recall
* c)Positive Predictive Value
* d)True Positive Rate
* e)True Negative Rate
* f)False Positive Rate
* g)False Negative Rate
* h)F1-Score

In [None]:
# Función para calcular la matriz de confusión para un dataset binario
def confusion_matrix(y_true, y_pred):
    TP = sum(1 for true, pred in zip(y_true, y_pred) if true == 1 and pred == 1)
    TN = sum(1 for true, pred in zip(y_true, y_pred) if true == 0 and pred == 0)
    FP = sum(1 for true, pred in zip(y_true, y_pred) if true == 0 and pred == 1)
    FN = sum(1 for true, pred in zip(y_true, y_pred) if true == 1 and pred == 0)
    return TP, TN, FP, FN

# Funciones para calcular las métricas de desempeño
def calculate_metrics(TP, TN, FP, FN):
    precision = TP / (TP + FP) if (TP + FP) > 0 else 0
    recall = TP / (TP + FN) if (TP + FN) > 0 else 0
    true_positive_rate = recall
    true_negative_rate = TN / (TN + FP) if (TN + FP) > 0 else 0
    false_positive_rate = FP / (FP + TN) if (FP + TN) > 0 else 0
    false_negative_rate = FN / (FN + TP) if (FN + TP) > 0 else 0
    f1_score = 2 * (precision * recall) / (precision + recall) if (precision + recall) > 0 else 0
    return {
        "Precision": precision,
        "Recall": recall,
        "Positive Predictive Value (PPV)": precision,
        "True Positive Rate (TPR)": true_positive_rate,
        "True Negative Rate (TNR)": true_negative_rate,
        "False Positive Rate (FPR)": false_positive_rate,
        "False Negative Rate (FNR)": false_negative_rate,
        "F1-Score": f1_score
    }

# Ejemplo de uso
y_true = [1, 0, 1, 1, 0, 1, 0, 0, 1, 1]  # Valores reales
y_pred = [1, 0, 1, 0, 0, 1, 0, 1, 1, 0]  # Valores predichos

# Calcular accuracy y error
accuracy, error = calculate_accuracy_error(y_true, y_pred)
print("Accuracy:", accuracy)
print("Error:", error)

# Calcular matriz de confusión
TP, TN, FP, FN = confusion_matrix(y_true, y_pred)

# Calcular métricas de desempeño
metrics = calculate_metrics(TP, TN, FP, FN)
for metric, value in metrics.items():
    print(f"{metric}: {value}")

* Matriz de confusión: Una matriz de confusión organiza los resultados de predicción en categorías: Verdaderos Positivos (TP), Falsos Positivos (FP), Verdaderos Negativos (TN), y Falsos Negativos (FN).
* Cálculo de métricas derivadas de la matriz de confusión:
- a) Precision: TP/(TP+FP)
- b) Recall o True Positive Rate: TP/(TP+FN)
- c) Positive Predictive Value (PPV): Igual a Precision
- d) True Negative Rate: TN/(TN+FP)
- e) False Positive Rate: FP/(FP+TN)
- f) False Negative Rate: FN/(FN+TP)
- g) F1-Score: 2×(Precision×Recall)/(Precision+Recall)

#Parte II: Implementación con una biblioteca de Python (scikit-learn)
En Python, la biblioteca scikit-learn facilita el cálculo de estas métricas. Aquí tienes cómo implementarlas usando scikit-learn:

In [None]:
from sklearn.metrics import accuracy_score, confusion_matrix, precision_score, recall_score, f1_score

# Valores reales y predichos
y_true = [1, 0, 1, 1, 0, 1, 0, 0, 1, 1]
y_pred = [1, 0, 1, 0, 0, 1, 0, 1, 1, 0]

# Accuracy y Error
accuracy = accuracy_score(y_true, y_pred)
error = 1 - accuracy
print("Accuracy:", accuracy)
print("Error:", error)

# Matriz de Confusión
conf_matrix = confusion_matrix(y_true, y_pred)
print("Matriz de Confusión:\n", conf_matrix)

# Métricas
precision = precision_score(y_true, y_pred)
recall = recall_score(y_true, y_pred)
f1 = f1_score(y_true, y_pred)
print("Precision:", precision)
print("Recall:", recall)
print("F1-Score:", f1)

# Calcular TNR, FPR, FNR usando la matriz de confusión
TN, FP, FN, TP = conf_matrix.ravel()
TNR = TN / (TN + FP)
FPR = FP / (FP + TN)
FNR = FN / (FN + TP)
print("True Negative Rate (TNR):", TNR)
print("False Positive Rate (FPR):", FPR)
print("False Negative Rate (FNR):", FNR)
