# Exercício: Implementando Métricas de Classificação

## Objetivo

Implementar métricas fundamentais de avaliação para modelos de classificação.

## Instruções

- Complete as funções nas células marcadas com `# TODO`
- Mantenha a assinatura das funções
- Use apenas numpy e pandas
- Execute as células de teste para verificar sua implementação


In [None]:
# Importações permitidas
import numpy as np
import pandas as pd

# Configurar seed
np.random.seed(42)

## Exercício 1: Acurácia (Accuracy)


In [None]:
def accuracy_score(y_true, y_pred):
    """
    Calcula a acurácia entre valores reais e preditos.

    Parâmetros:
    y_true (array-like): Valores reais
    y_pred (array-like): Valores preditos

    Retorna:
    float: Acurácia calculada (entre 0 e 1)
    """
    # TODO: Implementar cálculo da acurácia
    # Acurácia = (TP + TN) / (TP + TN + FP + FN)
    # Ou simplesmente: acertos / total

    y_true = np.array(y_true)
    y_pred = np.array(y_pred)

    # Calcular número de acertos
    correct = np.sum(y_true == y_pred)
    total = len(y_true)

    return correct / total

## Exercício 2: Precisão (Precision)


In [None]:
def precision_score(y_true, y_pred, pos_label=1):
    """
    Calcula a precisão para classificação binária.

    Parâmetros:
    y_true (array-like): Valores reais
    y_pred (array-like): Valores preditos
    pos_label: Rótulo da classe positiva

    Retorna:
    float: Precisão calculada
    """
    # TODO: Implementar cálculo da precisão
    # Precisão = TP / (TP + FP)

    y_true = np.array(y_true)
    y_pred = np.array(y_pred)

    # Calcular True Positives e False Positives
    tp = np.sum((y_true == pos_label) & (y_pred == pos_label))
    fp = np.sum((y_true != pos_label) & (y_pred == pos_label))

    # Evitar divisão por zero
    if tp + fp == 0:
        return 0.0

    return tp / (tp + fp)

## Exercício 3: Recall (Sensibilidade)


In [None]:
def recall_score(y_true, y_pred, pos_label=1):
    """
    Calcula o recall para classificação binária.

    Parâmetros:
    y_true (array-like): Valores reais
    y_pred (array-like): Valores preditos
    pos_label: Rótulo da classe positiva

    Retorna:
    float: Recall calculado
    """
    # TODO: Implementar cálculo do recall
    # Recall = TP / (TP + FN)

    y_true = np.array(y_true)
    y_pred = np.array(y_pred)

    # Calcular True Positives e False Negatives
    tp = np.sum((y_true == pos_label) & (y_pred == pos_label))
    fn = np.sum((y_true == pos_label) & (y_pred != pos_label))

    # Evitar divisão por zero
    if tp + fn == 0:
        return 0.0

    return tp / (tp + fn)

## Exercício 4: F1-Score


In [None]:
def f1_score(y_true, y_pred, pos_label=1):
    """
    Calcula o F1-Score para classificação binária.

    Parâmetros:
    y_true (array-like): Valores reais
    y_pred (array-like): Valores preditos
    pos_label: Rótulo da classe positiva

    Retorna:
    float: F1-Score calculado
    """
    # TODO: Implementar cálculo do F1-Score
    # F1 = 2 * (precision * recall) / (precision + recall)
    # Dica: Use as funções precision_score e recall_score implementadas acima

    precision = precision_score(y_true, y_pred, pos_label)
    recall = recall_score(y_true, y_pred, pos_label)

    # Evitar divisão por zero
    if precision + recall == 0:
        return 0.0

    return 2 * (precision * recall) / (precision + recall)

## Exercício 5: Matriz de Confusão


In [None]:
def confusion_matrix(y_true, y_pred):
    """
    Calcula a matriz de confusão para classificação binária.

    Parâmetros:
    y_true (array-like): Valores reais
    y_pred (array-like): Valores preditos

    Retorna:
    numpy.ndarray: Matriz de confusão 2x2
    [[TN, FP],
     [FN, TP]]
    """
    # TODO: Implementar cálculo da matriz de confusão
    # Assumindo classes 0 e 1

    y_true = np.array(y_true)
    y_pred = np.array(y_pred)

    # Calcular componentes da matriz
    tn = np.sum((y_true == 0) & (y_pred == 0))  # True Negatives
    fp = np.sum((y_true == 0) & (y_pred == 1))  # False Positives
    fn = np.sum((y_true == 1) & (y_pred == 0))  # False Negatives
    tp = np.sum((y_true == 1) & (y_pred == 1))  # True Positives

    # Retornar matriz 2x2
    return np.array([[tn, fp], [fn, tp]])

## Exercício 6: Função de Avaliação Completa


In [None]:
def classification_report(y_true, y_pred):
    """
    Calcula todas as métricas de classificação.

    Parâmetros:
    y_true (array-like): Valores reais
    y_pred (array-like): Valores preditos

    Retorna:
    dict: Dicionário com todas as métricas
    """
    # TODO: Implementar função que retorna todas as métricas
    # Retornar dicionário com chaves: 'accuracy', 'precision', 'recall', 'f1'

    return {
        "accuracy": accuracy_score(y_true, y_pred),
        "precision": precision_score(y_true, y_pred),
        "recall": recall_score(y_true, y_pred),
        "f1": f1_score(y_true, y_pred),
        "confusion_matrix": confusion_matrix(y_true, y_pred),
    }

## Exercício 7: Métricas Multiclasse


In [None]:
def accuracy_multiclass(y_true, y_pred):
    """
    Calcula acurácia para classificação multiclasse.

    Parâmetros:
    y_true (array-like): Valores reais
    y_pred (array-like): Valores preditos

    Retorna:
    float: Acurácia multiclasse
    """
    # TODO: Implementar acurácia multiclasse
    # A fórmula é a mesma da binária: acertos / total

    y_true = np.array(y_true)
    y_pred = np.array(y_pred)

    return np.sum(y_true == y_pred) / len(y_true)

In [None]:
def precision_recall_per_class(y_true, y_pred):
    """
    Calcula precisão e recall para cada classe em classificação multiclasse.

    Parâmetros:
    y_true (array-like): Valores reais
    y_pred (array-like): Valores preditos

    Retorna:
    dict: Dicionário com precisão e recall por classe
    """
    # TODO: Implementar métricas por classe
    # Para cada classe, calcular precisão e recall tratando como binária (one-vs-rest)

    y_true = np.array(y_true)
    y_pred = np.array(y_pred)

    classes = np.unique(y_true)
    results = {}

    for cls in classes:
        # Tratar como problema binário (classe atual vs. todas as outras)
        y_true_binary = (y_true == cls).astype(int)
        y_pred_binary = (y_pred == cls).astype(int)

        precision = precision_score(y_true_binary, y_pred_binary)
        recall = recall_score(y_true_binary, y_pred_binary)

        results[f"class_{cls}"] = {
            "precision": precision,
            "recall": recall,
            "f1": f1_score(y_true_binary, y_pred_binary),
        }

    return results

## Testes das Implementações


In [None]:
# Teste com dados simples
y_true = [1, 0, 1, 1, 0, 1, 0, 0]
y_pred = [1, 0, 1, 0, 0, 1, 0, 1]

print("Teste com classificação binária:")
print(f"Acurácia: {accuracy_score(y_true, y_pred):.3f}")
print(f"Precisão: {precision_score(y_true, y_pred):.3f}")
print(f"Recall: {recall_score(y_true, y_pred):.3f}")
print(f"F1-Score: {f1_score(y_true, y_pred):.3f}")

print("\nMatriz de Confusão:")
cm = confusion_matrix(y_true, y_pred)
print(cm)

In [None]:
# Teste com classificação perfeita
y_true_perfect = [1, 0, 1, 1, 0]
y_pred_perfect = [1, 0, 1, 1, 0]

print("Teste com classificação perfeita:")
report = classification_report(y_true_perfect, y_pred_perfect)
for metric, value in report.items():
    if metric != "confusion_matrix":
        print(f"{metric}: {value:.3f}")

In [None]:
# Teste multiclasse
y_true_multi = [0, 1, 2, 0, 1, 2, 0, 1, 2]
y_pred_multi = [0, 1, 2, 0, 1, 1, 0, 2, 2]

print("Teste com classificação multiclasse:")
print(f"Acurácia multiclasse: {accuracy_multiclass(y_true_multi, y_pred_multi):.3f}")

print("\nMétricas por classe:")
per_class = precision_recall_per_class(y_true_multi, y_pred_multi)
for class_name, metrics in per_class.items():
    print(
        f"{class_name}: Precisão={metrics['precision']:.3f}, Recall={metrics['recall']:.3f}, F1={metrics['f1']:.3f}"
    )