<a href="https://colab.research.google.com/github/marcocmcmelo/CalculoMetricas/blob/main/calculo_metricas.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
# -*- coding: utf-8 -*-
"""
Projeto: Cálculo de Métricas de Avaliação com Dados Reais
Integração com scikit-learn: modelo + matriz de confusão + métricas
"""

# Importando bibliotecas necessárias
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import confusion_matrix
import numpy as np

# 1. Carregar o conjunto de dados
data = load_breast_cancer()
X, y = data.data, data.target  # Características e rótulos

# 2. Dividir em treino e teste
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.3, random_state=42, stratify=y
)

# 3. Treinar um modelo (ex: Regressão Logística)
model = LogisticRegression(max_iter=1000, random_state=42)
model.fit(X_train, y_train)

# 4. Fazer previsões no conjunto de teste
y_pred = model.predict(X_test)

# 5. Gerar matriz de confusão
tn, fp, fn, tp = confusion_matrix(y_test, y_pred).ravel()

print("📊 Cálculo de Métricas de Avaliação com Dados Reais")
print("="*60)
print("Conjunto de dados: Breast Cancer (Câncer de Mama - Benigno vs Maligno)")
print(f"Total de amostras de teste: {len(y_test)}")
print("-"*60)
print("Matriz de Confusão:")
print(f"  Verdadeiros Positivos (TP): {tp}")
print(f"  Falsos Positivos (FP):     {fp}")
print(f"  Falsos Negativos (FN):     {fn}")
print(f"  Verdadeiros Negativos (TN): {tn}")
print("-"*60)

# Funções de métricas (repetidas aqui para clareza)
def acuracia(tp, tn, fp, fn):
    total = tp + tn + fp + fn
    return (tp + tn) / total if total != 0 else 0

def sensibilidade(tp, fn):
    total_pos = tp + fn
    return tp / total_pos if total_pos != 0 else 0

def especificidade(tn, fp):
    total_neg = tn + fp
    return tn / total_neg if total_neg != 0 else 0

def precisao(tp, fp):
    total_prev_pos = tp + fp
    return tp / total_prev_pos if total_prev_pos != 0 else 0

def f1_score(tp, fp, fn):
    prec = precisao(tp, fp)
    rec = sensibilidade(tp, fn)
    return 2 * (prec * rec) / (prec + rec) if (prec + rec) != 0 else 0

# 6. Calcular métricas manualmente
acc = acuracia(tp, tn, fp, fn)
sen = sensibilidade(tp, fn)
esp = especificidade(tn, fp)
prec = precisao(tp, fp)
f1 = f1_score(tp, fp, fn)

# Exibir resultados calculados manualmente
print("🔍 Métricas Calculadas Manualmente:")
print(f"  Acurácia:        {acc:.4f} ({acc:.2%})")
print(f"  Sensibilidade:   {sen:.4f} ({sen:.2%})")
print(f"  Especificidade:  {esp:.4f} ({esp:.2%})")
print(f"  Precisão:        {prec:.4f} ({prec:.2%})")
print(f"  F1-Score:        {f1:.4f} ({f1:.2%})")
print("-"*60)

# (Opcional) Comparar com métricas do scikit-learn
from sklearn.metrics import accuracy_score, recall_score, precision_score, f1_score as f1_sklearn

print("🧪 Métricas com scikit-learn (validação):")
print(f"  Acurácia:        {accuracy_score(y_test, y_pred):.4f} ({accuracy_score(y_test, y_pred):.2%})")
print(f"  Sensibilidade:   {recall_score(y_test, y_pred):.4f} ({recall_score(y_test, y_pred):.2%})")
print(f"  Precisão:        {precision_score(y_test, y_pred):.4f} ({precision_score(y_test, y_pred):.2%})")
print(f"  F1-Score:        {f1_sklearn(y_test, y_pred):.4f} ({f1_sklearn(y_test, y_pred):.2%})")
print("="*60)

📊 Cálculo de Métricas de Avaliação com Dados Reais
Conjunto de dados: Breast Cancer (Câncer de Mama - Benigno vs Maligno)
Total de amostras de teste: 171
------------------------------------------------------------
Matriz de Confusão:
  Verdadeiros Positivos (TP): 105
  Falsos Positivos (FP):     8
  Falsos Negativos (FN):     2
  Verdadeiros Negativos (TN): 56
------------------------------------------------------------
🔍 Métricas Calculadas Manualmente:
  Acurácia:        0.9415 (94.15%)
  Sensibilidade:   0.9813 (98.13%)
  Especificidade:  0.8750 (87.50%)
  Precisão:        0.9292 (92.92%)
  F1-Score:        0.9545 (95.45%)
------------------------------------------------------------
🧪 Métricas com scikit-learn (validação):
  Acurácia:        0.9415 (94.15%)
  Sensibilidade:   0.9813 (98.13%)
  Precisão:        0.9292 (92.92%)
  F1-Score:        0.9545 (95.45%)


STOP: TOTAL NO. OF ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
