<a href="https://colab.research.google.com/github/Afonsoleone25/C-lculo-de-M-tricas-de-Avalia-o-de-Aprendizado-/blob/main/C%C3%A1lculo_de_M%C3%A9tricas_de_Avalia%C3%A7%C3%A3o_de_Aprendizado_.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [2]:
import numpy as np

class AnalisadorMatrizConfusao:
    """
    Classe para análise de matriz de confusão e cálculo de métricas de avaliação.
    """

    def __init__(self, matriz_confusao, classes):
        """
        Inicializa o analisador com uma matriz de confusão.

        Parâmetros:
        matriz_confusao: matriz 2x2 ou NxN com os valores de confusão
        classes: lista com os nomes das classes
        """
        self.matriz = np.array(matriz_confusao)
        self.classes = classes
        self.n_classes = len(classes)

        # Verificar se é matriz 2x2 (binária) ou multiclasse
        if self.n_classes == 2:
            self.tipo = 'binario'
            # Para binário, assumimos que a classe positiva é a primeira
            self.VP = matriz_confusao[0][0]
            self.FP = matriz_confusao[0][1]
            self.FN = matriz_confusao[1][0]
            self.VN = matriz_confusao[1][1]
        else:
            self.tipo = 'multiclasse'

    def calcular_metricas_binarias(self):
        """Calcula todas as métricas para classificação binária."""
        print("=" * 70)
        print("CÁLCULO DE MÉTRICAS PARA CLASSIFICAÇÃO BINÁRIA")
        print("=" * 70)

        # 1. Calcular métricas básicas
        total = self.VP + self.VN + self.FP + self.FN

        print(f"\n1. VALORES DA MATRIZ DE CONFUSÃO:")
        print(f"   Verdadeiros Positivos (VP): {self.VP}")
        print(f"   Falsos Positivos (FP): {self.FP}")
        print(f"   Falsos Negativos (FN): {self.FN}")
        print(f"   Verdadeiros Negativos (VN): {self.VN}")
        print(f"   Total de observações: {total}")

        # 2. Cálculo das métricas principais
        print(f"\n2. CÁLCULO DAS MÉTRICAS:")

        # Acuracia (Accuracy)
        acuracia = (self.VP + self.VN) / total
        print(f"\n   a) ACURÁCIA (Accuracy):")
        print(f"      Fórmula: (VP + VN) / Total")
        print(f"      Cálculo: ({self.VP} + {self.VN}) / {total}")
        print(f"      Resultado: {acuracia:.4f} ({acuracia*100:.2f}%)")

        # Sensibilidade/Recall
        if (self.VP + self.FN) > 0:
            sensibilidade = self.VP / (self.VP + self.FN)
            print(f"\n   b) SENSIBILIDADE/REVOCAÇÃO (Recall/Sensitivity):")
            print(f"      Fórmula: VP / (VP + FN)")
            print(f"      Cálculo: {self.VP} / ({self.VP} + {self.FN})")
            print(f"      Resultado: {sensibilidade:.4f} ({sensibilidade*100:.2f}%)")
        else:
            sensibilidade = 0
            print(f"\n   b) SENSIBILIDADE/REVOCAÇÃO: Indefinida (VP+FN=0)")

        # Especificidade
        if (self.VN + self.FP) > 0:
            especificidade = self.VN / (self.VN + self.FP)
            print(f"\n   c) ESPECIFICIDADE (Specificity):")
            print(f"      Fórmula: VN / (VN + FP)")
            print(f"      Cálculo: {self.VN} / ({self.VN} + {self.FP})")
            print(f"      Resultado: {especificidade:.4f} ({especificidade*100:.2f}%)")
        else:
            especificidade = 0
            print(f"\n   c) ESPECIFICIDADE: Indefinida (VN+FP=0)")

        # Precisão (Precision)
        if (self.VP + self.FP) > 0:
            precisao = self.VP / (self.VP + self.FP)
            print(f"\n   d) PRECISÃO (Precision):")
            print(f"      Fórmula: VP / (VP + FP)")
            print(f"      Cálculo: {self.VP} / ({self.VP} + {self.FP})")
            print(f"      Resultado: {precisao:.4f} ({precisao*100:.2f}%)")
        else:
            precisao = 0
            print(f"\n   d) PRECISÃO: Indefinida (VP+FP=0)")

        # F1-Score
        if (precisao + sensibilidade) > 0:
            f1_score = 2 * (precisao * sensibilidade) / (precisao + sensibilidade)
            print(f"\n   e) F1-SCORE (Média Harmônica):")
            print(f"      Fórmula: 2 * (Precisão * Sensibilidade) / (Precisão + Sensibilidade)")
            print(f"      Cálculo: 2 * ({precisao:.4f} * {sensibilidade:.4f}) / ({precisao:.4f} + {sensibilidade:.4f})")
            print(f"      Resultado: {f1_score:.4f} ({f1_score*100:.2f}%)")
        else:
            f1_score = 0
            print(f"\n   e) F1-SCORE: Indefinida")

        # 3. Métricas adicionais
        print(f"\n3. MÉTRICAS ADICIONAIS:")

        # Taxa de Falsos Positivos
        if (self.FP + self.VN) > 0:
            fpr = self.FP / (self.FP + self.VN)
            print(f"   a) Taxa de Falsos Positivos (FPR): {fpr:.4f}")
        else:
            print(f"   a) Taxa de Falsos Positivos (FPR): Indefinida")

        # Taxa de Falsos Negativos
        if (self.FN + self.VP) > 0:
            fnr = self.FN / (self.FN + self.VP)
            print(f"   b) Taxa de Falsos Negativos (FNR): {fnr:.4f}")
        else:
            print(f"   b) Taxa de Falsos Negativos (FNR): Indefinida")

        # Valor Preditivo Negativo
        if (self.VN + self.FN) > 0:
            npv = self.VN / (self.VN + self.FN)
            print(f"   c) Valor Preditivo Negativo (NPV): {npv:.4f}")
        else:
            print(f"   c) Valor Preditivo Negativo (NPV): Indefinida")

        return {
            'acuracia': acuracia,
            'sensibilidade': sensibilidade,
            'especificidade': especificidade,
            'precisao': precisao,
            'f1_score': f1_score
        }

    def calcular_metricas_multiclasse(self):
        """Calcula métricas para classificação multiclasse."""
        print("=" * 70)
        print("CÁLCULO DE MÉTRICAS PARA CLASSIFICAÇÃO MULTICLASSE")
        print("=" * 70)

        n = self.n_classes
        metricas = {}

        print(f"\nMatriz de Confusão ({n}x{n}):")
        print(self.matriz)

        # Calcular métricas para cada classe
        for i in range(n):
            print(f"\n{'='*50}")
            print(f"MÉTRICAS PARA A CLASSE: {self.classes[i]}")
            print(f"{'='*50}")

            # VP: diagonal principal
            VP = self.matriz[i, i]

            # FP: soma da coluna i (exceto diagonal)
            FP = np.sum(self.matriz[:, i]) - VP

            # FN: soma da linha i (exceto diagonal)
            FN = np.sum(self.matriz[i, :]) - VP

            # VN: todos os outros valores corretos
            VN = np.sum(self.matriz) - (VP + FP + FN)

            print(f"VP: {VP}, FP: {FP}, FN: {FN}, VN: {VN}")

            # Calcular métricas
            total = VP + FP + FN + VN

            if total > 0:
                acuracia_classe = (VP + VN) / total
            else:
                acuracia_classe = 0

            if (VP + FN) > 0:
                sensibilidade_classe = VP / (VP + FN)
            else:
                sensibilidade_classe = 0

            if (VN + FP) > 0:
                especificidade_classe = VN / (VN + FP)
            else:
                especificidade_classe = 0

            if (VP + FP) > 0:
                precisao_classe = VP / (VP + FP)
            else:
                precisao_classe = 0

            if (precisao_classe + sensibilidade_classe) > 0:
                f1_classe = 2 * (precisao_classe * sensibilidade_classe) / (precisao_classe + sensibilidade_classe)
            else:
                f1_classe = 0

            print(f"Acurácia da classe: {acuracia_classe:.4f}")
            print(f"Sensibilidade (Recall): {sensibilidade_classe:.4f}")
            print(f"Especificidade: {especificidade_classe:.4f}")
            print(f"Precisão: {precisao_classe:.4f}")
            print(f"F1-Score: {f1_classe:.4f}")

            metricas[self.classes[i]] = {
                'acuracia': acuracia_classe,
                'sensibilidade': sensibilidade_classe,
                'especificidade': especificidade_classe,
                'precisao': precisao_classe,
                'f1_score': f1_classe
            }

        # Calcular médias globais
        print(f"\n{'='*70}")
        print("MÉTRICAS GLOBAIS (Médias)")
        print(f"{'='*70}")

        # Média macro
        acuracias = [m['acuracia'] for m in metricas.values()]
        sensibilidades = [m['sensibilidade'] for m in metricas.values()]
        especificidades = [m['especificidade'] for m in metricas.values()]
        precisoes = [m['precisao'] for m in metricas.values()]
        f1_scores = [m['f1_score'] for m in metricas.values()]

        print(f"Acurácia Macro: {np.mean(acuracias):.4f}")
        print(f"Sensibilidade Macro: {np.mean(sensibilidades):.4f}")
        print(f"Especificidade Macro: {np.mean(especificidades):.4f}")
        print(f"Precisão Macro: {np.mean(precisoes):.4f}")
        print(f"F1-Score Macro: {np.mean(f1_scores):.4f}")

        # Acurácia global
        acuracia_global = np.trace(self.matriz) / np.sum(self.matriz)
        print(f"\nAcurácia Global: {acuracia_global:.4f}")

        return metricas

    def exibir_matriz_formatada(self):
        """Exibe a matriz de confusão formatada."""
        print("\n" + "="*70)
        print("MATRIZ DE CONFUSÃO")
        print("="*70)

        if self.tipo == 'binario':
            print("\nFormato 2x2 (Classificação Binária):")
            print(f"                     Previsto")
            print(f"                  Positivo  Negativo")
            print(f"Real  Positivo    {self.VP:^8}  {self.FN:^8}")
            print(f"      Negativo    {self.FP:^8}  {self.VN:^8}")
        else:
            print(f"\nFormato {self.n_classes}x{self.n_classes} (Classificação Multiclasse):")

            # Cabeçalho
            header = "Real \\ Previsto" + " " * 5
            for classe in self.classes:
                header += f"{classe:^8}"
            print(header)
            print("-" * len(header))

            # Linhas da matriz
            for i in range(self.n_classes):
                linha = f"{self.classes[i]:<15}"
                for j in range(self.n_classes):
                    linha += f"{self.matriz[i, j]:^8}"
                print(linha)

    def gerar_relatorio_completo(self):
        """Gera um relatório completo com todas as métricas."""
        print("\n" + "="*70)
        print("RELATÓRIO COMPLETO DE AVALIAÇÃO DO MODELO")
        print("="*70)

        # Exibir matriz de confusão
        self.exibir_matriz_formatada()

        # Calcular métricas
        if self.tipo == 'binario':
            metricas = self.calcular_metricas_binarias()
        else:
            metricas = self.calcular_metricas_multiclasse()

        # Interpretação dos resultados
        print("\n" + "="*70)
        print("INTERPRETAÇÃO DOS RESULTADOS")
        print("="*70)

        if self.tipo == 'binario':
            print("\nDIRETRIZES PARA INTERPRETAÇÃO:")
            print("- Acurácia > 0.8: Modelo muito bom")
            print("- Acurácia 0.6-0.8: Modelo razoável")
            print("- Acurácia < 0.6: Modelo precisa de melhorias")
            print("- F1-Score: Combina Precisão e Recall (ideal > 0.7)")

            # Análise específica
            acuracia = metricas['acuracia']
            if acuracia > 0.8:
                print(f"\n✓ Acurácia EXCELENTE ({acuracia*100:.1f}%)")
            elif acuracia > 0.6:
                print(f"\n✓ Acurácia SATISFATÓRIA ({acuracia*100:.1f}%)")
            else:
                print(f"\n⚠ Acurácia BAIXA ({acuracia*100:.1f}%) - Necessita melhorias")

        return metricas


# ============================================================================
# MATRIZES DE CONFUSÃO PARA ANÁLISE
# ============================================================================

# Cenário 1: Classificação Binária - Previsão de Resultados de Futebol
def criar_matriz_premier_league_2026():
    """
    Cria uma matriz de confusão hipotética para previsão de resultados
    da Premier League 2026.

    Cenário: Prever se um time ganha (Vitória) ou não (Derrota/Empate)
    Base fictícia baseada em tendências históricas.
    """
    print("\n" + "="*70)
    print("CENÁRIO 1: PREVISÃO DE RESULTADOS - PREMIER LEAGUE 2026")
    print("="*70)
    print("Classe Positiva: Vitória do time favorito")
    print("Classe Negativa: Derrota ou Empate do time favorito")
    print("Base: 380 jogos da temporada (hipotética)")

    # Matriz de confusão hipotética baseada em estatísticas reais
    # Valores baseados em estatísticas históricas da Premier League
    matriz = [
        [180, 45],  # VP: Vitórias previstas corretamente, FP: Vitórias previdas incorretamente
        [60, 95]    # FN: Vitórias não previdas, VN: Derrotas/Empates previstos corretamente
    ]

    classes = ['Vitória', 'Não-Vitória']

    return matriz, classes

# Cenário 2: Classificação Multiclasse - Tipos de Resultados
def criar_matriz_resultados_detalhados():
    """
    Cria uma matriz de confusão multiclasse para previsão detalhada
    dos resultados da Premier League.
    """
    print("\n" + "="*70)
    print("CENÁRIO 2: PREVISÃO DETALHADA DE RESULTADOS")
    print("="*70)
    print("Classes: Vitória em Casa, Empate em Casa, Derrota em Casa")
    print("         Vitória Fora, Empate Fora, Derrota Fora")

    # Matriz 6x6 hipotética
    matriz = [
        # Previsto: VC  EC  DC  VF  EF  DF
        [85, 10,  5,   2,  1,  0],  # Real: Vitória em Casa
        [8,  75,  12,  0,  3,  2],  # Real: Empate em Casa
        [5,  15,  70,  1,  2,  7],  # Real: Derrota em Casa
        [3,  1,   0,   78, 15, 4],  # Real: Vitória Fora
        [2,  4,   1,   12, 65, 16], # Real: Empate Fora
        [1,  3,   6,   5,  18, 67]  # Real: Derrota Fora
    ]

    classes = ['VC', 'EC', 'DC', 'VF', 'EF', 'DF']
    nomes_completos = ['Vitória Casa', 'Empate Casa', 'Derrota Casa',
                      'Vitória Fora', 'Empate Fora', 'Derrota Fora']

    return matriz, classes, nomes_completos

# Cenário 3: Dados de Estudo de Caso
def criar_matriz_caso_estudo():
    """
    Cria uma matriz de confusão para estudo de caso com diferentes valores.
    """
    print("\n" + "="*70)
    print("CENÁRIO 3: CASO DE ESTUDO - MODELO DE CLASSIFICAÇÃO")
    print("="*70)

    matriz = [
        [120, 30],  # VP, FP
        [25, 225]   # FN, VN
    ]

    classes = ['Positivo', 'Negativo']

    return matriz, classes

# ============================================================================
# FUNÇÕES AUXILIARES E VISUALIZAÇÃO
# ============================================================================

def explicar_metricas():
    """Explica o significado de cada métrica."""
    print("\n" + "="*70)
    print("EXPLICAÇÃO DAS MÉTRICAS DE AVALIAÇÃO")
    print("="*70)

    explicacoes = {
        'VP': "Verdadeiro Positivo: Corretamente identificado como positivo",
        'VN': "Verdadeiro Negativo: Corretamente identificado como negativo",
        'FP': "Falso Positivo: Incorretamente identificado como positivo (Erro Tipo I)",
        'FN': "Falso Negativo: Incorretamente identificado como negativo (Erro Tipo II)",
        'Acuracia': "Proporção de previsões corretas entre todas as previsões",
        'Sensibilidade/Recall': "Capacidade de identificar corretamente os positivos",
        'Especificidade': "Capacidade de identificar corretamente os negativos",
        'Precisão': "Proporção de positivos identificados que são realmente positivos",
        'F1-Score': "Média harmônica entre Precisão e Recall"
    }

    for metrica, explicacao in explicacoes.items():
        print(f"\n{metrica}:")
        print(f"  {explicacao}")

def calcular_formulas_detalhadas():
    """Mostra as fórmulas matemáticas de cada métrica."""
    print("\n" + "="*70)
    print("FÓRMULAS DAS MÉTRICAS")
    print("="*70)

    formulas = [
        ("Acurácia", "(VP + VN) / (VP + VN + FP + FN)"),
        ("Sensibilidade (Recall)", "VP / (VP + FN)"),
        ("Especificidade", "VN / (VN + FP)"),
        ("Precisão", "VP / (VP + FP)"),
        ("F1-Score", "2 * (Precisão * Recall) / (Precisão + Recall)")
    ]

    for nome, formula in formulas:
        print(f"\n{nome}:")
        print(f"  {formula}")

def gerar_analise_estatistica(matriz, classes):
    """Gera uma análise estatística detalhada."""
    print("\n" + "="*70)
    print("ANÁLISE ESTATÍSTICA DETALHADA")
    print("="*70)

    VP, FP, FN, VN = matriz[0][0], matriz[0][1], matriz[1][0], matriz[1][1]
    total = VP + VN + FP + FN

    print(f"\nDistribuição das previsões:")
    print(f"Total de observações: {total}")
    print(f"Positivos reais: {VP + FN} ({((VP + FN)/total)*100:.1f}%)")
    print(f"Negativos reais: {VN + FP} ({((VN + FP)/total)*100:.1f}%)")

    print(f"\nDistribuição das previsões:")
    print(f"Positivos previstos: {VP + FP} ({((VP + FP)/total)*100:.1f}%)")
    print(f"Negativos previstos: {VN + FN} ({((VN + FN)/total)*100:.1f}%)")

    print(f"\nTaxas de erro:")
    print(f"Taxa de erro geral: {(FP + FN)/total:.4f} ({(FP + FN)/total*100:.1f}%)")
    print(f"Taxa de falsos positivos: {FP/(FP + VN) if (FP + VN) > 0 else 0:.4f}")
    print(f"Taxa de falsos negativos: {FN/(FN + VP) if (FN + VP) > 0 else 0:.4f}")

# ============================================================================
# FUNÇÃO PRINCIPAL
# ============================================================================

def main():
    """Função principal do programa."""
    print("="*70)
    print("ANÁLISE DE MATRIZ DE CONFUSÃO - MÉTRICAS DE CLASSIFICAÇÃO")
    print("="*70)
    print("Este programa calcula métricas de avaliação de modelos de classificação")
    print("usando matrizes de confusão como base.")
    print("="*70)

    while True:
        print("\n" + "="*70)
        print("MENU PRINCIPAL")
        print("="*70)
        print("1. Analisar cenário de previsão da Premier League 2026")
        print("2. Analisar cenário multiclasse detalhado")
        print("3. Analisar caso de estudo")
        print("4. Explicação das métricas e fórmulas")
        print("5. Sair")

        opcao = input("\nEscolha uma opção (1-5): ")

        if opcao == '1':
            # Cenário 1: Premier League 2026
            matriz, classes = criar_matriz_premier_league_2026()
            analisador = AnalisadorMatrizConfusao(matriz, classes)
            analisador.gerar_relatorio_completo()
            gerar_analise_estatistica(matriz, classes)

            input("\nPressione Enter para continuar...")

        elif opcao == '2':
            # Cenário 2: Multiclasse
            matriz, classes, nomes = criar_matriz_resultados_detalhados()
            analisador = AnalisadorMatrizConfusao(matriz, classes)
            analisador.gerar_relatorio_completo()

            input("\nPressione Enter para continuar...")

        elif opcao == '3':
            # Cenário 3: Caso de estudo
            matriz, classes = criar_matriz_caso_estudo()
            analisador = AnalisadorMatrizConfusao(matriz, classes)
            analisador.gerar_relatorio_completo()
            gerar_analise_estatistica(matriz, classes)

            input("\nPressione Enter para continuar...")

        elif opcao == '4':
            # Explicações
            explicar_metricas()
            calcular_formulas_detalhadas()

            input("\nPressione Enter para continuar...")

        elif opcao == '5':
            print("\nEncerrando o programa...")
            break

        else:
            print("\nOpção inválida! Escolha uma opção entre 1 e 5.")

# ============================================================================
# EXECUÇÃO DO PROGRAMA
# ============================================================================

if __name__ == "__main__":
    main()

ANÁLISE DE MATRIZ DE CONFUSÃO - MÉTRICAS DE CLASSIFICAÇÃO
Este programa calcula métricas de avaliação de modelos de classificação
usando matrizes de confusão como base.

MENU PRINCIPAL
1. Analisar cenário de previsão da Premier League 2026
2. Analisar cenário multiclasse detalhado
3. Analisar caso de estudo
4. Explicação das métricas e fórmulas
5. Sair

Escolha uma opção (1-5): 5

Encerrando o programa...
