In [1]:
## Exercício 1 - Problema do XOR

from sklearn.neural_network import MLPClassifier
import numpy as np

x = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
y = np.array([0, 1, 1, 0])

# 1- Importar o modelo MLP do sklearn
# 2- Instanciar o modelo escolhendo uma topologia para a rede, função de ativação e número de épocas de execução até 100% de acerto
# 3- Treinar o modelo com os dados de treinamento
# 4- Fazer o predict com os dados de treinamento
# 5- Comparar o resultado do predict com o vetor y

In [2]:
# Importação das bibliotecas necessárias
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix
import numpy as np
import matplotlib.pyplot as plt
from sklearn.model_selection import validation_curve

# === PROBLEMA XOR - DEFINIÇÃO DOS DADOS ===

print("="*60)
print("           ANÁLISE DE REDE NEURAL MLP - PROBLEMA XOR")
print("="*60)

# Definição dos dados de entrada (problema XOR clássico)
# XOR é um problema não-linearmente separável, ideal para demonstrar redes neurais
dados_entrada = np.array([
    [0, 0],  # Entrada 1: 0 XOR 0 = 0
    [0, 1],  # Entrada 2: 0 XOR 1 = 1
    [1, 0],  # Entrada 3: 1 XOR 0 = 1
    [1, 1]   # Entrada 4: 1 XOR 1 = 0
])

# Saídas esperadas para o problema XOR
saidas_esperadas = np.array([0, 1, 1, 0])

print("🎯 PROBLEMA: Porta Lógica XOR (Exclusive OR)")
print("📊 DADOS DE TREINAMENTO:")
print("   Entrada  |  Saída Esperada")
print("   ---------|----------------")
for i, (entrada, saida) in enumerate(zip(dados_entrada, saidas_esperadas)):
    print(f"   {entrada}     |       {saida}")

print(f"\n📏 DIMENSÕES:")
print(f"   • Dados de entrada: {dados_entrada.shape}")
print(f"   • Saídas esperadas: {saidas_esperadas.shape}")
print(f"   • Número de features: {dados_entrada.shape[1]}")
print(f"   • Número de amostras: {dados_entrada.shape[0]}")

# === CONFIGURAÇÃO DA REDE NEURAL MLP ===

print(f"\n" + "="*60)
print("              CONFIGURAÇÃO DA REDE NEURAL")
print("="*60)

# Parâmetros da rede neural
camadas_ocultas = (4,)  # Uma camada oculta com 4 neurônios
funcao_ativacao = 'logistic'  # Função sigmoide
max_iteracoes = 10000
semente_aleatoria = 42

print("🧠 ARQUITETURA DA REDE:")
print(f"   • Camada de entrada: {dados_entrada.shape[1]} neurônios")
print(f"   • Camadas ocultas: {camadas_ocultas} neurônios")
print(f"   • Camada de saída: 1 neurônio")
print(f"   • Total de camadas: {len(camadas_ocultas) + 2} (entrada + oculta + saída)")

print(f"\n⚙️  HIPERPARÂMETROS:")
print(f"   • Função de ativação: {funcao_ativacao} (sigmóide)")
print(f"   • Máximo de iterações: {max_iteracoes:,}")
print(f"   • Semente aleatória: {semente_aleatoria}")
print(f"   • Solver: adam (otimizador padrão)")

# Criação e configuração do modelo MLP
modelo_mlp = MLPClassifier(
    hidden_layer_sizes=camadas_ocultas,
    activation=funcao_ativacao,
    max_iter=max_iteracoes,
    random_state=semente_aleatoria,
    solver='adam'  # Otimizador Adam (padrão, eficiente)
)

# === TREINAMENTO DA REDE NEURAL ===

print(f"\n" + "="*60)
print("                TREINAMENTO DA REDE")
print("="*60)

print("🔄 Iniciando treinamento...")

# Treinamento do modelo
modelo_mlp.fit(dados_entrada, saidas_esperadas)

print("✅ Treinamento concluído!")
print(f"📈 Número de iterações realizadas: {modelo_mlp.n_iter_}")
print(f"🎯 Convergência alcançada: {'Sim' if modelo_mlp.n_iter_ < max_iteracoes else 'Não'}")

# === PREDIÇÕES E AVALIAÇÃO ===

print(f"\n" + "="*60)
print("              RESULTADOS E AVALIAÇÃO")
print("="*60)

# Fazer predições nos dados de treinamento
predicoes_mlp = modelo_mlp.predict(dados_entrada)

# Obter probabilidades das predições
probabilidades_predicao = modelo_mlp.predict_proba(dados_entrada)

# Cálculo da acurácia
acuracia_modelo = modelo_mlp.score(dados_entrada, saidas_esperadas)

print("📊 COMPARAÇÃO DETALHADA:")
print("   Entrada  | Esperado | Predito | Probabilidade [Classe 0, Classe 1] | Correto?")
print("   ---------|----------|---------|-------------------------------------|----------")

for i, (entrada, esperado, predito, prob) in enumerate(zip(dados_entrada, saidas_esperadas, predicoes_mlp, probabilidades_predicao)):
    correto = "✅" if esperado == predito else "❌"
    print(f"   {entrada}     |    {esperado}     |    {predito}    | [{prob[0]:.4f}, {prob[1]:.4f}]              |    {correto}")

print(f"\n🎯 MÉTRICAS DE DESEMPENHO:")
print(f"   • Acurácia: {acuracia_modelo*100:.1f}%")
print(f"   • Erro: {(1-acuracia_modelo)*100:.1f}%")

# === ANÁLISE DETALHADA DO MODELO ===

print(f"\n" + "="*60)
print("              ANÁLISE DETALHADA DO MODELO")
print("="*60)

# Relatório de classificação
print("📋 RELATÓRIO DE CLASSIFICAÇÃO:")
relatorio_classificacao = classification_report(
    saidas_esperadas,
    predicoes_mlp,
    target_names=['Classe 0 (False)', 'Classe 1 (True)'],
    zero_division=0
)
print(relatorio_classificacao)

# Matriz de confusão
print("🎯 MATRIZ DE CONFUSÃO:")
matriz_confusao = confusion_matrix(saidas_esperadas, predicoes_mlp)
print("         Predito")
print("        0    1")
print("Real 0 ", matriz_confusao[0])
print("Real 1 ", matriz_confusao[1])

# Informações sobre a arquitetura treinada
print(f"\n🏗️  DETALHES DA ARQUITETURA TREINADA:")
print(f"   • Número de camadas: {modelo_mlp.n_layers_}")
print(f"   • Número de saídas: {modelo_mlp.n_outputs_}")

# Pesos e biases (se desejado visualizar a estrutura interna)
print(f"\n⚖️  INFORMAÇÕES DOS PESOS:")
for i, (pesos, bias) in enumerate(zip(modelo_mlp.coefs_, modelo_mlp.intercepts_)):
    camada = f"Entrada → Oculta" if i == 0 else f"Oculta {i} → Saída"
    print(f"   • {camada}: Matriz {pesos.shape}, Bias {bias.shape}")

# === ANÁLISE DA FUNÇÃO DE PERDA ===

print(f"\n📉 EVOLUÇÃO DO TREINAMENTO:")
if hasattr(modelo_mlp, 'loss_curve_'):
    print(f"   • Perda inicial: {modelo_mlp.loss_curve_[0]:.6f}")
    print(f"   • Perda final: {modelo_mlp.loss_curve_[-1]:.6f}")
    print(f"   • Redução da perda: {modelo_mlp.loss_curve_[0] - modelo_mlp.loss_curve_[-1]:.6f}")
else:
    print("   • Curva de perda não disponível")

# === TESTE COM DIFERENTES CONFIGURAÇÕES ===

print(f"\n" + "="*60)
print("          COMPARAÇÃO COM OUTRAS CONFIGURAÇÕES")
print("="*60)

# Testando diferentes tamanhos de camadas ocultas
configuracoes_teste = [
    (2,), (3,), (4,), (5,), (8,),
    (2, 2), (4, 2), (3, 3)
]

print("🔬 TESTE DE DIFERENTES ARQUITETURAS:")
print("   Arquitetura    | Iterações | Acurácia")
print("   ---------------|-----------|----------")

melhores_resultados = []

for config in configuracoes_teste:
    modelo_teste = MLPClassifier(
        hidden_layer_sizes=config,
        activation='logistic',
        max_iter=10000,
        random_state=42
    )

    modelo_teste.fit(dados_entrada, saidas_esperadas)
    acuracia_teste = modelo_teste.score(dados_entrada, saidas_esperadas)

    melhores_resultados.append((config, modelo_teste.n_iter_, acuracia_teste))

    config_str = f"({', '.join(map(str, config))})"
    print(f"   {config_str:<14} | {modelo_teste.n_iter_:>8} | {acuracia_teste*100:>6.1f}%")

# Melhor configuração
melhor_config = max(melhores_resultados, key=lambda x: (x[2], -x[1]))
print(f"\n🏆 MELHOR CONFIGURAÇÃO:")
print(f"   • Arquitetura: {melhor_config[0]}")
print(f"   • Iterações: {melhor_config[1]}")
print(f"   • Acurácia: {melhor_config[2]*100:.1f}%")

# === INSIGHTS E CONCLUSÕES ===

print(f"\n" + "="*60)
print("              INSIGHTS E CONCLUSÕES")
print("="*60)

print("💡 OBSERVAÇÕES IMPORTANTES:")
print("   • O problema XOR é não-linearmente separável")
print("   • Perceptrons simples não conseguem resolver XOR")
print("   • MLPs com camadas ocultas resolvem o problema facilmente")
print("   • A função sigmoide permite não-linearidade necessária")

print(f"\n🎓 LIÇÕES APRENDIDAS:")
print("   • Importância das camadas ocultas para problemas não-lineares")
print("   • Função de ativação sigmóide adequada para classificação binária")
print("   • Poucas iterações necessárias para convergência neste problema")
print("   • Diferentes arquiteturas podem alcançar 100% de acurácia")

print(f"\n⚠️  LIMITAÇÕES E CONSIDERAÇÕES:")
print("   • Treinamento e teste no mesmo conjunto (overfitting possível)")
print("   • Problema muito simples (apenas 4 amostras)")
print("   • Em problemas reais, usar validação cruzada")
print("   • Considerar regularização para datasets maiores")

print(f"\n🔧 PRÓXIMOS PASSOS SUGERIDOS:")
print("   • Testar com funções de ativação diferentes (ReLU, tanh)")
print("   • Experimentar com problemas mais complexos")
print("   • Implementar validação cruzada")
print("   • Visualizar a superfície de decisão")
print("   • Analisar os pesos aprendidos pela rede")

print(f"\n" + "="*60)
print("                 ANÁLISE CONCLUÍDA")
print("="*60)

           ANÁLISE DE REDE NEURAL MLP - PROBLEMA XOR
🎯 PROBLEMA: Porta Lógica XOR (Exclusive OR)
📊 DADOS DE TREINAMENTO:
   Entrada  |  Saída Esperada
   ---------|----------------
   [0 0]     |       0
   [0 1]     |       1
   [1 0]     |       1
   [1 1]     |       0

📏 DIMENSÕES:
   • Dados de entrada: (4, 2)
   • Saídas esperadas: (4,)
   • Número de features: 2
   • Número de amostras: 4

              CONFIGURAÇÃO DA REDE NEURAL
🧠 ARQUITETURA DA REDE:
   • Camada de entrada: 2 neurônios
   • Camadas ocultas: (4,) neurônios
   • Camada de saída: 1 neurônio
   • Total de camadas: 3 (entrada + oculta + saída)

⚙️  HIPERPARÂMETROS:
   • Função de ativação: logistic (sigmóide)
   • Máximo de iterações: 10,000
   • Semente aleatória: 42
   • Solver: adam (otimizador padrão)

                TREINAMENTO DA REDE
🔄 Iniciando treinamento...
✅ Treinamento concluído!
📈 Número de iterações realizadas: 172
🎯 Convergência alcançada: Sim

              RESULTADOS E AVALIAÇÃO
📊 COMPARAÇÃO DETA

In [None]:
## Exercício 2 - Dataset Parkinsons

# 1- Carregar a base de dados Parkinsons
url = "https://raw.githubusercontent.com/tmoura/machinelearning/master/parkinsons.data"

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPClassifier
from sklearn import metrics

# 2- Normalizar todas as colunas (normalizar é deixar todos os valores das colunas entre 0 e 1)
# 3- Separar o dataset em X (matriz de features) e y (coluna target)
# 4- Gerar as bases de treinamento e teste
# 5- Importar o modelo MLP do sklearn
# 6- Instanciar o modelo escolhendo uma topologia para a rede, função de ativação e número de épocas de execução até que obtenha uma taxa de acerto estável
# 7- Treinar o modelo com os dados de treinamento
# 8- Fazer o predict com os dados de teste
# 9- Imprimir o percentual de acerto da base de teste

In [None]:
# Importação das bibliotecas necessárias
import pandas as pd
from sklearn.model_selection import train_test_split, cross_val_score, validation_curve
from sklearn.neural_network import MLPClassifier
from sklearn.preprocessing import MinMaxScaler
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix, roc_auc_score, roc_curve
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import GridSearchCV
import warnings
warnings.filterwarnings('ignore')

# === CARREGAMENTO E PREPARAÇÃO DOS DADOS ===

print("="*70)
print("    ANÁLISE DE PARKINSON COM REDE NEURAL MLP - DATASET COMPLETO")
print("="*70)

# URL do dataset de Parkinson
url_dataset = "https://raw.githubusercontent.com/tmoura/machinelearning/master/parkinsons.data"

print("📥 CARREGANDO DATASET...")
# Carregamento inicial sem cabeçalho (será definido manualmente)
dataset_bruto = pd.read_csv(url_dataset, header=None)

# Definição manual das colunas baseada na documentação do dataset UCI
nomes_colunas = [
    'name',           # Nome do paciente
    'MDVP:Fo(Hz)',    # Frequência fundamental média
    'MDVP:Fhi(Hz)',   # Frequência fundamental máxima
    'MDVP:Flo(Hz)',   # Frequência fundamental mínima
    'MDVP:Jitter(%)', # Variação percentual da frequência fundamental
    'MDVP:Jitter(Abs)', # Variação absoluta da frequência fundamental
    'MDVP:RAP',       # Medida de perturbação da frequência
    'MDVP:PPQ',       # Medida de perturbação de cinco pontos
    'Jitter:DDP',     # Diferença de perturbação média
    'MDVP:Shimmer',   # Variação local da amplitude
    'MDVP:Shimmer(dB)', # Variação da amplitude em dB
    'Shimmer:APQ3',   # Medida de perturbação de amplitude (3 pontos)
    'Shimmer:APQ5',   # Medida de perturbação de amplitude (5 pontos)
    'MDVP:APQ',       # Medida de perturbação de amplitude
    'Shimmer:DDA',    # Diferença de perturbação de amplitude média
    'NHR',            # Relação ruído-harmônico
    'HNR',            # Relação harmônico-ruído
    'status',         # Status: 1=Parkinson, 0=Saudável
    'RPDE',           # Medida de dinâmica não-linear
    'DFA',            # Expoente de flutuação sem tendência
    'spread1',        # Medida de variação vocal fundamental
    'spread2',        # Medida de variação vocal não-linear
    'D2',             # Dimensão de correlação
    'PPE'             # Entropia de perturbação de período
]

# Aplicação dos nomes das colunas
dataset_completo = dataset_bruto.copy()
dataset_completo.columns = nomes_colunas

print("✅ Dataset carregado com sucesso!")

# === EXPLORAÇÃO INICIAL DOS DADOS ===

print(f"\n📊 INFORMAÇÕES GERAIS DO DATASET:")
print(f"   • Dimensões: {dataset_completo.shape}")
print(f"   • Número de pacientes: {dataset_completo.shape[0]}")
print(f"   • Número de características: {dataset_completo.shape[1]-2} (excluindo 'name' e 'status')")

print(f"\n🎯 DISTRIBUIÇÃO DO DIAGNÓSTICO:")
distribuicao_diagnostico = dataset_completo['status'].value_counts()
print(f"   • Pacientes com Parkinson (status=1): {distribuicao_diagnostico[1]} ({distribuicao_diagnostico[1]/len(dataset_completo)*100:.1f}%)")
print(f"   • Pacientes saudáveis (status=0): {distribuicao_diagnostico[0]} ({distribuicao_diagnostico[0]/len(dataset_completo)*100:.1f}%)")

# Verificação de valores faltantes
valores_faltantes = dataset_completo.isnull().sum().sum()
print(f"\n🔍 QUALIDADE DOS DADOS:")
print(f"   • Valores faltantes: {valores_faltantes}")
print(f"   • Duplicatas: {dataset_completo.duplicated().sum()}")

# === PREPARAÇÃO DAS VARIÁVEIS ===

print(f"\n" + "="*70)
print("                    PREPARAÇÃO DAS VARIÁVEIS")
print("="*70)

# Separação das features e target
# Remove 'name' (identificador) e 'status' (target) das features
features_clinicas = dataset_completo.drop(['name', 'status'], axis=1)
diagnostico_target = dataset_completo['status']

print(f"📋 CARACTERÍSTICAS CLÍNICAS SELECIONADAS:")
print(f"   • Total de features: {features_clinicas.shape[1]}")
print(f"   • Features relacionadas à frequência (Jitter): {sum('jitter' in col.lower() for col in features_clinicas.columns)}")
print(f"   • Features relacionadas à amplitude (Shimmer): {sum('shimmer' in col.lower() for col in features_clinicas.columns)}")
print(f"   • Features de ruído (NHR, HNR): {sum(col in ['NHR', 'HNR'] for col in features_clinicas.columns)}")
print(f"   • Features de dinâmica não-linear: {sum(col in ['RPDE', 'DFA', 'D2', 'PPE', 'spread1', 'spread2'] for col in features_clinicas.columns)}")

# Estatísticas descritivas
print(f"\n🔢 ESTATÍSTICAS DAS FEATURES:")
estatisticas = features_clinicas.describe()
print(f"   • Média das médias: {estatisticas.loc['mean'].mean():.4f}")
print(f"   • Variação das escalas: {estatisticas.loc['std'].std():.4f} (indica necessidade de normalização)")

# === NORMALIZAÇÃO DOS DADOS ===

print(f"\n⚖️  NORMALIZAÇÃO DOS DADOS:")
print("   • Aplicando MinMaxScaler (escala 0-1)")

# Aplicação do MinMaxScaler para normalizar todas as features
normalizador = MinMaxScaler()
features_normalizadas = normalizador.fit_transform(features_clinicas)

# Criação de DataFrame com dados normalizados
dataset_normalizado = pd.DataFrame(
    features_normalizadas,
    columns=features_clinicas.columns
)

print("   • ✅ Normalização concluída")
print(f"   • Intervalo após normalização: [{dataset_normalizado.min().min():.3f}, {dataset_normalizado.max().max():.3f}]")

# === DIVISÃO DOS DADOS ===

print(f"\n" + "="*70)
print("                      DIVISÃO DOS DADOS")
print("="*70)

# Divisão estratificada dos dados (70% treino, 30% teste)
X_treino, X_teste, y_treino, y_teste = train_test_split(
    features_normalizadas,
    diagnostico_target,
    test_size=0.3,
    random_state=42,
    stratify=diagnostico_target  # Mantém proporção das classes
)

print(f"📊 CONJUNTOS DE DADOS:")
print(f"   • Treino: {X_treino.shape[0]} amostras ({X_treino.shape[0]/len(dataset_completo)*100:.1f}%)")
print(f"   • Teste: {X_teste.shape[0]} amostras ({X_teste.shape[0]/len(dataset_completo)*100:.1f}%)")

print(f"\n🎯 DISTRIBUIÇÃO NOS CONJUNTOS:")
print("   Treino:")
treino_dist = pd.Series(y_treino).value_counts()
for classe, qtd in treino_dist.items():
    status_nome = "Parkinson" if classe == 1 else "Saudável"
    print(f"     • {status_nome}: {qtd} ({qtd/len(y_treino)*100:.1f}%)")

print("   Teste:")
teste_dist = pd.Series(y_teste).value_counts()
for classe, qtd in teste_dist.items():
    status_nome = "Parkinson" if classe == 1 else "Saudável"
    print(f"     • {status_nome}: {qtd} ({qtd/len(y_teste)*100:.1f}%)")

# === CONFIGURAÇÃO E TREINAMENTO DA REDE NEURAL ===

print(f"\n" + "="*70)
print("               CONFIGURAÇÃO DA REDE NEURAL MLP")
print("="*70)

# Configuração da arquitetura da rede
camadas_ocultas = (10, 5)  # Primeira camada: 10 neurônios, Segunda camada: 5 neurônios
funcao_ativacao = 'relu'   # ReLU: boa para problemas de classificação
max_iteracoes = 1000
semente_aleatoria = 42

print("🧠 ARQUITETURA DA REDE:")
print(f"   • Camada de entrada: {X_treino.shape[1]} neurônios (features)")
print(f"   • Camadas ocultas: {camadas_ocultas}")
print(f"   • Camada de saída: 1 neurônio (classificação binária)")
print(f"   • Total de parâmetros estimado: ~{X_treino.shape[1]*camadas_ocultas[0] + camadas_ocultas[0]*camadas_ocultas[1] + camadas_ocultas[1]*1}")

print(f"\n⚙️  HIPERPARÂMETROS:")
print(f"   • Função de ativação: {funcao_ativacao} (Rectified Linear Unit)")
print(f"   • Solver: adam (otimizador adaptativo)")
print(f"   • Máximo de iterações: {max_iteracoes:,}")
print(f"   • Semente aleatória: {semente_aleatoria}")

# Criação do modelo MLP
modelo_mlp_parkinson = MLPClassifier(
    hidden_layer_sizes=camadas_ocultas,
    activation=funcao_ativacao,
    max_iter=max_iteracoes,
    random_state=semente_aleatoria,
    solver='adam'
)

print(f"\n🔄 INICIANDO TREINAMENTO...")

# Treinamento do modelo
modelo_mlp_parkinson.fit(X_treino, y_treino)

print(f"✅ TREINAMENTO CONCLUÍDO!")
print(f"   • Iterações realizadas: {modelo_mlp_parkinson.n_iter_}")
print(f"   • Convergência: {'✅ Sim' if modelo_mlp_parkinson.n_iter_ < max_iteracoes else '⚠️ Não (pode precisar de mais iterações)'}")

# === AVALIAÇÃO DO MODELO ===

print(f"\n" + "="*70)
print("                    AVALIAÇÃO DO MODELO")
print("="*70)

# Predições no conjunto de teste
predicoes_teste = modelo_mlp_parkinson.predict(X_teste)
probabilidades_teste = modelo_mlp_parkinson.predict_proba(X_teste)

# Predições no conjunto de treino (para verificar overfitting)
predicoes_treino = modelo_mlp_parkinson.predict(X_treino)

# Cálculo das métricas
acuracia_teste = accuracy_score(y_teste, predicoes_teste)
acuracia_treino = accuracy_score(y_treino, predicoes_treino)
auc_score = roc_auc_score(y_teste, probabilidades_teste[:, 1])

print(f"📊 MÉTRICAS PRINCIPAIS:")
print(f"   • Acurácia no treino: {acuracia_treino*100:.2f}%")
print(f"   • Acurácia no teste: {acuracia_teste*100:.2f}%")
print(f"   • Diferença (overfitting): {(acuracia_treino-acuracia_teste)*100:.2f} pontos percentuais")
print(f"   • AUC-ROC: {auc_score:.4f}")

# Interpretação do resultado
if abs(acuracia_treino - acuracia_teste) < 0.05:
    print("   • ✅ Modelo bem balanceado (baixo overfitting)")
elif acuracia_treino - acuracia_teste > 0.1:
    print("   • ⚠️ Possível overfitting detectado")
else:
    print("   • 🔍 Diferença aceitável entre treino e teste")

# === ANÁLISE DETALHADA ===

print(f"\n📋 RELATÓRIO DE CLASSIFICAÇÃO DETALHADO:")
nomes_classes = ['Saudável', 'Parkinson']
relatorio = classification_report(
    y_teste,
    predicoes_teste,
    target_names=nomes_classes,
    digits=4
)
print(relatorio)

# Matriz de confusão
print(f"🎯 MATRIZ DE CONFUSÃO:")
matriz_confusao = confusion_matrix(y_teste, predicoes_teste)
print("                 Predito")
print("              Saudável  Parkinson")
print(f"Real Saudável    {matriz_confusao[0,0]:>3}      {matriz_confusao[0,1]:>3}")
print(f"Real Parkinson   {matriz_confusao[1,0]:>3}      {matriz_confusao[1,1]:>3}")

# Análise clínica dos erros
vp = matriz_confusao[1,1]  # Verdadeiros positivos
vn = matriz_confusao[0,0]  # Verdadeiros negativos
fp = matriz_confusao[0,1]  # Falsos positivos
fn = matriz_confusao[1,0]  # Falsos negativos

sensibilidade = vp / (vp + fn) if (vp + fn) > 0 else 0
especificidade = vn / (vn + fp) if (vn + fp) > 0 else 0

print(f"\n🏥 MÉTRICAS CLÍNICAS:")
print(f"   • Sensibilidade (detecção de Parkinson): {sensibilidade:.4f} ({sensibilidade*100:.1f}%)")
print(f"   • Especificidade (detecção de saudáveis): {especificidade:.4f} ({especificidade*100:.1f}%)")
print(f"   • Falsos negativos (Parkinson não detectado): {fn} casos")
print(f"   • Falsos positivos (Saudável classificado como Parkinson): {fp} casos")

# === OTIMIZAÇÃO DE HIPERPARÂMETROS ===

print(f"\n" + "="*70)
print("              OTIMIZAÇÃO DE HIPERPARÂMETROS")
print("="*70)

print("🔬 TESTANDO DIFERENTES CONFIGURAÇÕES...")

# Definição do grid de hiperparâmetros para teste
parametros_grid = {
    'hidden_layer_sizes': [(5,), (10,), (15,), (10, 5), (15, 8), (20, 10)],
    'activation': ['relu', 'tanh'],
    'learning_rate_init': [0.001, 0.01]
}

# Grid Search com validação cruzada
busca_grid = GridSearchCV(
    MLPClassifier(max_iter=1000, random_state=42),
    parametros_grid,
    cv=5,  # 5-fold cross validation
    scoring='accuracy',
    n_jobs=-1
)

busca_grid.fit(X_treino, y_treino)

print("✅ OTIMIZAÇÃO CONCLUÍDA!")
print(f"\n🏆 MELHORES HIPERPARÂMETROS:")
for parametro, valor in busca_grid.best_params_.items():
    print(f"   • {parametro}: {valor}")

print(f"\n📈 RESULTADO DA OTIMIZAÇÃO:")
print(f"   • Melhor score (CV): {busca_grid.best_score_:.4f}")
print(f"   • Score do modelo original: {cross_val_score(modelo_mlp_parkinson, X_treino, y_treino, cv=5).mean():.4f}")

# Teste do modelo otimizado
modelo_otimizado = busca_grid.best_estimator_
predicoes_otimizadas = modelo_otimizado.predict(X_teste)
acuracia_otimizada = accuracy_score(y_teste, predicoes_otimizadas)

print(f"   • Acurácia modelo otimizado: {acuracia_otimizada*100:.2f}%")
print(f"   • Melhoria: {(acuracia_otimizada - acuracia_teste)*100:+.2f} pontos percentuais")

# === ANÁLISE DE IMPORTÂNCIA DAS FEATURES ===

print(f"\n" + "="*70)
print("              ANÁLISE DE IMPORTÂNCIA DAS FEATURES")
print("="*70)

# Permutation importance (aproximação para MLPs)
from sklearn.inspection import permutation_importance

print("🔍 CALCULANDO IMPORTÂNCIA DAS FEATURES...")
importancia_result = permutation_importance(
    modelo_otimizado, X_teste, y_teste,
    n_repeats=10, random_state=42
)

# Ordenar features por importância
indices_importantes = np.argsort(importancia_result.importances_mean)[::-1]

print(f"\n📊 TOP 10 FEATURES MAIS IMPORTANTES:")
for i in range(min(10, len(indices_importantes))):
    idx = indices_importantes[i]
    feature_nome = features_clinicas.columns[idx]
    importancia = importancia_result.importances_mean[idx]
    std = importancia_result.importances_std[idx]
    print(f"   {i+1:2d}. {feature_nome:<20}: {importancia:.4f} (±{std:.4f})")

# === VALIDAÇÃO CRUZADA ===

print(f"\n" + "="*70)
print("                    VALIDAÇÃO CRUZADA")
print("="*70)

print("🔄 EXECUTANDO VALIDAÇÃO CRUZADA (10-fold)...")
scores_cv = cross_val_score(modelo_otimizado, features_normalizadas, diagnostico_target, cv=10)

print(f"📊 RESULTADOS DA VALIDAÇÃO CRUZADA:")
print(f"   • Acurácia média: {scores_cv.mean():.4f} (±{scores_cv.std()*2:.4f})")
print(f"   • Intervalo de confiança 95%: [{scores_cv.mean()-scores_cv.std()*2:.4f}, {scores_cv.mean()+scores_cv.std()*2:.4f}]")
print(f"   • Melhor fold: {scores_cv.max():.4f}")
print(f"   • Pior fold: {scores_cv.min():.4f}")

# === INSIGHTS E CONCLUSÕES ===

print(f"\n" + "="*70)
print("                 INSIGHTS E CONCLUSÕES")
print("="*70)

print("💡 PRINCIPAIS DESCOBERTAS:")
print(f"   • Modelo MLP alcançou {acuracia_otimizada*100:.1f}% de acurácia")
print(f"   • Sensibilidade de {sensibilidade*100:.1f}% para detecção de Parkinson")
print(f"   • Especificidade de {especificidade*100:.1f}% para detecção de casos saudáveis")
print(f"   • {fn} casos de Parkinson não detectados (falsos negativos)")

print(f"\n🏥 RELEVÂNCIA CLÍNICA:")
if sensibilidade > 0.9:
    print("   • ✅ Excelente capacidade de detectar Parkinson")
elif sensibilidade > 0.8:
    print("   • ✅ Boa capacidade de detectar Parkinson")
else:
    print("   • ⚠️ Sensibilidade pode ser melhorada para uso clínico")

if especificidade > 0.9:
    print("   • ✅ Excelente capacidade de identificar casos saudáveis")
elif especificidade > 0.8:
    print("   • ✅ Boa capacidade de identificar casos saudáveis")
else:
    print("   • ⚠️ Especificidade pode ser melhorada para reduzir alarmes falsos")

print(f"\n🔬 CARACTERÍSTICAS DO MODELO:")
print("   • Features de voz são altamente informativas para Parkinson")
print("   • Normalização essencial para convergência do MLP")
print("   • Arquitetura com duas camadas ocultas mostrou-se eficaz")
print("   • Função ReLU adequada para este tipo de problema")

print(f"\n⚠️  LIMITAÇÕES E CONSIDERAÇÕES:")
print("   • Dataset relativamente pequeno (podem haver vieses)")
print("   • Modelo deve ser validado em população mais ampla")
print("   • Não substitui diagnóstico médico especializado")
print("   • Features baseadas apenas em características de voz")

print(f"\n🔧 RECOMENDAÇÕES PARA MELHORIA:")
print("   • Coletar mais dados para melhor generalização")
print("   • Incluir features demográficas e clínicas adicionais")
print("   • Testar arquiteturas mais profundas ou outros algoritmos")
print("   • Implementar ensemble methods para maior robustez")
print("   • Desenvolver interface clínica para uso prático")

print(f"\n" + "="*70)
print("                    ANÁLISE CONCLUÍDA")
print("="*70)
print("📋 Relatório completo da análise de Parkinson com MLP gerado com sucesso!")

ValueError: Length mismatch: Expected axis has 23 elements, new values have 24 elements

In [None]:
## Exercício 3 - Dataset Penguins

# 1- Carregar a base de dados Penguins da API do Seaborn
# 2- A base precisará ser tratada: Existem valores nulos e dados categóricos
####### 3- Normalizar todas as colunas (normalizar é deixar todos os valores das colunas entre 0 e 1) --> Redes Neurais são sensíveis as diferenças escalares de valores das features
# 4- Separar o dataset em X (matriz de features) e y (coluna target)
# 5- Gerar as bases de treinamento e teste
# 6- Importar o modelo MLP do sklearn
# 7- Instanciar o modelo escolhendo uma topologia para a rede, função de ativação e número de épocas de execução até que obtenha uma taxa de acerto estável
# 8- Treinar o modelo com os dados de treinamento
# 9- Fazer o predict com os dados de teste
# 10- Imprimir o percentual de acerto da base de teste

In [None]:
# Importação das bibliotecas necessárias
import pandas as pd
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPClassifier
from sklearn.preprocessing import MinMaxScaler, LabelEncoder
from sklearn.metrics import accuracy_score

# Carregamento do dataset de pinguins do seaborn
penguin_dataset = sns.load_dataset('penguins')

# Remoção de linhas com valores ausentes (NaN)
clean_penguin_data = penguin_dataset.dropna()

# Criação dos codificadores de rótulos para variáveis categóricas
species_encoder = LabelEncoder()
island_encoder = LabelEncoder()
sex_encoder = LabelEncoder()

# Codificação da variável alvo 'species' (espécie)
clean_penguin_data['species'] = species_encoder.fit_transform(clean_penguin_data['species'])

# Codificação da variável categórica 'island' (ilha)
clean_penguin_data['island'] = island_encoder.fit_transform(clean_penguin_data['island'])

# Codificação da variável categórica 'sex' (sexo)
clean_penguin_data['sex'] = sex_encoder.fit_transform(clean_penguin_data['sex'])

# Separação das características (features) e da variável alvo (target)
feature_variables = clean_penguin_data.drop('species', axis=1)
target_variable = clean_penguin_data['species']

# Criação do normalizador MinMaxScaler para padronizar os dados
feature_scaler = MinMaxScaler()

# Normalização das características para o intervalo [0, 1]
normalized_features = feature_scaler.fit_transform(feature_variables)

# Divisão dos dados em conjuntos de treino e teste (70% treino, 30% teste)
X_train_set, X_test_set, y_train_set, y_test_set = train_test_split(
    normalized_features, target_variable, test_size=0.3, random_state=42)

# Criação do modelo MLP (Multi-Layer Perceptron)
# hidden_layer_sizes=(10, 5): primeira camada oculta com 10 neurônios, segunda com 5
# activation='relu': função de ativação ReLU (Rectified Linear Unit)
# max_iter=1000: máximo de 1000 iterações para convergência
mlp_classifier = MLPClassifier(
    hidden_layer_sizes=(10, 5),
    activation='relu',
    max_iter=1000,
    random_state=42
)

# Treinamento do modelo com os dados de treino
mlp_classifier.fit(X_train_set, y_train_set)

# Realização de predições no conjunto de teste
test_predictions = mlp_classifier.predict(X_test_set)

# Cálculo da acurácia do modelo (convertida para percentual)
model_accuracy = accuracy_score(y_test_set, test_predictions) * 100

# Exibição do resultado da acurácia
print(f"Acurácia do modelo na base de teste: {model_accuracy:.2f}%")

Acurácia na base de teste: 99.00%




In [None]:
## Exercício 4 - Dataset Phoneme

# 1- Carregar a base "phoneme"
url = "https://raw.githubusercontent.com/tmoura/machinelearning/master/phoneme.data"

# 2- A coluna 0 é o target
# 3- Todas as colunas são numéricas e não possui valores nulos
# 4- Separar o dataset em X (matriz de features) e y (coluna target)
# 5- Gerar as bases de treinamento e teste
# 6- Importar o modelo MLP do sklearn
# 7- Instanciar o modelo escolhendo uma topologia para a rede, função de ativação e número de épocas de execução até que obtenha uma taxa de acerto estável
# 8- Treinar o modelo com os dados de treinamento
# 9- Fazer o predict com os dados de teste
# 10- Imprimir o percentual de acerto da base de teste

In [None]:
# Importação das bibliotecas necessárias
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPClassifier
from sklearn.preprocessing import MinMaxScaler
from sklearn.metrics import accuracy_score

# URL do dataset de fonemas hospedado no GitHub
phoneme_dataset_url = "https://raw.githubusercontent.com/tmoura/machinelearning/master/phoneme.data"

# Carregamento do dataset de fonemas diretamente da URL
phoneme_dataframe = pd.read_csv(phoneme_dataset_url)

# Separação da variável alvo (primeira coluna) das características
target_phoneme_labels = phoneme_dataframe.iloc[:, 0]  # Primeira coluna: classes de fonemas
feature_phoneme_data = phoneme_dataframe.iloc[:, 1:]  # Demais colunas: características dos fonemas

# Criação do normalizador para padronizar as características
phoneme_feature_scaler = MinMaxScaler()

# Normalização das características para o intervalo [0, 1]
# Isso garante que todas as features tenham a mesma escala
normalized_phoneme_features = phoneme_feature_scaler.fit_transform(feature_phoneme_data)

# Divisão dos dados em conjuntos de treino e teste
# 70% para treinamento, 30% para teste
X_train_phonemes, X_test_phonemes, y_train_phonemes, y_test_phonemes = train_test_split(
    normalized_phoneme_features, target_phoneme_labels,
    test_size=0.3, random_state=42)

# Criação do classificador MLP (Multi-Layer Perceptron)
# hidden_layer_sizes=(20, 10): primeira camada oculta com 20 neurônios, segunda com 10
# activation='relu': função de ativação ReLU para introduzir não-linearidade
# max_iter=1000: limite máximo de iterações para convergência do algoritmo
phoneme_mlp_classifier = MLPClassifier(
    hidden_layer_sizes=(20, 10),
    activation='relu',
    max_iter=1000,
    random_state=42
)

# Treinamento do modelo MLP com os dados de treino
phoneme_mlp_classifier.fit(X_train_phonemes, y_train_phonemes)

# Realização de predições no conjunto de teste
phoneme_test_predictions = phoneme_mlp_classifier.predict(X_test_phonemes)

# Cálculo da acurácia do modelo (convertida para percentual)
phoneme_classification_accuracy = accuracy_score(y_test_phonemes, phoneme_test_predictions) * 100

# Exibição do resultado da performance do modelo
print(f"Acurácia do modelo MLP na base de teste de fonemas: {phoneme_classification_accuracy:.2f}%")

Acurácia na base de teste: 81.12%
