In [1]:
## Exerc√≠cio 1 - Problema do XOR

from sklearn.neural_network import MLPClassifier
import numpy as np

x = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
y = np.array([0, 1, 1, 0])

# 1- Importar o modelo MLP do sklearn
# 2- Instanciar o modelo escolhendo uma topologia para a rede, fun√ß√£o de ativa√ß√£o e n√∫mero de √©pocas de execu√ß√£o at√© 100% de acerto
# 3- Treinar o modelo com os dados de treinamento
# 4- Fazer o predict com os dados de treinamento
# 5- Comparar o resultado do predict com o vetor y

In [2]:
# Importa√ß√£o das bibliotecas necess√°rias
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix
import numpy as np
import matplotlib.pyplot as plt
from sklearn.model_selection import validation_curve

# === PROBLEMA XOR - DEFINI√á√ÉO DOS DADOS ===

print("="*60)
print("           AN√ÅLISE DE REDE NEURAL MLP - PROBLEMA XOR")
print("="*60)

# Defini√ß√£o dos dados de entrada (problema XOR cl√°ssico)
# XOR √© um problema n√£o-linearmente separ√°vel, ideal para demonstrar redes neurais
dados_entrada = np.array([
    [0, 0],  # Entrada 1: 0 XOR 0 = 0
    [0, 1],  # Entrada 2: 0 XOR 1 = 1
    [1, 0],  # Entrada 3: 1 XOR 0 = 1
    [1, 1]   # Entrada 4: 1 XOR 1 = 0
])

# Sa√≠das esperadas para o problema XOR
saidas_esperadas = np.array([0, 1, 1, 0])

print("üéØ PROBLEMA: Porta L√≥gica XOR (Exclusive OR)")
print("üìä DADOS DE TREINAMENTO:")
print("   Entrada  |  Sa√≠da Esperada")
print("   ---------|----------------")
for i, (entrada, saida) in enumerate(zip(dados_entrada, saidas_esperadas)):
    print(f"   {entrada}     |       {saida}")

print(f"\nüìè DIMENS√ïES:")
print(f"   ‚Ä¢ Dados de entrada: {dados_entrada.shape}")
print(f"   ‚Ä¢ Sa√≠das esperadas: {saidas_esperadas.shape}")
print(f"   ‚Ä¢ N√∫mero de features: {dados_entrada.shape[1]}")
print(f"   ‚Ä¢ N√∫mero de amostras: {dados_entrada.shape[0]}")

# === CONFIGURA√á√ÉO DA REDE NEURAL MLP ===

print(f"\n" + "="*60)
print("              CONFIGURA√á√ÉO DA REDE NEURAL")
print("="*60)

# Par√¢metros da rede neural
camadas_ocultas = (4,)  # Uma camada oculta com 4 neur√¥nios
funcao_ativacao = 'logistic'  # Fun√ß√£o sigmoide
max_iteracoes = 10000
semente_aleatoria = 42

print("üß† ARQUITETURA DA REDE:")
print(f"   ‚Ä¢ Camada de entrada: {dados_entrada.shape[1]} neur√¥nios")
print(f"   ‚Ä¢ Camadas ocultas: {camadas_ocultas} neur√¥nios")
print(f"   ‚Ä¢ Camada de sa√≠da: 1 neur√¥nio")
print(f"   ‚Ä¢ Total de camadas: {len(camadas_ocultas) + 2} (entrada + oculta + sa√≠da)")

print(f"\n‚öôÔ∏è  HIPERPAR√ÇMETROS:")
print(f"   ‚Ä¢ Fun√ß√£o de ativa√ß√£o: {funcao_ativacao} (sigm√≥ide)")
print(f"   ‚Ä¢ M√°ximo de itera√ß√µes: {max_iteracoes:,}")
print(f"   ‚Ä¢ Semente aleat√≥ria: {semente_aleatoria}")
print(f"   ‚Ä¢ Solver: adam (otimizador padr√£o)")

# Cria√ß√£o e configura√ß√£o do modelo MLP
modelo_mlp = MLPClassifier(
    hidden_layer_sizes=camadas_ocultas,
    activation=funcao_ativacao,
    max_iter=max_iteracoes,
    random_state=semente_aleatoria,
    solver='adam'  # Otimizador Adam (padr√£o, eficiente)
)

# === TREINAMENTO DA REDE NEURAL ===

print(f"\n" + "="*60)
print("                TREINAMENTO DA REDE")
print("="*60)

print("üîÑ Iniciando treinamento...")

# Treinamento do modelo
modelo_mlp.fit(dados_entrada, saidas_esperadas)

print("‚úÖ Treinamento conclu√≠do!")
print(f"üìà N√∫mero de itera√ß√µes realizadas: {modelo_mlp.n_iter_}")
print(f"üéØ Converg√™ncia alcan√ßada: {'Sim' if modelo_mlp.n_iter_ < max_iteracoes else 'N√£o'}")

# === PREDI√á√ïES E AVALIA√á√ÉO ===

print(f"\n" + "="*60)
print("              RESULTADOS E AVALIA√á√ÉO")
print("="*60)

# Fazer predi√ß√µes nos dados de treinamento
predicoes_mlp = modelo_mlp.predict(dados_entrada)

# Obter probabilidades das predi√ß√µes
probabilidades_predicao = modelo_mlp.predict_proba(dados_entrada)

# C√°lculo da acur√°cia
acuracia_modelo = modelo_mlp.score(dados_entrada, saidas_esperadas)

print("üìä COMPARA√á√ÉO DETALHADA:")
print("   Entrada  | Esperado | Predito | Probabilidade [Classe 0, Classe 1] | Correto?")
print("   ---------|----------|---------|-------------------------------------|----------")

for i, (entrada, esperado, predito, prob) in enumerate(zip(dados_entrada, saidas_esperadas, predicoes_mlp, probabilidades_predicao)):
    correto = "‚úÖ" if esperado == predito else "‚ùå"
    print(f"   {entrada}     |    {esperado}     |    {predito}    | [{prob[0]:.4f}, {prob[1]:.4f}]              |    {correto}")

print(f"\nüéØ M√âTRICAS DE DESEMPENHO:")
print(f"   ‚Ä¢ Acur√°cia: {acuracia_modelo*100:.1f}%")
print(f"   ‚Ä¢ Erro: {(1-acuracia_modelo)*100:.1f}%")

# === AN√ÅLISE DETALHADA DO MODELO ===

print(f"\n" + "="*60)
print("              AN√ÅLISE DETALHADA DO MODELO")
print("="*60)

# Relat√≥rio de classifica√ß√£o
print("üìã RELAT√ìRIO DE CLASSIFICA√á√ÉO:")
relatorio_classificacao = classification_report(
    saidas_esperadas,
    predicoes_mlp,
    target_names=['Classe 0 (False)', 'Classe 1 (True)'],
    zero_division=0
)
print(relatorio_classificacao)

# Matriz de confus√£o
print("üéØ MATRIZ DE CONFUS√ÉO:")
matriz_confusao = confusion_matrix(saidas_esperadas, predicoes_mlp)
print("         Predito")
print("        0    1")
print("Real 0 ", matriz_confusao[0])
print("Real 1 ", matriz_confusao[1])

# Informa√ß√µes sobre a arquitetura treinada
print(f"\nüèóÔ∏è  DETALHES DA ARQUITETURA TREINADA:")
print(f"   ‚Ä¢ N√∫mero de camadas: {modelo_mlp.n_layers_}")
print(f"   ‚Ä¢ N√∫mero de sa√≠das: {modelo_mlp.n_outputs_}")

# Pesos e biases (se desejado visualizar a estrutura interna)
print(f"\n‚öñÔ∏è  INFORMA√á√ïES DOS PESOS:")
for i, (pesos, bias) in enumerate(zip(modelo_mlp.coefs_, modelo_mlp.intercepts_)):
    camada = f"Entrada ‚Üí Oculta" if i == 0 else f"Oculta {i} ‚Üí Sa√≠da"
    print(f"   ‚Ä¢ {camada}: Matriz {pesos.shape}, Bias {bias.shape}")

# === AN√ÅLISE DA FUN√á√ÉO DE PERDA ===

print(f"\nüìâ EVOLU√á√ÉO DO TREINAMENTO:")
if hasattr(modelo_mlp, 'loss_curve_'):
    print(f"   ‚Ä¢ Perda inicial: {modelo_mlp.loss_curve_[0]:.6f}")
    print(f"   ‚Ä¢ Perda final: {modelo_mlp.loss_curve_[-1]:.6f}")
    print(f"   ‚Ä¢ Redu√ß√£o da perda: {modelo_mlp.loss_curve_[0] - modelo_mlp.loss_curve_[-1]:.6f}")
else:
    print("   ‚Ä¢ Curva de perda n√£o dispon√≠vel")

# === TESTE COM DIFERENTES CONFIGURA√á√ïES ===

print(f"\n" + "="*60)
print("          COMPARA√á√ÉO COM OUTRAS CONFIGURA√á√ïES")
print("="*60)

# Testando diferentes tamanhos de camadas ocultas
configuracoes_teste = [
    (2,), (3,), (4,), (5,), (8,),
    (2, 2), (4, 2), (3, 3)
]

print("üî¨ TESTE DE DIFERENTES ARQUITETURAS:")
print("   Arquitetura    | Itera√ß√µes | Acur√°cia")
print("   ---------------|-----------|----------")

melhores_resultados = []

for config in configuracoes_teste:
    modelo_teste = MLPClassifier(
        hidden_layer_sizes=config,
        activation='logistic',
        max_iter=10000,
        random_state=42
    )

    modelo_teste.fit(dados_entrada, saidas_esperadas)
    acuracia_teste = modelo_teste.score(dados_entrada, saidas_esperadas)

    melhores_resultados.append((config, modelo_teste.n_iter_, acuracia_teste))

    config_str = f"({', '.join(map(str, config))})"
    print(f"   {config_str:<14} | {modelo_teste.n_iter_:>8} | {acuracia_teste*100:>6.1f}%")

# Melhor configura√ß√£o
melhor_config = max(melhores_resultados, key=lambda x: (x[2], -x[1]))
print(f"\nüèÜ MELHOR CONFIGURA√á√ÉO:")
print(f"   ‚Ä¢ Arquitetura: {melhor_config[0]}")
print(f"   ‚Ä¢ Itera√ß√µes: {melhor_config[1]}")
print(f"   ‚Ä¢ Acur√°cia: {melhor_config[2]*100:.1f}%")

# === INSIGHTS E CONCLUS√ïES ===

print(f"\n" + "="*60)
print("              INSIGHTS E CONCLUS√ïES")
print("="*60)

print("üí° OBSERVA√á√ïES IMPORTANTES:")
print("   ‚Ä¢ O problema XOR √© n√£o-linearmente separ√°vel")
print("   ‚Ä¢ Perceptrons simples n√£o conseguem resolver XOR")
print("   ‚Ä¢ MLPs com camadas ocultas resolvem o problema facilmente")
print("   ‚Ä¢ A fun√ß√£o sigmoide permite n√£o-linearidade necess√°ria")

print(f"\nüéì LI√á√ïES APRENDIDAS:")
print("   ‚Ä¢ Import√¢ncia das camadas ocultas para problemas n√£o-lineares")
print("   ‚Ä¢ Fun√ß√£o de ativa√ß√£o sigm√≥ide adequada para classifica√ß√£o bin√°ria")
print("   ‚Ä¢ Poucas itera√ß√µes necess√°rias para converg√™ncia neste problema")
print("   ‚Ä¢ Diferentes arquiteturas podem alcan√ßar 100% de acur√°cia")

print(f"\n‚ö†Ô∏è  LIMITA√á√ïES E CONSIDERA√á√ïES:")
print("   ‚Ä¢ Treinamento e teste no mesmo conjunto (overfitting poss√≠vel)")
print("   ‚Ä¢ Problema muito simples (apenas 4 amostras)")
print("   ‚Ä¢ Em problemas reais, usar valida√ß√£o cruzada")
print("   ‚Ä¢ Considerar regulariza√ß√£o para datasets maiores")

print(f"\nüîß PR√ìXIMOS PASSOS SUGERIDOS:")
print("   ‚Ä¢ Testar com fun√ß√µes de ativa√ß√£o diferentes (ReLU, tanh)")
print("   ‚Ä¢ Experimentar com problemas mais complexos")
print("   ‚Ä¢ Implementar valida√ß√£o cruzada")
print("   ‚Ä¢ Visualizar a superf√≠cie de decis√£o")
print("   ‚Ä¢ Analisar os pesos aprendidos pela rede")

print(f"\n" + "="*60)
print("                 AN√ÅLISE CONCLU√çDA")
print("="*60)

           AN√ÅLISE DE REDE NEURAL MLP - PROBLEMA XOR
üéØ PROBLEMA: Porta L√≥gica XOR (Exclusive OR)
üìä DADOS DE TREINAMENTO:
   Entrada  |  Sa√≠da Esperada
   ---------|----------------
   [0 0]     |       0
   [0 1]     |       1
   [1 0]     |       1
   [1 1]     |       0

üìè DIMENS√ïES:
   ‚Ä¢ Dados de entrada: (4, 2)
   ‚Ä¢ Sa√≠das esperadas: (4,)
   ‚Ä¢ N√∫mero de features: 2
   ‚Ä¢ N√∫mero de amostras: 4

              CONFIGURA√á√ÉO DA REDE NEURAL
üß† ARQUITETURA DA REDE:
   ‚Ä¢ Camada de entrada: 2 neur√¥nios
   ‚Ä¢ Camadas ocultas: (4,) neur√¥nios
   ‚Ä¢ Camada de sa√≠da: 1 neur√¥nio
   ‚Ä¢ Total de camadas: 3 (entrada + oculta + sa√≠da)

‚öôÔ∏è  HIPERPAR√ÇMETROS:
   ‚Ä¢ Fun√ß√£o de ativa√ß√£o: logistic (sigm√≥ide)
   ‚Ä¢ M√°ximo de itera√ß√µes: 10,000
   ‚Ä¢ Semente aleat√≥ria: 42
   ‚Ä¢ Solver: adam (otimizador padr√£o)

                TREINAMENTO DA REDE
üîÑ Iniciando treinamento...
‚úÖ Treinamento conclu√≠do!
üìà N√∫mero de itera√ß√µes realizadas: 172
üéØ Con

In [None]:
## Exerc√≠cio 2 - Dataset Parkinsons

# 1- Carregar a base de dados Parkinsons
url = "https://raw.githubusercontent.com/tmoura/machinelearning/master/parkinsons.data"

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPClassifier
from sklearn import metrics

# 2- Normalizar todas as colunas (normalizar √© deixar todos os valores das colunas entre 0 e 1)
# 3- Separar o dataset em X (matriz de features) e y (coluna target)
# 4- Gerar as bases de treinamento e teste
# 5- Importar o modelo MLP do sklearn
# 6- Instanciar o modelo escolhendo uma topologia para a rede, fun√ß√£o de ativa√ß√£o e n√∫mero de √©pocas de execu√ß√£o at√© que obtenha uma taxa de acerto est√°vel
# 7- Treinar o modelo com os dados de treinamento
# 8- Fazer o predict com os dados de teste
# 9- Imprimir o percentual de acerto da base de teste

In [None]:
# Importa√ß√£o das bibliotecas necess√°rias
import pandas as pd
from sklearn.model_selection import train_test_split, cross_val_score, validation_curve
from sklearn.neural_network import MLPClassifier
from sklearn.preprocessing import MinMaxScaler
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix, roc_auc_score, roc_curve
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import GridSearchCV
import warnings
warnings.filterwarnings('ignore')

# === CARREGAMENTO E PREPARA√á√ÉO DOS DADOS ===

print("="*70)
print("    AN√ÅLISE DE PARKINSON COM REDE NEURAL MLP - DATASET COMPLETO")
print("="*70)

# URL do dataset de Parkinson
url_dataset = "https://raw.githubusercontent.com/tmoura/machinelearning/master/parkinsons.data"

print("üì• CARREGANDO DATASET...")
# Carregamento inicial sem cabe√ßalho (ser√° definido manualmente)
dataset_bruto = pd.read_csv(url_dataset, header=None)

# Defini√ß√£o manual das colunas baseada na documenta√ß√£o do dataset UCI
nomes_colunas = [
    'name',           # Nome do paciente
    'MDVP:Fo(Hz)',    # Frequ√™ncia fundamental m√©dia
    'MDVP:Fhi(Hz)',   # Frequ√™ncia fundamental m√°xima
    'MDVP:Flo(Hz)',   # Frequ√™ncia fundamental m√≠nima
    'MDVP:Jitter(%)', # Varia√ß√£o percentual da frequ√™ncia fundamental
    'MDVP:Jitter(Abs)', # Varia√ß√£o absoluta da frequ√™ncia fundamental
    'MDVP:RAP',       # Medida de perturba√ß√£o da frequ√™ncia
    'MDVP:PPQ',       # Medida de perturba√ß√£o de cinco pontos
    'Jitter:DDP',     # Diferen√ßa de perturba√ß√£o m√©dia
    'MDVP:Shimmer',   # Varia√ß√£o local da amplitude
    'MDVP:Shimmer(dB)', # Varia√ß√£o da amplitude em dB
    'Shimmer:APQ3',   # Medida de perturba√ß√£o de amplitude (3 pontos)
    'Shimmer:APQ5',   # Medida de perturba√ß√£o de amplitude (5 pontos)
    'MDVP:APQ',       # Medida de perturba√ß√£o de amplitude
    'Shimmer:DDA',    # Diferen√ßa de perturba√ß√£o de amplitude m√©dia
    'NHR',            # Rela√ß√£o ru√≠do-harm√¥nico
    'HNR',            # Rela√ß√£o harm√¥nico-ru√≠do
    'status',         # Status: 1=Parkinson, 0=Saud√°vel
    'RPDE',           # Medida de din√¢mica n√£o-linear
    'DFA',            # Expoente de flutua√ß√£o sem tend√™ncia
    'spread1',        # Medida de varia√ß√£o vocal fundamental
    'spread2',        # Medida de varia√ß√£o vocal n√£o-linear
    'D2',             # Dimens√£o de correla√ß√£o
    'PPE'             # Entropia de perturba√ß√£o de per√≠odo
]

# Aplica√ß√£o dos nomes das colunas
dataset_completo = dataset_bruto.copy()
dataset_completo.columns = nomes_colunas

print("‚úÖ Dataset carregado com sucesso!")

# === EXPLORA√á√ÉO INICIAL DOS DADOS ===

print(f"\nüìä INFORMA√á√ïES GERAIS DO DATASET:")
print(f"   ‚Ä¢ Dimens√µes: {dataset_completo.shape}")
print(f"   ‚Ä¢ N√∫mero de pacientes: {dataset_completo.shape[0]}")
print(f"   ‚Ä¢ N√∫mero de caracter√≠sticas: {dataset_completo.shape[1]-2} (excluindo 'name' e 'status')")

print(f"\nüéØ DISTRIBUI√á√ÉO DO DIAGN√ìSTICO:")
distribuicao_diagnostico = dataset_completo['status'].value_counts()
print(f"   ‚Ä¢ Pacientes com Parkinson (status=1): {distribuicao_diagnostico[1]} ({distribuicao_diagnostico[1]/len(dataset_completo)*100:.1f}%)")
print(f"   ‚Ä¢ Pacientes saud√°veis (status=0): {distribuicao_diagnostico[0]} ({distribuicao_diagnostico[0]/len(dataset_completo)*100:.1f}%)")

# Verifica√ß√£o de valores faltantes
valores_faltantes = dataset_completo.isnull().sum().sum()
print(f"\nüîç QUALIDADE DOS DADOS:")
print(f"   ‚Ä¢ Valores faltantes: {valores_faltantes}")
print(f"   ‚Ä¢ Duplicatas: {dataset_completo.duplicated().sum()}")

# === PREPARA√á√ÉO DAS VARI√ÅVEIS ===

print(f"\n" + "="*70)
print("                    PREPARA√á√ÉO DAS VARI√ÅVEIS")
print("="*70)

# Separa√ß√£o das features e target
# Remove 'name' (identificador) e 'status' (target) das features
features_clinicas = dataset_completo.drop(['name', 'status'], axis=1)
diagnostico_target = dataset_completo['status']

print(f"üìã CARACTER√çSTICAS CL√çNICAS SELECIONADAS:")
print(f"   ‚Ä¢ Total de features: {features_clinicas.shape[1]}")
print(f"   ‚Ä¢ Features relacionadas √† frequ√™ncia (Jitter): {sum('jitter' in col.lower() for col in features_clinicas.columns)}")
print(f"   ‚Ä¢ Features relacionadas √† amplitude (Shimmer): {sum('shimmer' in col.lower() for col in features_clinicas.columns)}")
print(f"   ‚Ä¢ Features de ru√≠do (NHR, HNR): {sum(col in ['NHR', 'HNR'] for col in features_clinicas.columns)}")
print(f"   ‚Ä¢ Features de din√¢mica n√£o-linear: {sum(col in ['RPDE', 'DFA', 'D2', 'PPE', 'spread1', 'spread2'] for col in features_clinicas.columns)}")

# Estat√≠sticas descritivas
print(f"\nüî¢ ESTAT√çSTICAS DAS FEATURES:")
estatisticas = features_clinicas.describe()
print(f"   ‚Ä¢ M√©dia das m√©dias: {estatisticas.loc['mean'].mean():.4f}")
print(f"   ‚Ä¢ Varia√ß√£o das escalas: {estatisticas.loc['std'].std():.4f} (indica necessidade de normaliza√ß√£o)")

# === NORMALIZA√á√ÉO DOS DADOS ===

print(f"\n‚öñÔ∏è  NORMALIZA√á√ÉO DOS DADOS:")
print("   ‚Ä¢ Aplicando MinMaxScaler (escala 0-1)")

# Aplica√ß√£o do MinMaxScaler para normalizar todas as features
normalizador = MinMaxScaler()
features_normalizadas = normalizador.fit_transform(features_clinicas)

# Cria√ß√£o de DataFrame com dados normalizados
dataset_normalizado = pd.DataFrame(
    features_normalizadas,
    columns=features_clinicas.columns
)

print("   ‚Ä¢ ‚úÖ Normaliza√ß√£o conclu√≠da")
print(f"   ‚Ä¢ Intervalo ap√≥s normaliza√ß√£o: [{dataset_normalizado.min().min():.3f}, {dataset_normalizado.max().max():.3f}]")

# === DIVIS√ÉO DOS DADOS ===

print(f"\n" + "="*70)
print("                      DIVIS√ÉO DOS DADOS")
print("="*70)

# Divis√£o estratificada dos dados (70% treino, 30% teste)
X_treino, X_teste, y_treino, y_teste = train_test_split(
    features_normalizadas,
    diagnostico_target,
    test_size=0.3,
    random_state=42,
    stratify=diagnostico_target  # Mant√©m propor√ß√£o das classes
)

print(f"üìä CONJUNTOS DE DADOS:")
print(f"   ‚Ä¢ Treino: {X_treino.shape[0]} amostras ({X_treino.shape[0]/len(dataset_completo)*100:.1f}%)")
print(f"   ‚Ä¢ Teste: {X_teste.shape[0]} amostras ({X_teste.shape[0]/len(dataset_completo)*100:.1f}%)")

print(f"\nüéØ DISTRIBUI√á√ÉO NOS CONJUNTOS:")
print("   Treino:")
treino_dist = pd.Series(y_treino).value_counts()
for classe, qtd in treino_dist.items():
    status_nome = "Parkinson" if classe == 1 else "Saud√°vel"
    print(f"     ‚Ä¢ {status_nome}: {qtd} ({qtd/len(y_treino)*100:.1f}%)")

print("   Teste:")
teste_dist = pd.Series(y_teste).value_counts()
for classe, qtd in teste_dist.items():
    status_nome = "Parkinson" if classe == 1 else "Saud√°vel"
    print(f"     ‚Ä¢ {status_nome}: {qtd} ({qtd/len(y_teste)*100:.1f}%)")

# === CONFIGURA√á√ÉO E TREINAMENTO DA REDE NEURAL ===

print(f"\n" + "="*70)
print("               CONFIGURA√á√ÉO DA REDE NEURAL MLP")
print("="*70)

# Configura√ß√£o da arquitetura da rede
camadas_ocultas = (10, 5)  # Primeira camada: 10 neur√¥nios, Segunda camada: 5 neur√¥nios
funcao_ativacao = 'relu'   # ReLU: boa para problemas de classifica√ß√£o
max_iteracoes = 1000
semente_aleatoria = 42

print("üß† ARQUITETURA DA REDE:")
print(f"   ‚Ä¢ Camada de entrada: {X_treino.shape[1]} neur√¥nios (features)")
print(f"   ‚Ä¢ Camadas ocultas: {camadas_ocultas}")
print(f"   ‚Ä¢ Camada de sa√≠da: 1 neur√¥nio (classifica√ß√£o bin√°ria)")
print(f"   ‚Ä¢ Total de par√¢metros estimado: ~{X_treino.shape[1]*camadas_ocultas[0] + camadas_ocultas[0]*camadas_ocultas[1] + camadas_ocultas[1]*1}")

print(f"\n‚öôÔ∏è  HIPERPAR√ÇMETROS:")
print(f"   ‚Ä¢ Fun√ß√£o de ativa√ß√£o: {funcao_ativacao} (Rectified Linear Unit)")
print(f"   ‚Ä¢ Solver: adam (otimizador adaptativo)")
print(f"   ‚Ä¢ M√°ximo de itera√ß√µes: {max_iteracoes:,}")
print(f"   ‚Ä¢ Semente aleat√≥ria: {semente_aleatoria}")

# Cria√ß√£o do modelo MLP
modelo_mlp_parkinson = MLPClassifier(
    hidden_layer_sizes=camadas_ocultas,
    activation=funcao_ativacao,
    max_iter=max_iteracoes,
    random_state=semente_aleatoria,
    solver='adam'
)

print(f"\nüîÑ INICIANDO TREINAMENTO...")

# Treinamento do modelo
modelo_mlp_parkinson.fit(X_treino, y_treino)

print(f"‚úÖ TREINAMENTO CONCLU√çDO!")
print(f"   ‚Ä¢ Itera√ß√µes realizadas: {modelo_mlp_parkinson.n_iter_}")
print(f"   ‚Ä¢ Converg√™ncia: {'‚úÖ Sim' if modelo_mlp_parkinson.n_iter_ < max_iteracoes else '‚ö†Ô∏è N√£o (pode precisar de mais itera√ß√µes)'}")

# === AVALIA√á√ÉO DO MODELO ===

print(f"\n" + "="*70)
print("                    AVALIA√á√ÉO DO MODELO")
print("="*70)

# Predi√ß√µes no conjunto de teste
predicoes_teste = modelo_mlp_parkinson.predict(X_teste)
probabilidades_teste = modelo_mlp_parkinson.predict_proba(X_teste)

# Predi√ß√µes no conjunto de treino (para verificar overfitting)
predicoes_treino = modelo_mlp_parkinson.predict(X_treino)

# C√°lculo das m√©tricas
acuracia_teste = accuracy_score(y_teste, predicoes_teste)
acuracia_treino = accuracy_score(y_treino, predicoes_treino)
auc_score = roc_auc_score(y_teste, probabilidades_teste[:, 1])

print(f"üìä M√âTRICAS PRINCIPAIS:")
print(f"   ‚Ä¢ Acur√°cia no treino: {acuracia_treino*100:.2f}%")
print(f"   ‚Ä¢ Acur√°cia no teste: {acuracia_teste*100:.2f}%")
print(f"   ‚Ä¢ Diferen√ßa (overfitting): {(acuracia_treino-acuracia_teste)*100:.2f} pontos percentuais")
print(f"   ‚Ä¢ AUC-ROC: {auc_score:.4f}")

# Interpreta√ß√£o do resultado
if abs(acuracia_treino - acuracia_teste) < 0.05:
    print("   ‚Ä¢ ‚úÖ Modelo bem balanceado (baixo overfitting)")
elif acuracia_treino - acuracia_teste > 0.1:
    print("   ‚Ä¢ ‚ö†Ô∏è Poss√≠vel overfitting detectado")
else:
    print("   ‚Ä¢ üîç Diferen√ßa aceit√°vel entre treino e teste")

# === AN√ÅLISE DETALHADA ===

print(f"\nüìã RELAT√ìRIO DE CLASSIFICA√á√ÉO DETALHADO:")
nomes_classes = ['Saud√°vel', 'Parkinson']
relatorio = classification_report(
    y_teste,
    predicoes_teste,
    target_names=nomes_classes,
    digits=4
)
print(relatorio)

# Matriz de confus√£o
print(f"üéØ MATRIZ DE CONFUS√ÉO:")
matriz_confusao = confusion_matrix(y_teste, predicoes_teste)
print("                 Predito")
print("              Saud√°vel  Parkinson")
print(f"Real Saud√°vel    {matriz_confusao[0,0]:>3}      {matriz_confusao[0,1]:>3}")
print(f"Real Parkinson   {matriz_confusao[1,0]:>3}      {matriz_confusao[1,1]:>3}")

# An√°lise cl√≠nica dos erros
vp = matriz_confusao[1,1]  # Verdadeiros positivos
vn = matriz_confusao[0,0]  # Verdadeiros negativos
fp = matriz_confusao[0,1]  # Falsos positivos
fn = matriz_confusao[1,0]  # Falsos negativos

sensibilidade = vp / (vp + fn) if (vp + fn) > 0 else 0
especificidade = vn / (vn + fp) if (vn + fp) > 0 else 0

print(f"\nüè• M√âTRICAS CL√çNICAS:")
print(f"   ‚Ä¢ Sensibilidade (detec√ß√£o de Parkinson): {sensibilidade:.4f} ({sensibilidade*100:.1f}%)")
print(f"   ‚Ä¢ Especificidade (detec√ß√£o de saud√°veis): {especificidade:.4f} ({especificidade*100:.1f}%)")
print(f"   ‚Ä¢ Falsos negativos (Parkinson n√£o detectado): {fn} casos")
print(f"   ‚Ä¢ Falsos positivos (Saud√°vel classificado como Parkinson): {fp} casos")

# === OTIMIZA√á√ÉO DE HIPERPAR√ÇMETROS ===

print(f"\n" + "="*70)
print("              OTIMIZA√á√ÉO DE HIPERPAR√ÇMETROS")
print("="*70)

print("üî¨ TESTANDO DIFERENTES CONFIGURA√á√ïES...")

# Defini√ß√£o do grid de hiperpar√¢metros para teste
parametros_grid = {
    'hidden_layer_sizes': [(5,), (10,), (15,), (10, 5), (15, 8), (20, 10)],
    'activation': ['relu', 'tanh'],
    'learning_rate_init': [0.001, 0.01]
}

# Grid Search com valida√ß√£o cruzada
busca_grid = GridSearchCV(
    MLPClassifier(max_iter=1000, random_state=42),
    parametros_grid,
    cv=5,  # 5-fold cross validation
    scoring='accuracy',
    n_jobs=-1
)

busca_grid.fit(X_treino, y_treino)

print("‚úÖ OTIMIZA√á√ÉO CONCLU√çDA!")
print(f"\nüèÜ MELHORES HIPERPAR√ÇMETROS:")
for parametro, valor in busca_grid.best_params_.items():
    print(f"   ‚Ä¢ {parametro}: {valor}")

print(f"\nüìà RESULTADO DA OTIMIZA√á√ÉO:")
print(f"   ‚Ä¢ Melhor score (CV): {busca_grid.best_score_:.4f}")
print(f"   ‚Ä¢ Score do modelo original: {cross_val_score(modelo_mlp_parkinson, X_treino, y_treino, cv=5).mean():.4f}")

# Teste do modelo otimizado
modelo_otimizado = busca_grid.best_estimator_
predicoes_otimizadas = modelo_otimizado.predict(X_teste)
acuracia_otimizada = accuracy_score(y_teste, predicoes_otimizadas)

print(f"   ‚Ä¢ Acur√°cia modelo otimizado: {acuracia_otimizada*100:.2f}%")
print(f"   ‚Ä¢ Melhoria: {(acuracia_otimizada - acuracia_teste)*100:+.2f} pontos percentuais")

# === AN√ÅLISE DE IMPORT√ÇNCIA DAS FEATURES ===

print(f"\n" + "="*70)
print("              AN√ÅLISE DE IMPORT√ÇNCIA DAS FEATURES")
print("="*70)

# Permutation importance (aproxima√ß√£o para MLPs)
from sklearn.inspection import permutation_importance

print("üîç CALCULANDO IMPORT√ÇNCIA DAS FEATURES...")
importancia_result = permutation_importance(
    modelo_otimizado, X_teste, y_teste,
    n_repeats=10, random_state=42
)

# Ordenar features por import√¢ncia
indices_importantes = np.argsort(importancia_result.importances_mean)[::-1]

print(f"\nüìä TOP 10 FEATURES MAIS IMPORTANTES:")
for i in range(min(10, len(indices_importantes))):
    idx = indices_importantes[i]
    feature_nome = features_clinicas.columns[idx]
    importancia = importancia_result.importances_mean[idx]
    std = importancia_result.importances_std[idx]
    print(f"   {i+1:2d}. {feature_nome:<20}: {importancia:.4f} (¬±{std:.4f})")

# === VALIDA√á√ÉO CRUZADA ===

print(f"\n" + "="*70)
print("                    VALIDA√á√ÉO CRUZADA")
print("="*70)

print("üîÑ EXECUTANDO VALIDA√á√ÉO CRUZADA (10-fold)...")
scores_cv = cross_val_score(modelo_otimizado, features_normalizadas, diagnostico_target, cv=10)

print(f"üìä RESULTADOS DA VALIDA√á√ÉO CRUZADA:")
print(f"   ‚Ä¢ Acur√°cia m√©dia: {scores_cv.mean():.4f} (¬±{scores_cv.std()*2:.4f})")
print(f"   ‚Ä¢ Intervalo de confian√ßa 95%: [{scores_cv.mean()-scores_cv.std()*2:.4f}, {scores_cv.mean()+scores_cv.std()*2:.4f}]")
print(f"   ‚Ä¢ Melhor fold: {scores_cv.max():.4f}")
print(f"   ‚Ä¢ Pior fold: {scores_cv.min():.4f}")

# === INSIGHTS E CONCLUS√ïES ===

print(f"\n" + "="*70)
print("                 INSIGHTS E CONCLUS√ïES")
print("="*70)

print("üí° PRINCIPAIS DESCOBERTAS:")
print(f"   ‚Ä¢ Modelo MLP alcan√ßou {acuracia_otimizada*100:.1f}% de acur√°cia")
print(f"   ‚Ä¢ Sensibilidade de {sensibilidade*100:.1f}% para detec√ß√£o de Parkinson")
print(f"   ‚Ä¢ Especificidade de {especificidade*100:.1f}% para detec√ß√£o de casos saud√°veis")
print(f"   ‚Ä¢ {fn} casos de Parkinson n√£o detectados (falsos negativos)")

print(f"\nüè• RELEV√ÇNCIA CL√çNICA:")
if sensibilidade > 0.9:
    print("   ‚Ä¢ ‚úÖ Excelente capacidade de detectar Parkinson")
elif sensibilidade > 0.8:
    print("   ‚Ä¢ ‚úÖ Boa capacidade de detectar Parkinson")
else:
    print("   ‚Ä¢ ‚ö†Ô∏è Sensibilidade pode ser melhorada para uso cl√≠nico")

if especificidade > 0.9:
    print("   ‚Ä¢ ‚úÖ Excelente capacidade de identificar casos saud√°veis")
elif especificidade > 0.8:
    print("   ‚Ä¢ ‚úÖ Boa capacidade de identificar casos saud√°veis")
else:
    print("   ‚Ä¢ ‚ö†Ô∏è Especificidade pode ser melhorada para reduzir alarmes falsos")

print(f"\nüî¨ CARACTER√çSTICAS DO MODELO:")
print("   ‚Ä¢ Features de voz s√£o altamente informativas para Parkinson")
print("   ‚Ä¢ Normaliza√ß√£o essencial para converg√™ncia do MLP")
print("   ‚Ä¢ Arquitetura com duas camadas ocultas mostrou-se eficaz")
print("   ‚Ä¢ Fun√ß√£o ReLU adequada para este tipo de problema")

print(f"\n‚ö†Ô∏è  LIMITA√á√ïES E CONSIDERA√á√ïES:")
print("   ‚Ä¢ Dataset relativamente pequeno (podem haver vieses)")
print("   ‚Ä¢ Modelo deve ser validado em popula√ß√£o mais ampla")
print("   ‚Ä¢ N√£o substitui diagn√≥stico m√©dico especializado")
print("   ‚Ä¢ Features baseadas apenas em caracter√≠sticas de voz")

print(f"\nüîß RECOMENDA√á√ïES PARA MELHORIA:")
print("   ‚Ä¢ Coletar mais dados para melhor generaliza√ß√£o")
print("   ‚Ä¢ Incluir features demogr√°ficas e cl√≠nicas adicionais")
print("   ‚Ä¢ Testar arquiteturas mais profundas ou outros algoritmos")
print("   ‚Ä¢ Implementar ensemble methods para maior robustez")
print("   ‚Ä¢ Desenvolver interface cl√≠nica para uso pr√°tico")

print(f"\n" + "="*70)
print("                    AN√ÅLISE CONCLU√çDA")
print("="*70)
print("üìã Relat√≥rio completo da an√°lise de Parkinson com MLP gerado com sucesso!")

ValueError: Length mismatch: Expected axis has 23 elements, new values have 24 elements

In [None]:
## Exerc√≠cio 3 - Dataset Penguins

# 1- Carregar a base de dados Penguins da API do Seaborn
# 2- A base precisar√° ser tratada: Existem valores nulos e dados categ√≥ricos
####### 3- Normalizar todas as colunas (normalizar √© deixar todos os valores das colunas entre 0 e 1) --> Redes Neurais s√£o sens√≠veis as diferen√ßas escalares de valores das features
# 4- Separar o dataset em X (matriz de features) e y (coluna target)
# 5- Gerar as bases de treinamento e teste
# 6- Importar o modelo MLP do sklearn
# 7- Instanciar o modelo escolhendo uma topologia para a rede, fun√ß√£o de ativa√ß√£o e n√∫mero de √©pocas de execu√ß√£o at√© que obtenha uma taxa de acerto est√°vel
# 8- Treinar o modelo com os dados de treinamento
# 9- Fazer o predict com os dados de teste
# 10- Imprimir o percentual de acerto da base de teste

In [None]:
# Importa√ß√£o das bibliotecas necess√°rias
import pandas as pd
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPClassifier
from sklearn.preprocessing import MinMaxScaler, LabelEncoder
from sklearn.metrics import accuracy_score

# Carregamento do dataset de pinguins do seaborn
penguin_dataset = sns.load_dataset('penguins')

# Remo√ß√£o de linhas com valores ausentes (NaN)
clean_penguin_data = penguin_dataset.dropna()

# Cria√ß√£o dos codificadores de r√≥tulos para vari√°veis categ√≥ricas
species_encoder = LabelEncoder()
island_encoder = LabelEncoder()
sex_encoder = LabelEncoder()

# Codifica√ß√£o da vari√°vel alvo 'species' (esp√©cie)
clean_penguin_data['species'] = species_encoder.fit_transform(clean_penguin_data['species'])

# Codifica√ß√£o da vari√°vel categ√≥rica 'island' (ilha)
clean_penguin_data['island'] = island_encoder.fit_transform(clean_penguin_data['island'])

# Codifica√ß√£o da vari√°vel categ√≥rica 'sex' (sexo)
clean_penguin_data['sex'] = sex_encoder.fit_transform(clean_penguin_data['sex'])

# Separa√ß√£o das caracter√≠sticas (features) e da vari√°vel alvo (target)
feature_variables = clean_penguin_data.drop('species', axis=1)
target_variable = clean_penguin_data['species']

# Cria√ß√£o do normalizador MinMaxScaler para padronizar os dados
feature_scaler = MinMaxScaler()

# Normaliza√ß√£o das caracter√≠sticas para o intervalo [0, 1]
normalized_features = feature_scaler.fit_transform(feature_variables)

# Divis√£o dos dados em conjuntos de treino e teste (70% treino, 30% teste)
X_train_set, X_test_set, y_train_set, y_test_set = train_test_split(
    normalized_features, target_variable, test_size=0.3, random_state=42)

# Cria√ß√£o do modelo MLP (Multi-Layer Perceptron)
# hidden_layer_sizes=(10, 5): primeira camada oculta com 10 neur√¥nios, segunda com 5
# activation='relu': fun√ß√£o de ativa√ß√£o ReLU (Rectified Linear Unit)
# max_iter=1000: m√°ximo de 1000 itera√ß√µes para converg√™ncia
mlp_classifier = MLPClassifier(
    hidden_layer_sizes=(10, 5),
    activation='relu',
    max_iter=1000,
    random_state=42
)

# Treinamento do modelo com os dados de treino
mlp_classifier.fit(X_train_set, y_train_set)

# Realiza√ß√£o de predi√ß√µes no conjunto de teste
test_predictions = mlp_classifier.predict(X_test_set)

# C√°lculo da acur√°cia do modelo (convertida para percentual)
model_accuracy = accuracy_score(y_test_set, test_predictions) * 100

# Exibi√ß√£o do resultado da acur√°cia
print(f"Acur√°cia do modelo na base de teste: {model_accuracy:.2f}%")

Acur√°cia na base de teste: 99.00%




In [None]:
## Exerc√≠cio 4 - Dataset Phoneme

# 1- Carregar a base "phoneme"
url = "https://raw.githubusercontent.com/tmoura/machinelearning/master/phoneme.data"

# 2- A coluna 0 √© o target
# 3- Todas as colunas s√£o num√©ricas e n√£o possui valores nulos
# 4- Separar o dataset em X (matriz de features) e y (coluna target)
# 5- Gerar as bases de treinamento e teste
# 6- Importar o modelo MLP do sklearn
# 7- Instanciar o modelo escolhendo uma topologia para a rede, fun√ß√£o de ativa√ß√£o e n√∫mero de √©pocas de execu√ß√£o at√© que obtenha uma taxa de acerto est√°vel
# 8- Treinar o modelo com os dados de treinamento
# 9- Fazer o predict com os dados de teste
# 10- Imprimir o percentual de acerto da base de teste

In [None]:
# Importa√ß√£o das bibliotecas necess√°rias
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPClassifier
from sklearn.preprocessing import MinMaxScaler
from sklearn.metrics import accuracy_score

# URL do dataset de fonemas hospedado no GitHub
phoneme_dataset_url = "https://raw.githubusercontent.com/tmoura/machinelearning/master/phoneme.data"

# Carregamento do dataset de fonemas diretamente da URL
phoneme_dataframe = pd.read_csv(phoneme_dataset_url)

# Separa√ß√£o da vari√°vel alvo (primeira coluna) das caracter√≠sticas
target_phoneme_labels = phoneme_dataframe.iloc[:, 0]  # Primeira coluna: classes de fonemas
feature_phoneme_data = phoneme_dataframe.iloc[:, 1:]  # Demais colunas: caracter√≠sticas dos fonemas

# Cria√ß√£o do normalizador para padronizar as caracter√≠sticas
phoneme_feature_scaler = MinMaxScaler()

# Normaliza√ß√£o das caracter√≠sticas para o intervalo [0, 1]
# Isso garante que todas as features tenham a mesma escala
normalized_phoneme_features = phoneme_feature_scaler.fit_transform(feature_phoneme_data)

# Divis√£o dos dados em conjuntos de treino e teste
# 70% para treinamento, 30% para teste
X_train_phonemes, X_test_phonemes, y_train_phonemes, y_test_phonemes = train_test_split(
    normalized_phoneme_features, target_phoneme_labels,
    test_size=0.3, random_state=42)

# Cria√ß√£o do classificador MLP (Multi-Layer Perceptron)
# hidden_layer_sizes=(20, 10): primeira camada oculta com 20 neur√¥nios, segunda com 10
# activation='relu': fun√ß√£o de ativa√ß√£o ReLU para introduzir n√£o-linearidade
# max_iter=1000: limite m√°ximo de itera√ß√µes para converg√™ncia do algoritmo
phoneme_mlp_classifier = MLPClassifier(
    hidden_layer_sizes=(20, 10),
    activation='relu',
    max_iter=1000,
    random_state=42
)

# Treinamento do modelo MLP com os dados de treino
phoneme_mlp_classifier.fit(X_train_phonemes, y_train_phonemes)

# Realiza√ß√£o de predi√ß√µes no conjunto de teste
phoneme_test_predictions = phoneme_mlp_classifier.predict(X_test_phonemes)

# C√°lculo da acur√°cia do modelo (convertida para percentual)
phoneme_classification_accuracy = accuracy_score(y_test_phonemes, phoneme_test_predictions) * 100

# Exibi√ß√£o do resultado da performance do modelo
print(f"Acur√°cia do modelo MLP na base de teste de fonemas: {phoneme_classification_accuracy:.2f}%")

Acur√°cia na base de teste: 81.12%
