In [1]:
# Exemplo de Classificação Binária com RNA

Este notebook demonstra o uso da implementação de Rede Neural Artificial (RNA) para um problema de classificação binária.


SyntaxError: invalid syntax (4221008870.py, line 3)

In [None]:
## 1. Importação das Bibliotecas


In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, roc_auc_score, confusion_matrix
import sys
import os

# Configurações de visualização
plt.style.use('ggplot')
%matplotlib inline


In [None]:
## 2. Importação da RNA

Para usar este notebook no Google Colab, você precisará carregar a implementação da RNA.


In [None]:
# Clone o repositório se estiver no Colab
import os
try:
    import google.colab
    IN_COLAB = True
    !git clone https://github.com/seu-usuario/ProjetoFinalML.git
    %cd ProjetoFinalML
    sys.path.insert(0, os.path.abspath(os.getcwd()))
except:
    IN_COLAB = False
    # Adicionar o diretório src ao PYTHONPATH se estiver executando localmente
    module_path = os.path.abspath(os.path.join(os.getcwd(), '..', '..'))
    if module_path not in sys.path:
        sys.path.insert(0, module_path)


In [None]:
# Importar a implementação da RNA
from src.rna import NeuralNetwork


In [None]:
## 3. Carregamento e Exploração dos Dados

Nesta seção, carregaremos um conjunto de dados para o problema de classificação binária e faremos uma exploração inicial. Usaremos o dataset de Câncer de Mama de Wisconsin, que é um problema clássico de classificação binária.


In [None]:
# Carregar o conjunto de dados de Câncer de Mama
from sklearn.datasets import load_breast_cancer

cancer = load_breast_cancer()
X = cancer.data
y = cancer.target.reshape(-1, 1)  # Garantir que y é uma matriz de coluna

# Visualizar as primeiras linhas do conjunto de dados
df = pd.DataFrame(X, columns=cancer.feature_names)
df['Target'] = y
print("Primeiras 5 linhas do conjunto de dados:")
df.head()


In [None]:
# Informações sobre o dataset
print(f"Formato do conjunto de dados: {X.shape}")
print(f"Número de classes: {len(np.unique(y))}")
print(f"Classes: {cancer.target_names}")
print(f"Distribuição das classes:")
print(pd.Series(y.flatten()).value_counts())


In [None]:
# Estatísticas descritivas
print("Estatísticas descritivas do conjunto de dados:")
df.describe()


In [None]:
## 4. Pré-processamento dos Dados

Nesta seção, realizaremos o pré-processamento necessário para preparar os dados para o treinamento da RNA.


In [None]:
# Dividir os dados em treino, validação e teste
X_train_val, X_test, y_train_val, y_test = train_test_split(X, y, test_size=0.2, random_state=42, stratify=y)
X_train, X_val, y_train, y_val = train_test_split(X_train_val, y_train_val, test_size=0.25, random_state=42, stratify=y_train_val)

print(f"Tamanho do conjunto de treinamento: {X_train.shape}")
print(f"Tamanho do conjunto de validação: {X_val.shape}")
print(f"Tamanho do conjunto de teste: {X_test.shape}")
print(f"Distribuição das classes em treinamento: {pd.Series(y_train.flatten()).value_counts()}")
print(f"Distribuição das classes em validação: {pd.Series(y_val.flatten()).value_counts()}")
print(f"Distribuição das classes em teste: {pd.Series(y_test.flatten()).value_counts()}")


In [2]:
# Normalizar os dados
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_val = scaler.transform(X_val)
X_test = scaler.transform(X_test)

print("Média e desvio padrão após normalização:")
print(f"X_train média: {X_train.mean()}, desvio padrão: {X_train.std()}")


NameError: name 'StandardScaler' is not defined

In [None]:
## 5. Visualização dos Dados

Vamos visualizar algumas características dos dados para entender melhor o problema.


In [None]:
# Visualizar a distribuição das classes
plt.figure(figsize=(8, 6))
sns.countplot(x='Target', data=df)
plt.title('Distribuição das Classes')
plt.xlabel('Classe (0: Maligno, 1: Benigno)')
plt.ylabel('Contagem')
plt.show()


In [None]:
# Selecionar algumas features para visualização
selected_features = ['mean radius', 'mean texture', 'mean perimeter', 'mean area', 'mean smoothness', 'mean compactness']

# Criar uma matriz de scatter plots para as features selecionadas
plt.figure(figsize=(15, 10))
sns.pairplot(df[selected_features + ['Target']], hue='Target')
plt.suptitle('Pairplot de Features Selecionadas', y=1.02)
plt.show()


In [None]:
# Visualizar correlações entre features
plt.figure(figsize=(20, 16))
correlation_matrix = df.corr()
mask = np.triu(correlation_matrix)
sns.heatmap(correlation_matrix, annot=False, mask=mask, cmap='coolwarm', vmin=-1, vmax=1)
plt.title('Matriz de Correlação')
plt.show()


In [None]:
## 6. Criação e Treinamento do Modelo

Nesta seção, criaremos e treinaremos o modelo de RNA para o problema de classificação binária.


In [None]:
# Criar o modelo
model = NeuralNetwork(
    layer_sizes=[X_train.shape[1], 16, 8, 1],
    activation_functions=['relu', 'relu', 'sigmoid']
)

print("Arquitetura do modelo:")
print(model)


In [None]:
# Treinar o modelo
history = model.fit(
    X_train, y_train,
    epochs=500,
    batch_size=32,
    learning_rate=0.01,
    loss_function='binary_crossentropy',
    optimizer='momentum',
    verbose=True,
    validation_data=(X_val, y_val)
)
