# Exemplo de Regressão com RNA

Este notebook demonstra o uso da implementação de Rede Neural Artificial (RNA) para um problema de regressão.


## 1. Importação das Bibliotecas


In [23]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import mean_squared_error, r2_score
import sys
import os

# Configurações de visualização
plt.style.use('ggplot')
%matplotlib inline


## 2. Importação da RNA

Para usar este notebook no Google Colab, você precisará carregar a implementação da RNA.


In [24]:
import os
try:
    import google.colab
    IN_COLAB = True
    !git clone https://github.com/pedromandelli/RNA-Implementation.git
    %cd RNA-Implementation
    sys.path.insert(0, os.path.abspath(os.getcwd()))
except:
    IN_COLAB = False
    # Adicionar o diretório src ao PYTHONPATH se estiver executando localmente
    module_path = os.path.abspath(os.path.join(os.getcwd(), '..', '..'))
    if module_path not in sys.path:
        sys.path.insert(0, module_path)


Cloning into 'RNA-Implementation'...
remote: Enumerating objects: 171, done.[K
remote: Counting objects: 100% (171/171), done.[K
remote: Compressing objects: 100% (116/116), done.[K
remote: Total 171 (delta 60), reused 157 (delta 46), pack-reused 0 (from 0)[K
Receiving objects: 100% (171/171), 1.29 MiB | 5.49 MiB/s, done.
Resolving deltas: 100% (60/60), done.
/content/RNA-Implementation/RNA-Implementation/RNA-Implementation/RNA-Implementation


In [25]:
# Importar a implementação da RNA
from src.rna import NeuralNetwork
print("Importação da NeuralNetwork bem-sucedida.")


Importação da NeuralNetwork bem-sucedida.


## 3. Carregamento e Exploração dos Dados

Nesta seção, carregaremos um conjunto de dados para o problema de regressão e faremos uma exploração inicial.


In [26]:
if IN_COLAB:
    data_path = 'src/datasets/winequality-white.csv'
else:
    data_path = '../../src/datasets/winequality-white.csv'

df = pd.read_csv(data_path, sep=';')

X = df.drop('quality', axis=1).values
y = df['quality'].values.reshape(-1, 1)

# Visualizar as primeiras linhas do conjunto de dados
print("Primeiras 5 linhas do conjunto de dados:")
df.head()


FileNotFoundError: [Errno 2] No such file or directory: 'src/datasets/processed.winequality-white.csv'

In [None]:
# Estatísticas descritivas
df.describe()
df.corr()  # correlação entre atributos


## 4. Pré-processamento dos Dados

Nesta seção, realizaremos o pré-processamento necessário para preparar os dados para o treinamento da RNA.


In [None]:
# Dividir os dados em treino (60%), validação (20%) e teste (20%) - seguindo a orientação do professor

# Primeiro, separar 20% dos dados para teste
X_temp, X_test, y_temp, y_test = train_test_split(
    X, y, test_size=0.20, random_state=42)

# Depois, separar 25% dos dados restantes para validação (25% de 80% = 20% do total)
X_train, X_val, y_train, y_val = train_test_split(
    X_temp, y_temp, test_size=0.25, random_state=42)

print(f"Tamanho do conjunto de treinamento: {X_train.shape}")
print(f"Tamanho do conjunto de validação: {X_val.shape}")
print(f"Tamanho do conjunto de teste: {X_test.shape}")


In [None]:
# Normalizar os dados
scaler_X = StandardScaler()
X_train = scaler_X.fit_transform(X_train)
X_val = scaler_X.transform(X_val)
X_test = scaler_X.transform(X_test)

scaler_y = StandardScaler()
y_train = scaler_y.fit_transform(y_train)
y_val = scaler_y.transform(y_val)
y_test = scaler_y.transform(y_test)

print("Média e desvio padrão após normalização:")
print(f"X_train média: {X_train.mean()}, desvio padrão: {X_train.std()}")
print(f"y_train média: {y_train.mean()}, desvio padrão: {y_train.std()}")


## 5. Visualização dos Dados

Vamos visualizar algumas características dos dados para entender melhor o problema.


In [None]:
# Visualizar a relação entre as features e o target
import matplotlib.pyplot as plt

features = df.columns.drop('quality')  # ou df.columns[:-1]
fig, axes = plt.subplots(3, 4, figsize=(20, 12))  # há 11 features, então 3x4

axes = axes.flatten()

for i, feature_name in enumerate(features):
    axes[i].scatter(df[feature_name], df['quality'], alpha=0.5, s=5)
    axes[i].set_xlabel(feature_name)
    axes[i].set_ylabel('Quality')
    axes[i].set_title(f'{feature_name} vs Quality')

# Esconde qualquer subplot vazio
for j in range(len(features), len(axes)):
    axes[j].axis('off')

plt.tight_layout()
plt.show()


## 6. Criação e Treinamento do Modelo

Nesta seção, criaremos e treinaremos o modelo de RNA para o problema de regressão.


In [None]:
# Criar o modelo
model = NeuralNetwork(
    layer_sizes=[X_train.shape[1], 64, 32, 16, 1],
    activation_functions=[ 'relu', 'relu', 'relu', 'linear']
)

print("Arquitetura do modelo:")
print(model)


In [None]:
# Treinar o modelo
history = model.fit(
    X_train, y_train,
    epochs=10000,
    batch_size=32,
    learning_rate=0.001,
    loss_function='mse',
    optimizer='momentum',
    verbose=True,
    validation_data=(X_val, y_val)
)


## 7. Avaliação do Modelo

Nesta seção, avaliaremos o desempenho do modelo treinado.


In [None]:
# Fazer predições no conjunto de teste
y_pred = model.predict(X_test)

# Reverter a normalização para avaliar o desempenho nas unidades originais
y_pred_original = scaler_y.inverse_transform(y_pred)
y_test_original = scaler_y.inverse_transform(y_test)

# Calcular métricas de desempenho
mse = mean_squared_error(y_test_original, y_pred_original)
rmse = np.sqrt(mse)
r2 = r2_score(y_test_original, y_pred_original)

print(f"MSE: {mse:.4f}")
print(f"RMSE: {rmse:.4f}")
print(f"R²: {r2:.4f}")


In [None]:
# Comparar com uma baseline (média simples)
baseline_pred = np.full_like(y_test_original, scaler_y.inverse_transform(np.mean(y_train).reshape(1, -1)))
baseline_mse = mean_squared_error(y_test_original, baseline_pred)
baseline_rmse = np.sqrt(baseline_mse)
baseline_r2 = r2_score(y_test_original, baseline_pred)

print(f"Baseline MSE: {baseline_mse:.4f}")
print(f"Baseline RMSE: {baseline_rmse:.4f}")
print(f"Baseline R²: {baseline_r2:.4f}")
print(f"Melhoria sobre a baseline: {(1 - mse/baseline_mse)*100:.2f}%")

# Verificar se atende ao requisito do enunciado (erro < 50%)
erro_relativo = rmse / np.mean(np.abs(y_test_original))
print(f"Erro relativo: {erro_relativo:.4f} ({erro_relativo*100:.2f}%)")
print(f"O modelo {'atende' if erro_relativo < 0.5 else 'não atende'} ao requisito de erro < 50%")


## 8. Visualização dos Resultados

Nesta seção, visualizaremos os resultados do treinamento e as predições do modelo.


In [None]:
# Reverter a normalização
y_pred_original = scaler_y.inverse_transform(y_pred)
y_test_original = scaler_y.inverse_transform(y_test)

# Gráfico Predicted vs Actual
plt.figure(figsize=(6, 6))
plt.scatter(y_test_original, y_pred_original, alpha=0.5, color='salmon')
plt.plot([y_test_original.min(), y_test_original.max()],
         [y_test_original.min(), y_test_original.max()],
         'r--')  # linha ideal
plt.xlabel('Actual Quality')
plt.ylabel('Predicted Quality')
plt.title('Predicted vs Actual (Desnormalizado)')
plt.grid(True)
plt.tight_layout()
plt.show()


In [None]:
# Visualizar a distribuição dos erros
errors = y_pred_original - y_test_original
plt.figure(figsize=(12, 5))

plt.subplot(1, 2, 1)
plt.hist(errors, bins=50, alpha=0.75)
plt.axvline(x=0, color='r', linestyle='--')
plt.title('Error Distribution')
plt.xlabel('Prediction Error')
plt.ylabel('Count')

plt.subplot(1, 2, 2)
plt.scatter(y_pred_original, errors, alpha=0.5)
plt.axhline(y=0, color='r', linestyle='--')
plt.title('Residual Plot')
plt.xlabel('Predicted Value')
plt.ylabel('Residual')

plt.tight_layout()
plt.show()


## 9. Conclusão

Neste notebook, demonstramos o uso da nossa implementação de RNA para um problema de regressão. O modelo foi capaz de aprender a relação entre as features e o target, apresentando um desempenho satisfatório conforme mostrado pelas métricas de avaliação.

O erro do modelo é inferior a 50%, atendendo ao requisito especificado no enunciado do projeto.
