In [None]:
import pandas as pd
from sklearn.preprocessing import MinMaxScaler
from sklearn.utils import resample
from sklearn.model_selection import train_test_split
import tensorflow as tf
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score
import numpy as np

# Introdução a Redes Neurais

### Coleta de Dados

Escolha da Base de Dados: Selecione uma base de dados adequada para problemas de classificação. A base deve conter pelo menos uma variável alvo categórica e múltiplas variáveis independentes.

## Carregando a base de dados

In [None]:
from google.colab import files

uploaded = files.upload()

Saving data.csv to data (6).csv


In [None]:
df = pd.read_csv('data.csv')
df

Unnamed: 0,pelvic_incidence,pelvic_tilt numeric,lumbar_lordosis_angle,sacral_slope,pelvic_radius,degree_spondylolisthesis,class
0,63.027817,22.552586,39.609117,40.475232,98.672917,-0.254400,Abnormal
1,39.056951,10.060991,25.015378,28.995960,114.405425,4.564259,Abnormal
2,68.832021,22.218482,50.092194,46.613539,105.985135,-3.530317,Abnormal
3,69.297008,24.652878,44.311238,44.644130,101.868495,11.211523,Abnormal
4,49.712859,9.652075,28.317406,40.060784,108.168725,7.918501,Abnormal
...,...,...,...,...,...,...,...
305,47.903565,13.616688,36.000000,34.286877,117.449062,-4.245395,Normal
306,53.936748,20.721496,29.220534,33.215251,114.365845,-0.421010,Normal
307,61.446597,22.694968,46.170347,38.751628,125.670725,-2.707880,Normal
308,45.252792,8.693157,41.583126,36.559635,118.545842,0.214750,Normal


# Pré-processamento de Dados

* Elementos Faltantes: Trate os elementos faltantes na base de dados, se houver.
* Variáveis Categóricas: Converta variáveis categóricas em numéricas, utilizando técnicas como One-Hot Encoding, se necessário.
* Normalização: Normalize as variáveis, especialmente se for usar algortmos sensíveis à escala.
* Separação de Dados: Divida a base em conjuntos de treino e teste.

In [None]:
# Tratamento de elementos faltantes (assumindo que não há dados faltantes)
print(f"Elementos faltantes:\n{df.isna().sum()}\n")

# Convertendo a variável 'class' em numérica
df['class'] = df['class'].map({'Abnormal': 1, 'Normal': 0})

# Normalização das variáveis independentes
colunas_independentes = ["pelvic_incidence", "pelvic_tilt numeric", "lumbar_lordosis_angle", "sacral_slope", "pelvic_radius", "degree_spondylolisthesis"]
scaler = MinMaxScaler()
df[colunas_independentes] = scaler.fit_transform(df[colunas_independentes])

# Balanceamento das classes
classe_maioria = df[df["class"] == 0]
classe_minoria = df[df["class"] == 1]
classe_maioria = resample(classe_maioria, n_samples=len(classe_minoria))
df = pd.concat([classe_maioria, classe_minoria])
df = df.sample(frac=1)

# Separação dos Dados
X_train, X_test, y_train, y_test = train_test_split(df[colunas_independentes], df["class"], test_size=0.2, random_state=42)


Elementos faltantes:
pelvic_incidence            0
pelvic_tilt numeric         0
lumbar_lordosis_angle       0
sacral_slope                0
pelvic_radius               0
degree_spondylolisthesis    0
class                       0
dtype: int64



## Implementação e Treino
* Perceptron Simples: Implemente e treine um perceptron simples.

* MLP (Multilayer Perceptron): Implemente e treine um MLP.

* Algoritmo Clássico: Escolha e implemente um algoritmo clássico de Machine Learning que você acha que dará bons resultados (por exemplo, k-NN, Árvores de Decisão, SVM, etc.).

In [None]:
#Perceptron
# Modelo Perceptron em TensorFlow/Keras
modelo_p = tf.keras.Sequential([
    tf.keras.layers.Input(shape=(X_train.shape[1],)),  # Camada de entrada com o número de características
    tf.keras.layers.Dense(1, activation='sigmoid')  # Camada de saída com 1 neurônio (classificação binária)
])

modelo_p.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

# Treinamento do Modelo
modelo_p.fit(X_train, y_train, batch_size=32, epochs=100)

Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78

<keras.src.callbacks.History at 0x7e31c79a2170>

In [None]:
#MLP
# Modelo MLP em TensorFlow/Keras
modelo_mlp = tf.keras.Sequential([
    tf.keras.layers.Input(shape=(X_train.shape[1],)),  # Camada de entrada com o número de características
    tf.keras.layers.Dense(6, activation='relu'),  # Camada oculta com ativação ReLU
    tf.keras.layers.Dense(3, activation='relu'),  # Camada oculta com ativação ReLU
    tf.keras.layers.Dense(1, activation='sigmoid')  # Camada de saída com 1 neurônio (classificação binária)
])

modelo_mlp.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

# Treinamento do Modelo
modelo_mlp.fit(X_train, y_train, batch_size=32, epochs=100)


Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78

<keras.src.callbacks.History at 0x7e31d080be80>

In [None]:
# Modelo de Árvore de Decisão
modelo_dt = DecisionTreeClassifier()
modelo_dt.fit(X_train, y_train)

# Previsões no conjunto de teste
y_pred_dt = modelo_dt.predict(X_test)

## Avaliação de Modelos
* Use o conjunto de teste para fazer previsões com cada um dos modelos treinados.

* Calcule métricas de avaliação como precisão, recall e F1-score para cada modelo.

## Comparação de Desempenho
* Compare as métricas de avaliação entre os três modelos.

* Identifique qual algoritmo teve o melhor desempenho e justifique sua escolha.

In [None]:
# Avaliação do Perceptron Simples
y_pred_p = modelo_p.predict(X_test)
y_pred_p = np.where(y_pred_p >= 0.5, 1, 0)
df_comparacao_p = pd.DataFrame(y_test)
df_comparacao_p["Predição"] = y_pred_p
print("Comparação - Perceptron Simples")
print(df_comparacao_p)
accuracy_p = accuracy_score(y_test, y_pred_p)
precision_p = precision_score(y_test, y_pred_p)
recall_p = recall_score(y_test, y_pred_p)
f1_p = f1_score(y_test, y_pred_p)

# Avaliação do MLP
y_pred_mlp = modelo_mlp.predict(X_test)
y_pred_mlp = np.where(y_pred_mlp >= 0.5, 1, 0)
df_comparacao_mlp = pd.DataFrame(y_test)
df_comparacao_mlp["Predição"] = y_pred_mlp
print("Comparação - Perceptron Multi Camadas")
print(df_comparacao_mlp)
accuracy_mlp = accuracy_score(y_test, y_pred_mlp)
precision_mlp = precision_score(y_test, y_pred_mlp)
recall_mlp = recall_score(y_test, y_pred_mlp)
f1_mlp = f1_score(y_test, y_pred_mlp)

# Avaliação da Árvore de Decisão
y_pred_dt = modelo_dt.predict(X_test)
df_comparacao_dt = pd.DataFrame(y_test)
df_comparacao_dt["Predição"] = y_pred_dt
print("Comparação - Árvore de Decisão")
print(df_comparacao_dt)
accuracy_dt = accuracy_score(y_test, y_pred_dt)
precision_dt = precision_score(y_test, y_pred_dt)
recall_dt = recall_score(y_test, y_pred_dt)
f1_dt = f1_score(y_test, y_pred_dt)

# Impressão das métricas
print(f"Perceptron Simples\nAcurácia: {accuracy_p}\nPrecisão: {precision_p}\nRecall: {recall_p}\nF1-score: {f1_p}\n")
print(f"Perceptron Multicamadas\nAcurácia: {accuracy_mlp}\nPrecisão: {precision_mlp}\nRecall: {recall_mlp}\nF1-score: {f1_mlp}\n")
print(f"Árvore de Decisão\nAcurácia: {accuracy_dt}\nPrecisão: {precision_dt}\nRecall: {recall_dt}\nF1-score: {f1_dt}\n")

Comparação - Perceptron Simples
     class  Predição
231      0         1
205      1         1
19       1         0
293      0         1
236      0         1
..     ...       ...
159      1         1
101      1         1
80       1         1
275      0         1
278      0         1

[84 rows x 2 columns]
Comparação - Perceptron Multi Camadas
     class  Predição
231      0         0
205      1         1
19       1         0
293      0         0
236      0         1
..     ...       ...
159      1         1
101      1         1
80       1         1
275      0         0
278      0         0

[84 rows x 2 columns]
Comparação - Árvore de Decisão
     class  Predição
231      0         0
205      1         1
19       1         1
293      0         0
236      0         0
..     ...       ...
159      1         1
101      1         1
80       1         1
275      0         0
278      0         0

[84 rows x 2 columns]
Perceptron Simples
Acurácia: 0.47619047619047616
Precisão: 0.4782608695652

# Relatório

* Não há elementos faltantes!
* Possui variável categórica sendo a variável class
* Foi realizado a normalização
* As classes são balanceadas para garantir que não haja viés na modelagem. A classe que tem mais instâncias (no caso, 'Normal' com valor 0) é reduzida para ter o mesmo número de instâncias que a classe minoritária ('Abnormal' com valor 1). Isso é feito utilizando a função resample do scikit-learn. Em seguida, as instâncias são concatenadas e embaralhadas (frac=1) para garantir que a ordem dos dados não influencie o treinamento do modelo.

### Modelo Perceptron e MLP

* tf.keras.layers.Input: Define a camada de entrada do modelo com o número de características igual ao número de colunas em X_train.
* tf.keras.layers.Dense: Adiciona uma camada densa (totalmente conectada) com 1 neurônio de saída e ativação sigmoid, que é comumente usada em problemas de classificação binária.

* A compilação do modelo foi utilizado o otimizador Adam, para ajustar o peso do modelo durante o treinamento.
A função de perda foi utilizado a apropriada para problemas de classificação binária. Além de ter sido utilizado a métrica acuracia.

### Avaliação e Comparação

Faz isso para todos os modelos.

* Gera previsões usando o modelo Perceptron Simples nos dados de teste.
* As previsões são binarizadas (0 ou 1) com um limite de decisão de 0,5.
* Cria um DataFrame de comparação entre os rótulos reais e as previsões.
* Calcula métricas de avaliação, como acurácia, precisão, recall e F1-score.

#### Acurácia:
* Definição: Representa a proporção de previsões corretas em relação ao total de previsões.
* Fórmula: número de previsões corretas/ total de previsões
#### Precisão:

* Definição: Indica a proporção de previsões positivas corretas em relação ao total de previsões positivas.
* Fórmula: Verdadeiros positivos / verdadeiros positivos + falsos positivos.
#### Recall:
* Definição: Representa a proporção de exemplos positivos que foram corretamente identificados pelo modelo em relação ao total de exemplos positivos reais.
* Fórmula: Verdadeiros positivos / Verdadeiros positivos + falsos negativos.

#### F1-Score
* Definição: Combina precisão e recall em uma única métrica, útil quando há um equilíbrio desejado entre ambas.