In [20]:
import pandas as pd
from sklearn.preprocessing import MinMaxScaler
from sklearn.utils import resample
from sklearn.model_selection import train_test_split
import tensorflow as tf
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score
import numpy as np

from sklearn.metrics import confusion_matrix
import seaborn as sns
import matplotlib.pyplot as plt


In [21]:
df = pd.read_csv('data.csv')
df


#Incidência Pélvica - Medida angular da inclinação da pelve em relação à vertical
#Inclinação Pélvica Numérica - representa a inclinação da pelve, mas de uma maneira numérica.
#Ângulo de Lordose Lombar - Ângulo formado pela curvatura natural da parte inferior da coluna vertebral, conhecida como lordose lombar. 
#Ângulo do Declive Sacral - Ângulo formado pela inclinação do sacro, osso triangular na base da coluna vertebral, em relação à horizontal.
#Raio Pélvico - Medida do raio da pelve, geralmente relacionada à largura da pelve.
#Grau de Espondilolistese - Medida do deslizamento de uma vértebra sobre a outra.
#Classe - Variável de saída ou rótulo que indica a classe à qual pertence uma observação.

Unnamed: 0,pelvic_incidence,pelvic_tilt numeric,lumbar_lordosis_angle,sacral_slope,pelvic_radius,degree_spondylolisthesis,class
0,63.027817,22.552586,39.609117,40.475232,98.672917,-0.254400,Abnormal
1,39.056951,10.060991,25.015378,28.995960,114.405425,4.564259,Abnormal
2,68.832021,22.218482,50.092194,46.613539,105.985135,-3.530317,Abnormal
3,69.297008,24.652878,44.311238,44.644130,101.868495,11.211523,Abnormal
4,49.712859,9.652075,28.317406,40.060784,108.168725,7.918501,Abnormal
...,...,...,...,...,...,...,...
305,47.903565,13.616688,36.000000,34.286877,117.449062,-4.245395,Normal
306,53.936748,20.721496,29.220534,33.215251,114.365845,-0.421010,Normal
307,61.446597,22.694968,46.170347,38.751628,125.670725,-2.707880,Normal
308,45.252792,8.693157,41.583126,36.559635,118.545842,0.214750,Normal


In [22]:
# Tratamento de elementos faltantes (assumindo que não há dados faltantes)
print(f"Elementos faltantes:\n{df.isna().sum()}\n")

# Convertendo a variável 'class' em numérica
df['class'] = df['class'].map({'Abnormal': 1, 'Normal': 0})

# Normalização das variáveis independentes
colunas_independentes = ["pelvic_incidence", "pelvic_tilt numeric", "lumbar_lordosis_angle", "sacral_slope", "pelvic_radius", "degree_spondylolisthesis"]
scaler = MinMaxScaler()
df[colunas_independentes] = scaler.fit_transform(df[colunas_independentes])

# Balanceamento das classes
classe_maioria = df[df["class"] == 0] #contém apenas as amostras da classe majoritária, onde o rótulo da classe é igual a 0.
classe_minoria = df[df["class"] == 1] #contém apenas as amostras da classe minoritária, onde o rótulo da classe é igual a 1.
classe_maioria = resample(classe_maioria, n_samples=len(classe_minoria)) # realizar oversampling (aumentar o número de amostras) na classe majoritária para equilibrar com a minoritária
df = pd.concat([classe_maioria, classe_minoria]) #contém o conjunto de dados original com as classes balanceadas.
df = df.sample(frac=1)  #Embaralha todas as amostras do DataFrame e, com isso, todas as linhas são incluídas.

# Separação dos Dados  30%teste e 70%treinamento
X_train, X_test, y_train, y_test = train_test_split(df[colunas_independentes], df["class"], test_size=0.3, random_state=42) #fixada em 42 para garantir reprodutibilidade.

Elementos faltantes:
pelvic_incidence            0
pelvic_tilt numeric         0
lumbar_lordosis_angle       0
sacral_slope                0
pelvic_radius               0
degree_spondylolisthesis    0
class                       0
dtype: int64



In [23]:
#contém o conjunto de dados original com as classes balanceadas.
#Embaralha todas as amostras do DataFrame e, com isso, todas as linhas são incluídas.

df

Unnamed: 0,pelvic_incidence,pelvic_tilt numeric,lumbar_lordosis_angle,sacral_slope,pelvic_radius,degree_spondylolisthesis,class
255,0.399188,0.378839,0.393776,0.365679,0.575874,0.086192,0
283,0.220358,0.351311,0.338936,0.208353,0.605619,0.026987,0
229,0.166739,0.297404,0.197170,0.184835,0.724360,0.018491,0
147,0.279043,0.049923,0.375865,0.420809,0.428363,0.099701,1
4,0.227272,0.289479,0.128129,0.247022,0.409579,0.044173,1
...,...,...,...,...,...,...,...
242,0.124793,0.215971,0.115731,0.186778,0.661392,0.023973,0
199,0.474032,0.414855,0.423261,0.418832,0.524805,0.099241,1
262,0.157874,0.373849,0.101336,0.136723,0.632585,0.027503,0
122,0.520098,0.975667,0.343678,0.172478,0.436907,0.183392,1


In [24]:
#Perceptron
# Modelo Perceptron em TensorFlow/Keras
modelo_p = tf.keras.Sequential([
    tf.keras.layers.Input(shape=(X_train.shape[1],)),  # Camada de entrada com o número de características
    tf.keras.layers.Dense(1, activation='sigmoid')  # Camada de saída com 1 neurônio (classificação binária)
])

# Função de perda para problemas de classificação binária.
# Métrica para monitorar durante o treinamento, neste caso, a acurácia.
modelo_p.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

# Número de épocas/vezes que o modelo passará por todo o conjunto de treinamento.
# O número de amostras usado em cada atualização do gradiente.
# Treinamento do Modelo
modelo_p.fit(X_train, y_train, batch_size=32, epochs=100) 

Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78

Epoch 84/100
Epoch 85/100
Epoch 86/100
Epoch 87/100
Epoch 88/100
Epoch 89/100
Epoch 90/100
Epoch 91/100
Epoch 92/100
Epoch 93/100
Epoch 94/100
Epoch 95/100
Epoch 96/100
Epoch 97/100
Epoch 98/100
Epoch 99/100
Epoch 100/100


<keras.src.callbacks.History at 0x21cabed5040>

In [25]:
#MLP

#Camadas densas (totalmente conectadas) com 6 e 3 neurônios, respectivamente, nas camadas ocultas. 
modelo_mlp = tf.keras.Sequential([
    tf.keras.layers.Input(shape=(X_train.shape[1],)),  # Camada de entrada com o número de características
    tf.keras.layers.Dense(6, activation='relu'),  # ReLU é usada nas camadas ocultas para introduzir não-linearidades.
    tf.keras.layers.Dense(3, activation='relu'),  # Camada oculta com ativação ReLU
    tf.keras.layers.Dense(1, activation='sigmoid')  # Camada de saída com 1 neurônio (classificação binária)
])

modelo_mlp.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

# Treinamento do Modelo
modelo_mlp.fit(X_train, y_train, batch_size=32, epochs=100)


Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78

Epoch 84/100
Epoch 85/100
Epoch 86/100
Epoch 87/100
Epoch 88/100
Epoch 89/100
Epoch 90/100
Epoch 91/100
Epoch 92/100
Epoch 93/100
Epoch 94/100
Epoch 95/100
Epoch 96/100
Epoch 97/100
Epoch 98/100
Epoch 99/100
Epoch 100/100


<keras.src.callbacks.History at 0x21cabffa850>

In [18]:
# Modelo de Árvore de Decisão
modelo_dt = DecisionTreeClassifier()
modelo_dt.fit(X_train, y_train)

# Previsões no conjunto de teste
y_pred_dt = modelo_dt.predict(X_test)

In [19]:
# Perceptron Simples
y_pred_p = modelo_p.predict(X_test)
y_pred_p = np.where(y_pred_p >= 0.5, 1, 0)
df_comparacao_p = pd.DataFrame(y_test)
df_comparacao_p["Predição"] = y_pred_p
print("Comparação - Perceptron Simples")
print(df_comparacao_p)
accuracy_p = accuracy_score(y_test, y_pred_p)
precision_p = precision_score(y_test, y_pred_p)
recall_p = recall_score(y_test, y_pred_p)
f1_p = f1_score(y_test, y_pred_p)

##################################################################################################################

# MLP
y_pred_mlp = modelo_mlp.predict(X_test)
y_pred_mlp = np.where(y_pred_mlp >= 0.5, 1, 0)
df_comparacao_mlp = pd.DataFrame(y_test)
df_comparacao_mlp["Predição"] = y_pred_mlp
print("Comparação - Perceptron Multi Camadas")
print(df_comparacao_mlp)
accuracy_mlp = accuracy_score(y_test, y_pred_mlp)
precision_mlp = precision_score(y_test, y_pred_mlp)
recall_mlp = recall_score(y_test, y_pred_mlp)
f1_mlp = f1_score(y_test, y_pred_mlp)

#######################################################################################################

# Árvore de Decisão
y_pred_dt = modelo_dt.predict(X_test)
df_comparacao_dt = pd.DataFrame(y_test)
df_comparacao_dt["Predição"] = y_pred_dt
print("Comparação - Árvore de Decisão")
print(df_comparacao_dt)
accuracy_dt = accuracy_score(y_test, y_pred_dt)
precision_dt = precision_score(y_test, y_pred_dt)
recall_dt = recall_score(y_test, y_pred_dt)
f1_dt = f1_score(y_test, y_pred_dt)

# Impressão das métricas
print(f"Perceptron Simples\nAcurácia: {accuracy_p}\nPrecisão: {precision_p}\nRecall: {recall_p}\nF1-score: {f1_p}\n")
print(f"Perceptron Multicamadas\nAcurácia: {accuracy_mlp}\nPrecisão: {precision_mlp}\nRecall: {recall_mlp}\nF1-score: {f1_mlp}\n")
print(f"Árvore de Decisão\nAcurácia: {accuracy_dt}\nPrecisão: {precision_dt}\nRecall: {recall_dt}\nF1-score: {f1_dt}\n")

Comparação - Perceptron Simples
     class  Predição
220      0         1
297      0         1
307      0         1
290      0         1
35       1         0
..     ...       ...
258      0         1
276      0         1
285      0         1
236      0         1
59       1         1

[126 rows x 2 columns]
Comparação - Perceptron Multi Camadas
     class  Predição
220      0         0
297      0         0
307      0         0
290      0         0
35       1         0
..     ...       ...
258      0         0
276      0         0
285      0         0
236      0         0
59       1         0

[126 rows x 2 columns]
Comparação - Árvore de Decisão
     class  Predição
220      0         0
297      0         0
307      0         0
290      0         0
35       1         1
..     ...       ...
258      0         0
276      0         0
285      0         0
236      0         0
59       1         1

[126 rows x 2 columns]
Perceptron Simples
Acurácia: 0.47619047619047616
Precisão: 0.4642857142