<a href="https://colab.research.google.com/github/KevinColoma/23305_G6_ADS/blob/main/Diabetes.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

Entrenamiento de un red neuronal para predicción de personas con diabetes.

In [None]:
# Importar las librerías necesarias
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
import pandas as pd
import numpy as np

In [None]:
# Cargar el conjunto de datos (Pima Indians Diabetes Dataset)
url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.data.csv"
column_names = ['Embarazos', 'Glucosa', 'Presión', 'Espesor_piel', 'Insulina',
                'IMC', 'Función_pedigree', 'Edad', 'Resultado']
data = pd.read_csv(url, header=None, names=column_names)

In [None]:
data.head()

Unnamed: 0,Embarazos,Glucosa,Presión,Espesor_piel,Insulina,IMC,Función_pedigree,Edad,Resultado
0,6,148,72,35,0,33.6,0.627,50,1
1,1,85,66,29,0,26.6,0.351,31,0
2,8,183,64,0,0,23.3,0.672,32,1
3,1,89,66,23,94,28.1,0.167,21,0
4,0,137,40,35,168,43.1,2.288,33,1


In [None]:
# Separar las características (X) y las etiquetas (y)
X = data.iloc[:, :-1].values
y = data.iloc[:, -1].values

In [None]:
X

array([[  6.   , 148.   ,  72.   , ...,  33.6  ,   0.627,  50.   ],
       [  1.   ,  85.   ,  66.   , ...,  26.6  ,   0.351,  31.   ],
       [  8.   , 183.   ,  64.   , ...,  23.3  ,   0.672,  32.   ],
       ...,
       [  5.   , 121.   ,  72.   , ...,  26.2  ,   0.245,  30.   ],
       [  1.   , 126.   ,  60.   , ...,  30.1  ,   0.349,  47.   ],
       [  1.   ,  93.   ,  70.   , ...,  30.4  ,   0.315,  23.   ]])

In [None]:
y

array([1, 0, 1, 0, 1, 0, 1, 0, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 0, 1, 0, 0,
       1, 1, 1, 1, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 1,
       0, 1, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 1, 0,
       1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0,
       1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 1,
       1, 1, 0, 0, 1, 1, 1, 0, 0, 0, 1, 0, 0, 0, 1, 1, 0, 0, 1, 1, 1, 1,
       1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0,
       1, 1, 0, 0, 0, 1, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 1, 1, 0, 0, 0, 1,
       0, 1, 0, 1, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 0, 0, 1, 1, 0, 1, 0, 1,
       1, 1, 0, 0, 0, 0, 0, 0, 1, 1, 0, 1, 0, 0, 0, 1, 1, 1, 1, 0, 1, 1,
       1, 1, 0, 0, 0, 0, 0, 1, 0, 0, 1, 1, 0, 0, 0, 1, 1, 1, 1, 0, 0, 0,
       1, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 0, 1, 0, 1, 0, 0,
       1, 0, 1, 0, 0, 1, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 1, 1, 0,
       0, 1, 0, 0, 0, 1, 1, 1, 0, 0, 1, 0, 1, 0, 1,

In [None]:
# Dividir los datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [None]:
X_train.shape

(614, 8)

In [None]:
X_test.shape

(154, 8)

In [None]:
# Escalar los datos (normalización)
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

In [None]:
#Crear el modelo
model = Sequential([
    Dense(12, input_dim=8, activation='relu'),  # Capa densa con 12 neuronas
    Dense(10, activation='relu'),               # Capa densa con 8 neuronas
    Dense(10, activation='relu'),               # Capa densa con 5 neurona
    Dense(1, activation='sigmoid')             # Capa de salida con 1 neurona (clasificación binaria)
])

In [None]:
# Compilar el modelo
model.compile(optimizer='adam',
              loss='binary_crossentropy',
              metrics=['accuracy'])

In [None]:
# Entrenar el modelo
model.fit(X_train, y_train, epochs=50, batch_size=10, validation_split=0.2)

Epoch 1/50
[1m50/50[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 8ms/step - accuracy: 0.8462 - loss: 0.3515 - val_accuracy: 0.7561 - val_loss: 0.5396
Epoch 2/50
[1m50/50[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - accuracy: 0.8352 - loss: 0.3734 - val_accuracy: 0.7561 - val_loss: 0.5433
Epoch 3/50
[1m50/50[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - accuracy: 0.8254 - loss: 0.3697 - val_accuracy: 0.7561 - val_loss: 0.5430
Epoch 4/50
[1m50/50[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - accuracy: 0.8288 - loss: 0.3816 - val_accuracy: 0.7480 - val_loss: 0.5428
Epoch 5/50
[1m50/50[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 4ms/step - accuracy: 0.8522 - loss: 0.3570 - val_accuracy: 0.7561 - val_loss: 0.5453
Epoch 6/50
[1m50/50[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 4ms/step - accuracy: 0.8740 - loss: 0.3209 - val_accuracy: 0.7561 - val_loss: 0.5479
Epoch 7/50
[1m50/50[0m [32m━━━━━━━━━━

<keras.src.callbacks.history.History at 0x78fa6ca69910>

In [None]:
# Evaluar el modelo
test_loss, test_accuracy = model.evaluate(X_test, y_test, verbose=2)
print(f"Precisión en el conjunto de prueba: {test_accuracy:.2f}")

5/5 - 0s - 8ms/step - accuracy: 0.7273 - loss: 0.6856
Precisión en el conjunto de prueba: 0.73


In [None]:
# Predicciones
predictions = (model.predict(X_test) > 0.5).astype(int)

[1m5/5[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 24ms/step


In [None]:
# Visualizar una muestra de predicciones
for i in range(15):
    print(f"Real: {y_test[i]}, Predicción: {predictions[i][0]}")

Real: 0, Predicción: 0
Real: 0, Predicción: 0
Real: 0, Predicción: 0
Real: 0, Predicción: 1
Real: 0, Predicción: 0
Real: 0, Predicción: 1
Real: 0, Predicción: 0
Real: 0, Predicción: 1
Real: 0, Predicción: 1
Real: 0, Predicción: 0
Real: 1, Predicción: 0
Real: 0, Predicción: 1
Real: 1, Predicción: 0
Real: 0, Predicción: 1
Real: 0, Predicción: 0
