In [2]:
import tensorflow as tf
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split

In [None]:
# Cargar el dataset

#Variables entrada:
# Embarazos: Número de embarazos.
# Glucosa:   Concentración de glucosa en plasma a 2 horas en una prueba oral de tolerancia a la glucosa.
# Presión:   Presión arterial diastólica (mm Hg).
# Piel:      Grosor del pliegue de la piel del tríceps (mm).
# Insulina:  Insulina sérica de 2 horas (mu U/ml).
# IMC:       Índice de masa corporal.
# FP:        Función del pedigrí de la diabetes.
# Edad:      Edad (años).

#Variable de salida:
# Diabetes:  Aparición(1) o no(0) de diabetes en un plazo de cinco años.

data = pd.read_excel('/content/diabetes.xlsx', sheet_name='diabetes')

#Separar en variables de entrada(x) y salida(y)
x = data.iloc[:, :-1].values
y = data.iloc[:, -1].values
# Normalizar los datos
x = (x - np.mean(x)) / np.std(x)

#Seprarar los datos en sets de entrenamiento y sets de validación 20% de los datos
x_train, x_val, y_train, y_val = train_test_split(x, y, test_size=0.2)

print(f"el tamaño de los datos es: {len(x)}")
print(f"{len(x_train)} datos se utilizan para entrenar la red neuronal")
print(f"{len(x_val)} datos (20%) se utilizan para validar la red neuronal")

el tamaño de los datos es: 768
614 datos se utilizan para entrenar la red neuronal
154 datos (20%) se utilizan para validar la red neuronal


In [None]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [None]:
# Cargar el modelo de la red neuronal
# Capa visible (8 entradas) >> Capa oculta (12 neuronas)>> Capa oculta (8 neuronas)>> Capa de salida (1)
model = tf.keras.models.Sequential([
  tf.keras.layers.Dense(10, input_dim=8, activation='relu'),
  tf.keras.layers.Dense(5, input_dim=10, activation='relu'),
  tf.keras.layers.Dense(5, activation='relu'),
  tf.keras.layers.Dense(1, activation='sigmoid')
])

#Compilar el modelo
#Función de pérdida logarítmica
#que para un problema de clasificación binaria se define en Keras como “binary_crossentropy”

#Algoritmo de descenso de gradiente eficiente “adam”

#debido a que es un Problema de clasificación
#se recopila y reporta "la exactitud" de la clasificación como la métrica.


model.compile(optimizer='adam',
              loss='binary_crossentropy',
              metrics=['accuracy'])

In [None]:
#Entrenamiento

model.fit(x_train, y_train, epochs=50, batch_size=10, validation_data=(x_val, y_val))

#_epochs_: es una iteración completa de todo el conjunto de datos de entrenamiento a través de la red neuronal
#_batch_size_: El tamaño del lote (batch_size) se refiere a la cantidad de ejemplos de entrenamiento que se utilizan
#en una sola iteración del algoritmo de entrenamiento de la red neuronal. En lugar de alimentar a la red neuronal
#con todo el conjunto de datos de entrenamiento en una sola vez, se divide en lotes más pequeños para facilitar el
#procesamiento. El tamaño del lote también influye en la velocidad del entrenamiento y la cantidad de memoria
#necesaria para el proceso de entrenamiento.

Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50


<keras.callbacks.History at 0x7868ddf16890>

In [None]:
# evalua el modelo
scores = model.evaluate(x_val, y_val, verbose=2)
print("\n%s: %.2f%%" % (model.metrics_names[1], scores[1]*100))

5/5 - 0s - loss: 0.4360 - accuracy: 0.7987 - 28ms/epoch - 6ms/step

accuracy: 79.87%


In [None]:
#"Hacer predicciones para comparar"
predicciones = model.predict(x)
# redondeamos las predicciones
rounded = [round(x[0]) for x in predicciones]
print(rounded)


[1, 0, 1, 0, 1, 0, 0, 0, 1, 0, 0, 1, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 1, 0, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 1, 0, 0, 1, 1, 0, 0, 1, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 1, 1, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 1, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 1, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 1, 0, 1, 1, 1, 0, 1, 0, 0, 0, 0, 1, 1, 0, 1, 0, 0, 0, 1, 1, 0, 0, 1, 0, 0, 0, 1, 1, 1, 1, 0, 0, 0, 0, 0, 1, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 1, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 1, 

In [None]:
#"Hacer predicciones de dato de entrada"
x_pred = np.array([0, 140, 100, 50, 0, 40, 0.7, 30])
x_pred = (x_pred - np.mean(x_pred)) / np.std(x_pred)
prediccion = model.predict(x_pred.reshape(1,-1))
rounded = [round(x[0]) for x in prediccion]
print(rounded)

[1]
