Autor:  
Manuel Eugenio Morocho Cayamcela, PhD

# **Caso práctico 3:** 
## Predicción de diabetes utilizando una red neuronal

### Objetivo y alcance del trabajo

En este caso práctico, vas a construir una red neuronal simple para tener una idea de qué tan rápido es lograr esto en Keras.

Construirás una red neuronal que toma ocho características como entrada, una primera capa oculta con 12 neuronas y activación RELU, una segunda capa oculta con 8 neuronas y activación RELU, y finalmente una neurona de salida con activación sigmoid.

### **Fase I:** Preparamos la base de datos y la dividimos en sub-conjuntos de entrenamiento y prueba

In [None]:
#Instalamos las librerías necesarias para el funcionamiento del script

!pip install scikit-learn
!python3 -m pip install tensorflow
import tensorflow as tf
import pandas as pd
print(tf.__version__)

#### Importamos el dataset

In [3]:
#Importamos la base de datos

diabetes_df = pd.read_csv('/Users/eugenio/Library/CloudStorage/OneDrive-Personal/UIDE/2024 Maestría Ciencia de Datos y Máquinas de Aprendizaje mención IA/Contenidos/Notebooks_DataMining/Bases de Datos/diabetes.csv')
diabetes_df.head()

Unnamed: 0,pregnancies,glucose,diastolic,triceps,insulin,bmi,dpf,age,diabetes
0,6,148,72,35,0,33.6,0.627,50,1
1,1,85,66,29,0,26.6,0.351,31,0
2,8,183,64,0,0,23.3,0.672,32,1
3,1,89,66,23,94,28.1,0.167,21,0
4,0,137,40,35,168,43.1,2.288,33,1


#### Separamos las variables independientes (características, predictores, 'X') de las variables dependientes (etiquetas, objetivo, y)

Preparamos el conjunto de datos para el modelado con una red neuronal, eliminamos la columna 'diabetes' es el objetivo o la variable que se está tratando de predecir.

- `diabetes_df.drop('diabetes', axis=1)`: está eliminando la columna 'diabetes' del DataFrame `diabetes_df`. La función `drop` de pandas se utiliza para eliminar filas o columnas. En este caso, estás eliminando una columna, por lo que `axis=1`. Si quisieras eliminar una fila, usarías `axis=0`. El resultado de esta operación es un nuevo DataFrame que no incluye la columna 'diabetes'. Este nuevo DataFrame se lo guarda en la variable `X_diabetes` para usarse como las características (X) en la red neuronal.

In [8]:
# Seleccionamos las columnas predictoras

X_diabetes = diabetes_df.drop('diabetes', axis=1)
X_diabetes.head()

Unnamed: 0,pregnancies,glucose,diastolic,triceps,insulin,bmi,dpf,age
0,6,148,72,35,0,33.6,0.627,50
1,1,85,66,29,0,26.6,0.351,31
2,8,183,64,0,0,23.3,0.672,32
3,1,89,66,23,94,28.1,0.167,21
4,0,137,40,35,168,43.1,2.288,33


Seleccionamos la columna 'diabetes' del DataFrame `diabetes_df` y la asignamos a la variable `y_diabetes`.

- `diabetes_df['diabetes']`: está seleccionando la columna 'diabetes' del DataFrame `diabetes_df`. En pandas, puedes seleccionar una sola columna de un DataFrame utilizando la sintaxis `df['column_name']`.

- Asignamos la columna 'diabetes' a la variable `y_diabetes`. Esta variable se utilizará como la variable objetivo (y) en la red neuronal.

In [4]:
# Seleccionamos la columna diabetes como variable objetivo

y_diabetes = diabetes_df['diabetes']
y_diabetes.head()

0    1
1    0
2    1
3    0
4    1
Name: diabetes, dtype: int64

#### Separamos la base de datos en conjuntos de entrenamiento y de prueba

Utilizamos la función `train_test_split` de la biblioteca sklearn en Python para dividir el conjunto de datos en conjuntos de entrenamiento y prueba.

- `from sklearn.model_selection import train_test_split`: Esta línea está importando la función `train_test_split` de la biblioteca sklearn. Esta función se utiliza para dividir conjuntos de datos en conjuntos de entrenamiento y prueba.

- `X_train, X_test, y_train, y_test = train_test_split(X_diabetes, y_diabetes, test_size=0.3)`: Esta línea está utilizando la función `train_test_split` para dividir `X_diabetes` y `y_diabetes` en conjuntos de entrenamiento y prueba. El argumento `test_size=0.3` indica que el 30% del conjunto de datos se utilizará como conjunto de prueba, y el 70% restante se utilizará como conjunto de entrenamiento.

In [9]:
# Importamos la función train_test_split de la librería sklearn

from sklearn.model_selection import train_test_split

# Dividimos la base de datos en entrenamiento y prueba

X_train, X_test, y_train, y_test = train_test_split(X_diabetes, y_diabetes, test_size=0.3)

### **Fase II:** Modelado, compilado, y entrenamiento de una red neuronal

#### Modelamos una red neuronal simple

Importando dos módulos de la biblioteca TensorFlow, específicamente de su API de alto nivel llamada Keras. Estos módulos son comúnmente utilizados para construir redes neuronales.

Aquí está lo que hace cada parte:

- `from tensorflow.keras.models import Sequential`: Esta línea está importando el módulo `Sequential` de Keras. `Sequential` es una clase que permite crear modelos de redes neuronales donde las capas se añaden una tras otra en secuencia.

- `from tensorflow.keras.layers import Dense`: Esta línea está importando el módulo `Dense` de Keras. `Dense` es una clase que permite crear capas de neuronas completamente conectadas, que son el tipo de capa más común en las redes neuronales.

In [10]:
# Importamos los módulos necesarios para la creación del modelo

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

Utilizamos la biblioteca TensorFlow para construir una red neuronal secuencial utilizando la API de Keras. Construiremos una red neuronal con una capa de entrada de 8 neuronas, una capa oculta de 12 neuronas, otra capa oculta de 8 neuronas, y una capa de salida de 1 neurona.

Aquí está lo que hace cada parte:

- `model = Sequential()`: Esta línea está creando un nuevo modelo secuencial. Un modelo secuencial es apropiado para una pila simple de capas donde cada capa tiene exactamente un tensor de entrada y un tensor de salida.

- `model.add(Dense(12, input_dim=8, activation='relu'))`: Esta línea está añadiendo una capa densa (completamente conectada) al modelo con 12 neuronas, y está utilizando la función de activación ReLU. `input_dim=8` especifica que el número de entradas a esta capa (es decir, el número de neuronas en la capa anterior) es 8. El numero de neuronas de la capa de entrada debe coincidir con el número de variables independientes, que en el caso de el dataset de diabetes es 8.

- `model.add(Dense(8, activation='relu'))`: Esta línea está añadiendo otra capa densa al modelo con 8 neuronas, y también está utilizando la función de activación ReLU.

- `model.add(Dense(1, activation='sigmoid'))`: Esta línea está añadiendo una capa densa final al modelo con 1 neurona, y está utilizando la función de activación sigmoide. La función de activación sigmoide es comúnmente utilizada en la capa de salida de un modelo de clasificación binaria.

In [33]:
# Creamos un modelo secuencial 
model = Sequential()

# Añadimos una capa densa con 12 neuronas y función de activación relu
model.add(Dense(12, input_dim=8, activation='relu'))

# Añadimos una capa densa con 8 neuronas y función de activación relu
model.add(Dense(8, activation='relu'))

# Añadimos una capa densa con 1 neurona y función de activación sigmoid
model.add(Dense(1, activation='sigmoid'))

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


#### Compilamos la red neuronal

Utilizaremos la función `compile` de Keras para configurar el proceso de aprendizaje de la red neuronal. Configuramos el modelo para que se entrene utilizando el optimizador Adam, la función de pérdida de entropía cruzada binaria, y para que se evalúe utilizando la precisión.

- `optimizer = 'adam'`: Esta línea está estableciendo el optimizador del modelo a 'adam'. Adam es un método de optimización que se utiliza comúnmente en redes neuronales. Ajusta la tasa de aprendizaje adaptativamente para cada parámetro.

- `loss = 'binary_crossentropy'`: Esta línea está estableciendo la función de pérdida del modelo a 'binary_crossentropy'. La entropía cruzada binaria es una función de pérdida que se utiliza en problemas de clasificación binaria. Mide la "distancia" entre las predicciones y los verdaderos resultados.

- `metrics=['accuracy']`: Esta línea está estableciendo la métrica que se utilizará para evaluar el rendimiento del modelo a 'accuracy'. La precisión es la proporción de predicciones correctas sobre el total de predicciones.

In [34]:
# Compilamos el modelo con el optimizador adam, la función de pérdida binary_crossentropy y la métrica accuracy

model.compile(optimizer = 'adam', loss = 'binary_crossentropy', metrics=['accuracy'])

#### Resumen del modelo de red neuronal

El método `model.summary()` en Keras proporciona una representación textual del modelo. Muestra las capas de la red neuronal, la forma de salida de cada capa y el número de parámetros (pesos y sesgos) en cada capa. También muestra el total de parámetros en el modelo.

En este ejemplo, puedes ver que el modelo tiene tres capas. La primera capa tiene 12 neuronas y 108 parámetros, la segunda capa tiene 8 neuronas y 104 parámetros, y la tercera capa tiene 1 neurona y 9 parámetros. El total de parámetros en el modelo es 221.

In [19]:
# Visualizamos un resumen del modelo creado 

model.summary()

#### Entrenamos la red neuronal

Training the model is as easy as calling the `.fit()` method, passing on the features, labels and a number of epochs to train for.

In [40]:
# Entrenamos el modelo con los datos de entrenamiento, especificando el número de épocas y el tamaño del batch

model.fit(X_train, y_train, epochs = 150, batch_size = 32)

Epoch 1/150


[1m34/34[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.6862 - loss: 0.5931
Epoch 2/150
[1m34/34[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 1ms/step - accuracy: 0.7128 - loss: 0.6089 
Epoch 3/150
[1m34/34[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 820us/step - accuracy: 0.6591 - loss: 0.7008
Epoch 4/150
[1m34/34[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 854us/step - accuracy: 0.6715 - loss: 0.5922
Epoch 5/150
[1m34/34[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 888us/step - accuracy: 0.7002 - loss: 0.5451
Epoch 6/150
[1m34/34[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 920us/step - accuracy: 0.7349 - loss: 0.5490
Epoch 7/150
[1m34/34[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 911us/step - accuracy: 0.7147 - loss: 0.5905
Epoch 8/150
[1m34/34[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 855us/step - accuracy: 0.6966 - loss: 0.6020
Epoch 9/150
[1m34/34[0m [32m━━━━━━━━━━━━━━━━

<keras.src.callbacks.history.History at 0x140861a90>

### **Fase III:** Evaluación del modelo

#### Evaluación de la precisión del moelo

Evaluamos el rendimiento de un modelo de red neuronal en Keras tanto en los datos de entrenamiento como en los datos de prueba e imprimos la precisión de la clasificación en ambos conjuntos de datos.

- `scores = model.evaluate(X_train, y_train, verbose=False)`: Esta línea está evaluando el modelo en los datos de entrenamiento. `model.evaluate` devuelve la pérdida del modelo y las métricas en los datos proporcionados. 

    En este caso, `scores[0]` sería la pérdida y `scores[1]` sería la precisión, ya que se especificó `metrics=['accuracy']` durante la compilación del modelo.

- `print("Precisión en la fase de entrenamiento: %.2f%%" % (scores[1]*100))`: Esta línea está imprimiendo la precisión del modelo en los datos de entrenamiento representado en una cadena de formato. El `%` indica un punto de inserción para un valor. El `.2f` especifica un número de punto flotante con dos decimales. El `%%` se utiliza para imprimir un solo signo de porcentaje.

- `scores = model.evaluate(X_test, y_test, verbose=False)`: Esta línea está evaluando el modelo en los datos de prueba.

- `print("Precisión en la fase de prueba: %.2f%%" % (scores[1]*100))`: Esta línea está imprimiendo la precisión del modelo en los datos de prueba.

In [60]:
# Evaluación del modelo con los datos de entrenamiento

scores = model.evaluate(X_train, y_train, verbose=False)
print("Precisión en la fase de entrenamiento: %.2f%%" % (scores[1]*100))

# Evaluación del modelo con los datos de prueba

scores = model.evaluate(X_test, y_test, verbose=False)
print("Precisión en la fase de prueba: %.2f%%" % (scores[1]*100))

Precisión en la fase de entrenamiento: 78.21%
Precisión en la fase de prueba: 71.43%


#### Usamos el modelo para hacer predicciones

Seleccionamos una fila específica de un DataFrame de pandas para realizar una predicción.
 
- `iloc[9]` selecciona la décima fila del DataFrame `X_test` (la indexación en Python comienza en 0), y la asigna a la variable `persona_de_prueba`.

In [66]:
# Seleccionamos una persona de la base de datos de prueba para realizar una predicción

persona_de_prueba = X_test.iloc[9]
persona_de_prueba

pregnancies      1.000
glucose        121.000
diastolic       78.000
triceps         39.000
insulin         74.000
bmi             39.000
dpf              0.261
age             28.000
Name: 751, dtype: float64

Utilizamos el modelo de la red neuronal entrenada para hacer una predicción basada en los datos de una "persona de prueba".

- `persona_de_prueba.values` convierte la fila del DataFrame de pandas en un array de numpy. `reshape(1,8)` cambia la forma del array a un array bidimensional con 1 fila y 8 columnas. Esto se hace porque el método `predict` de Keras espera un array bidimensional (es decir, un array de arrays), donde cada sub-array es un conjunto de características para hacer una predicción.

- `prediccion = model.predict(...)`: Esta línea utiliza el método `predict` del modelo para hacer una predicción basada en las características de la "persona de prueba". La predicción se asigna a la variable `prediccion`.

In [72]:
# Hacemos una predicción con el modelo entrenado

prediccion = model.predict(persona_de_prueba.values.reshape(1,8))
prediccion

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 41ms/step


array([[0.09895436]], dtype=float32)

Comparamos la predicción de un modelo de aprendizaje automático con los datos reales para una "persona de prueba". Aquí está lo que hace cada parte:

- `if prediccion >= 0.5:`: Aquí, `prediccion` es la salida de un modelo de aprendizaje automático. Si la salida es mayor o igual a 0.5, se interpreta como una predicción de que la persona tiene diabetes.

- `print('Según la predicción de la red neuronal: La persona tiene diabetes')`: Esta línea se ejecuta si la condición del `if` es verdadera, es decir, si la predicción es mayor o igual a 0.5.

- `else:`: Esta parte del código se ejecuta si la condición del `if` es falsa, es decir, si la predicción es menor a 0.5.

- `print('Según la predicción de la red neuronal: La persona no tiene diabetes')`: Esta línea se ejecuta si la condición del `if` es falsa.

- `if y_test.iloc[9] == 1:`: Aquí, `y_test` es un DataFrame de pandas que contiene los datos reales. `y_test.iloc[9]` selecciona la décima fila del DataFrame. Si el valor en esta fila es 1, se interpreta como que la persona tiene diabetes.

- `print('Según la base de datos de prueba: La persona tiene diabetes')`: Esta línea se ejecuta si la condición del `if` es verdadera, es decir, si el valor en la décima fila de `y_test` es 1.

- `else:`: Esta parte del código se ejecuta si la condición del `if` es falsa, es decir, si el valor en la décima fila de `y_test` no es 1.

- `print('Según la base de datos de prueba: La persona no tiene diabetes')`: Esta línea se ejecuta si la condición del `if` es falsa.

In [74]:
# Comprobamos si la persona tiene diabetes o no según la predicción

if prediccion >= 0.5:
    print('Según la predicción de la red neuronal: La persona tiene diabetes')
else:
    print('Según la predicción de la red neuronal: La persona no tiene diabetes')
    
# Comprobamos si la persona tiene diabetes o no según la base de datos

if y_test.iloc[9] == 1:
    print('Según la base de datos de prueba: La persona tiene diabetes')
else:
    print('Según la base de datos de prueba: La persona no tiene diabetes')


Según la predicción de la red neuronal: La persona no tiene diabetes
Según la base de datos de prueba: La persona no tiene diabetes


#### Guardamos el modelo para usarlo en producción

In [76]:
# Guardamos el modelo en un archivo

model.save('modelo_diabetes.keras')

In [78]:
# Cargamos el modelo desde el archivo

from tensorflow.keras.models import load_model

modelo_cargado = load_model('modelo_diabetes.keras')

In [80]:
# Hacemos una predicción con el modelo cargado

prediccion_modelo_cargado = modelo_cargado.predict(persona_de_prueba.values.reshape(1,8))

# Comprobamos si la persona tiene diabetes o no según la predicción del modelo cargado

if prediccion_modelo_cargado >= 0.5:
    print('Según la predicción del modelo cargado: La persona tiene diabetes')
else:
    print('Según la predicción del modelo cargado: La persona no tiene diabetes')

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 30ms/step
Según la predicción del modelo cargado: La persona no tiene diabetes
