
# Predicción de diabetes melitus en mujeres que están embarazadas  
Este código es un ejemplo de cómo se puede utilizar TensorFlow y las redes neuronale artificiales (RNA) para predecir la probabilidad del padecimiento de diabetes en mujeres embaradas en función de ciertas características de salud.


1. Se importan las librerías necesarias: numpy, pandas y tensorflow. Estas 1.librerías son utilizadas para realizar cálculos numéricos, manipular y analizar datos, y construir y entrenar la red neuronal, respectivamente.  
2. Se carga el dataset de diabetes desde un archivo CSV utilizando la función "read_csv" de la librería pandas. El dataset contiene información sobre diferentes características de salud y si una persona padece o no diabetes.

In [None]:
# Importar las librerías necesarias
import numpy as np
import pandas as pd
import tensorflow as tf

# Cargar el dataset de diabetes
df = pd.read_csv("diabetes.csv")

3. Se separan las variables independientes (X) de la variable dependiente (y). Las variables independientes son todas las columnas del dataset excepto la última, que corresponde a la variable dependiente (si padece o no diabetes).

In [None]:
# Separar las variables independientes (X) y la variable dependiente (y)
X = df.iloc[:, :-1].values
y = df.iloc[:, -1].values

 4. Se divide el dataset en un conjunto de entrenamiento y un conjunto de prueba utilizando la función "train_test_split" de la librería scikit-learn. El conjunto de prueba tendrá un tamaño del 20% del dataset total, y se utiliza una semilla aleatoria para garantizar que la división sea reproducible.

In [None]:
# Dividir el dataset en conjunto de entrenamiento y de prueba
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 0)

5. Se escalan las variables independientes utilizando la clase "StandardScaler" de la librería scikit-learn. El escalado es importante para asegurar que todas las variables tengan un rango similar y evitar que algunas variables dominen sobre otras en el proceso de entrenamiento de la red neuronal.

In [None]:
# Escalar las variables independientes
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.transform(X_test)

6. Se crea la red neuronal utilizando la clase "Sequential" de la librería tensorflow. Esta clase permite construir una red neuronal de manera secuencial, añadiendo capas una tras otra.
7. Se añade la capa de entrada y la primera capa oculta utilizando el método "add" de la red neuronal. La capa de entrada tiene 8 unidades (neuronas) y utiliza la función de activación "relu" (unidad lineal rectificada).
8. Se añade la segunda capa oculta de la misma manera que la primera capa. Esto permite que la red neuronal aprenda patrones más complejos y no lineales en los datos.
9. Se añade la capa de salida, que tiene una sola unidad y utiliza la función de activación "sigmoid". La función de activación sigmoidal es adecuada para problemas de clasificación binaria, ya que produce una salida entre 0 y 1 que se puede interpretar como la probabilidad de pertenecer a una clase.

In [None]:
# Crear la red neuronal
ann = tf.keras.models.Sequential()

# Añadir la capa de entrada y la primera capa oculta
ann.add(tf.keras.layers.Dense(units=8, activation='relu'))

# Añadir la segunda capa oculta
ann.add(tf.keras.layers.Dense(units=8, activation='relu'))

# Añadir la capa de salida
ann.add(tf.keras.layers.Dense(units=1, activation='sigmoid'))

10. Se compila la red neuronal utilizando el método "compile" de la red neuronal. Se especifica el optimizador "adam", que es un algoritmo de optimización popular en el entrenamiento de redes neuronales, y la función de pérdida "binary_crossentropy", que es adecuada para problemas de clasificación binaria. También se especifica la métrica de evaluación "accuracy" para monitorear el desempeño de la red neuronal durante el entrenamiento.

In [None]:
# Compilar la red neuronal
ann.compile(optimizer = 'adam', loss = 'binary_crossentropy', metrics = ['accuracy'])

11. Se entrena la red neuronal utilizando el método "fit" de la red neuronal. Se proporcionan los conjuntos de entrenamiento (X_train, y_train), el tamaño del lote (batch_size) y el número de épocas (epochs). El tamaño del lote determina cuántas muestras se utilizan para actualizar los pesos de la red neuronal en cada paso de entrenamiento, y el número de épocas determina cuántas veces se recorre todo el conjunto de entrenamiento durante el entrenamiento.

In [None]:
# Entrenar la red neuronal
ann.fit(X_train, y_train, batch_size = 32, epochs = 100)

Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78

<keras.callbacks.History at 0x7ac5a750f340>

12. Se le pide al usuario que responda algunas preguntas sobre su salud. Las preguntas se almacenan en una lista llamada "preguntas".

13. Se crea una lista vacía llamada "respuestas" para almacenar las respuestas del usuario.

14. Se itera sobre cada pregunta en la lista "preguntas" utilizando un bucle "for". Para cada pregunta, se le pide al usuario que ingrese una respuesta utilizando la función "input" de Python. La respuesta se convierte en un número decimal utilizando la función "float" y se agrega a la lista "respuestas".

In [None]:
# Preguntar al usuario sobre su salud
print("Por favor, responda las siguientes preguntas sobre su salud:")
preguntas = ["¿Cuántas veces ha estado embarazada?",
             "¿Cuál es su nivel de glucosa en plasma a las 2 horas en una prueba oral de tolerancia a la glucosa?",
             "¿Cuál es su presión arterial diastólica (mm Hg)?",
             "¿Cuál es su grosor del pliegue de la piel del tríceps (mm)?",
             "¿Cuál es su nivel de insulina en suero en 2 horas (mu U/ml)?",
             "¿Cuál es su índice de masa corporal (peso en kg/(altura en m)^2)?",
             "¿Cuál es su función del pedigrí de diabetes?",
             "¿Qué edad tiene (años)?"]

respuestas = []
for pregunta in preguntas:
    respuesta = float(input(pregunta + "\n"))
    respuestas.append(respuesta)

Por favor, responda las siguientes preguntas sobre su salud:
¿Cuántas veces ha estado embarazada?
6
¿Cuál es su nivel de glucosa en plasma a las 2 horas en una prueba oral de tolerancia a la glucosa?
148
¿Cuál es su presión arterial diastólica (mm Hg)?
72
¿Cuál es su grosor del pliegue de la piel del tríceps (mm)?
35
¿Cuál es su nivel de insulina en suero en 2 horas (mu U/ml)?
0
¿Cuál es su índice de masa corporal (peso en kg/(altura en m)^2)?
33.6
¿Cuál es su función del pedigrí de diabetes?
0.627
¿Qué edad tiene (años)?
50


15. Las respuestas se convierten en un array numpy utilizando la función "array" de la librería numpy. El array se redimensiona utilizando el método "reshape" para que tenga una forma de (1, -1), donde 1 indica que es un solo ejemplo y -1 indica que el tamaño de la segunda dimensión se calcula automáticamente.
16. Las respuestas se escalan utilizando el objeto "sc" de la clase "StandardScaler" que se creó anteriormente. Esto garantiza que las respuestas estén en la misma escala que las variables de entrenamiento utilizadas para entrenar la red neuronal.

In [None]:
# Convertir las respuestas en un array numpy y escalarlas
respuestas = np.array(respuestas).reshape(1, -1)
respuestas = sc.transform(respuestas)

17. Se realiza una predicción de la probabilidad de padecer diabetes utilizando el método "predict" de la red neuronal. Se accede al elemento [0][0] de la salida para obtener la probabilidad como un número decimal.

18. Se muestra el resultado al usuario utilizando la función "print" de Python. Se utiliza una cadena de formato para mostrar la probabilidad con 2 decimales y se multiplica por 100 para mostrar el resultado como un porcentaje.

In [None]:
# Predecir la probabilidad de padecer diabetes
probabilidad = ann.predict(respuestas)[0][0]

# Mostrar el resultado al usuario
print(f"La probabilidad de que usted padezca diabetes es de {probabilidad*100:.2f}%")

La probabilidad de que usted padezca diabetes es de 77.84%
