# Explorando KERAS

¡En este cuaderno vamos a cubrir paso a paso cómo modelar tu primera red neuronal!

Vamos a utilizar el conjunto de datos de inicio de diabetes de los indios Pima. Este es un conjunto de datos de Machine Learning estándar del repositorio de Machine Learning de UCI. Describe los datos de los registros médicos de los pacientes de los indios Pima y si tuvieron un inicio de diabetes dentro de los cinco años.

Como tal, es un problema de clasificación binaria (inicio de diabetes como 1 o no como 0). Todas las variables de entrada que describen a cada paciente son numéricas. Esto hace que sea fácil de usar directamente con redes neuronales que esperan valores numéricos de entrada y salida, y es ideal para nuestra primera red neuronal en Keras.

**Entender los datos**

Variables de Entrada (X):

- Número de veces embarazada.

- Concentración de glucosa plasmática a las 2 horas en una prueba de tolerancia oral a la glucosa.

- Presión arterial diastólica (mm Hg).

- Grosor del pliegue cutáneo del tríceps (mm).

- Insulina sérica de 2 horas (mu U/ml).

- Índice de masa corporal (peso en kg/(altura en m)^2).

- Función de pedigrí de diabetes.

- Años de edad.

Variables de salida (y):

Variable de clase (0 o 1)

**Requisitos:**

- Python 2 ó 3 instalado.

- SciPy (incluido NumPy) instalado.

- Keras y un backend (Theano o TensorFlow) instalado.

**Paso 1: instalar bibliotecas**

In [1]:
pip install scipy tensorflow

Collecting tensorflow
  Downloading tensorflow-2.9.1-cp38-cp38-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (511.7 MB)
[2K     [38;2;114;156;31m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m511.7/511.7 MB[0m [31m3.0 MB/s[0m eta [36m0:00:00[0mm eta [36m0:00:01[0m[36m0:00:01[0m
Collecting grpcio<2.0,>=1.24.3
  Downloading grpcio-1.47.0-cp38-cp38-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (4.5 MB)
[2K     [38;2;114;156;31m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m4.5/4.5 MB[0m [31m52.0 MB/s[0m eta [36m0:00:00[0m0m eta [36m0:00:01[0m
[?25hCollecting keras-preprocessing>=1.1.1
  Downloading Keras_Preprocessing-1.1.2-py2.py3-none-any.whl (42 kB)
[2K     [38;2;114;156;31m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m42.6/42.6 kB[0m [31m1.9 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting absl-py>=1.0.0
  Downloading absl_py-1.2.0-py3-none-any.whl (123 kB)
[2K     [38;2;114;156;31m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m123.4/123.4 kB[0m 

Para usar Keras, deberá tener instalado el paquete TensorFlow.

Una vez que TensorFlow esté instalado, solo importa Keras. Usaremos la biblioteca NumPy para cargar nuestro conjunto de datos y usaremos dos clases de la biblioteca Keras para definir nuestro modelo.

**Paso 2: importar bibliotecas**

In [1]:
# Primera red neuronal con keras

from numpy import loadtxt
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

2022-07-28 05:13:18.859773: W tensorflow/stream_executor/platform/default/dso_loader.cc:64] Could not load dynamic library 'libcudart.so.11.0'; dlerror: libcudart.so.11.0: cannot open shared object file: No such file or directory
2022-07-28 05:13:18.859912: I tensorflow/stream_executor/cuda/cudart_stub.cc:29] Ignore above cudart dlerror if you do not have a GPU set up on your machine.


**Paso 3: Cargar los datos**

Ahora podemos cargar el archivo como una matriz de números usando la función NumPy loadtxt().

In [5]:
# Cargar el conjunto de datos
dataset = loadtxt('../assets/pima-indians-diabetes.csv', delimiter=',')

# Dividir en variables de entrada (X) y salida (y)
X = dataset[:,0:8]
y = dataset[:,8]

**Paso 4: Definir el modelo KERAS**

Los modelos en Keras se definen como una secuencia de capas.

Creamos un modelo secuencial y agregamos capas una a la vez hasta que estemos satisfechos con nuestra arquitectura de red.

Primero, asegúrate de que la capa de entrada tenga la cantidad correcta de entidades de entrada. Esto se puede especificar al crear la primera capa con el argumento input_shape y establecerlo en (8,) para presentar las 8 variables de entrada como un vector.

¿Cómo sabemos el número de capas y sus tipos? A menudo, la mejor estructura de red se encuentra a través de un proceso de experimentación de prueba y error.

En este ejemplo, utilizaremos una estructura de red completamente conectada con tres capas.

Las capas totalmente conectadas se definen mediante la clase Dense. Podemos especificar el número de neuronas o nodos en la capa como primer argumento y especificar la función de activación usando el argumento de activación.

Usaremos la función de activación de la unidad lineal rectificada denominada ReLU en las dos primeras capas y la función Sigmoid en la capa de salida. Usamos un sigmoide en la capa de salida para garantizar que la salida de nuestra red esté entre 0 y 1 y sea fácil de asignar a una probabilidad de clase 1 o ajustarse a una clasificación rígida de cualquier clase con un umbral predeterminado de 0,5.

Para resumir:

- El modelo espera filas de datos con 8 variables (el argumento input_shape=(8,).

- La primera capa oculta tiene 12 nodos y utiliza la función de activación relu.

- La segunda capa oculta tiene 8 nodos y utiliza la función de activación relu.

- La capa de salida tiene un nodo y utiliza la función de activación sigmoidea.

In [6]:
# Definir el modelo de keras
model = Sequential()
model.add(Dense(12, input_shape=(8,), activation='relu'))
model.add(Dense(8, activation='relu'))
model.add(Dense(1, activation='sigmoid'))

2022-07-28 05:34:23.313842: W tensorflow/stream_executor/platform/default/dso_loader.cc:64] Could not load dynamic library 'libcuda.so.1'; dlerror: libcuda.so.1: cannot open shared object file: No such file or directory
2022-07-28 05:34:23.314107: W tensorflow/stream_executor/cuda/cuda_driver.cc:269] failed call to cuInit: UNKNOWN ERROR (303)
2022-07-28 05:34:23.314184: I tensorflow/stream_executor/cuda/cuda_diagnostics.cc:156] kernel driver does not appear to be running on this host (4geeksacade-machinelear-646p8lv2dr4): /proc/driver/nvidia/version does not exist
2022-07-28 05:34:23.314906: I tensorflow/core/platform/cpu_feature_guard.cc:193] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN) to use the following CPU instructions in performance-critical operations:  AVX2 FMA
To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.


**Paso 5: Compilar el modelo KERAS**

Ahora que el modelo está definido, podemos compilarlo. El backend elige automáticamente la mejor manera de representar la red para entrenar y hacer predicciones para ejecutar en su hardware, como CPU o GPU o incluso distribuido.

Al compilar, debemos especificar algunas propiedades adicionales requeridas al entrenar la red. Recuerde entrenar una red significa encontrar el mejor conjunto de pesos para asignar entradas a salidas en nuestro conjunto de datos.

Debemos especificar la función de pérdida a usar para evaluar un conjunto de pesos, el optimizador se usa para buscar entre diferentes pesos para la red y cualquier métrica opcional que nos gustaría recopilar. En este caso, utilizaremos la entropía cruzada como argumento de pérdida. Esta pérdida es para un problema de clasificación binaria y se define en Keras como "binary_crossentropy". 

Definiremos el optimizador como el algoritmo de descenso de gradiente estocástico eficiente “adam”. Esta es una versión popular del descenso de gradiente porque se sintoniza automáticamente y brinda buenos resultados en una amplia gama de problemas. recopilaremos e informaremos la precisión de la clasificación, definida a través del argumento de las métricas.

In [7]:
# Compilar el modelo de keras
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])

**Paso 6: Ajustar el modelo KERAS**

Hemos definido nuestro modelo y lo compilamos listo para un cálculo eficiente. Ahora vamos a ejecutar el modelo en algunos datos.

El entrenamiento ocurre en epochs (épocas) y cada época se divide en lotes (batches).

- Epoch: Una pasada por todas las filas del conjunto de datos de entrenamiento.

- Batch: Una o más muestras consideradas por el modelo dentro de una época antes de que se actualicen los pesos.

El proceso de entrenamiento se ejecutará durante un número fijo de iteraciones a través del conjunto de datos llamado epochs, que debemos especificar usando el argumento epochs. También debemos establecer la cantidad de filas del conjunto de datos que se consideran antes de que se actualicen los pesos del modelo dentro de cada epoch, lo que se denomina tamaño de batch y se establece mediante el argumento  batch_size (tamaño_lote).

Para este problema, ejecutaremos una pequeña cantidad de epochs (150) y usaremos un tamaño de batch relativamente pequeño de 10.

In [8]:
# Ajustar el modelo de keras en el conjunto de datos
model.fit(X, y, epochs=150, batch_size=10)

Epoch 1/150
Epoch 2/150
Epoch 3/150
Epoch 4/150
Epoch 5/150
Epoch 6/150
Epoch 7/150
Epoch 8/150
Epoch 9/150
Epoch 10/150
Epoch 11/150
Epoch 12/150
Epoch 13/150
Epoch 14/150
Epoch 15/150
Epoch 16/150
Epoch 17/150
Epoch 18/150
Epoch 19/150
Epoch 20/150
Epoch 21/150
Epoch 22/150
Epoch 23/150
Epoch 24/150
Epoch 25/150
Epoch 26/150
Epoch 27/150
Epoch 28/150
Epoch 29/150
Epoch 30/150
Epoch 31/150
Epoch 32/150
Epoch 33/150
Epoch 34/150
Epoch 35/150
Epoch 36/150
Epoch 37/150
Epoch 38/150
Epoch 39/150
Epoch 40/150
Epoch 41/150
Epoch 42/150
Epoch 43/150
Epoch 44/150
Epoch 45/150
Epoch 46/150
Epoch 47/150
Epoch 48/150
Epoch 49/150
Epoch 50/150
Epoch 51/150
Epoch 52/150
Epoch 53/150
Epoch 54/150
Epoch 55/150
Epoch 56/150
Epoch 57/150
Epoch 58/150
Epoch 59/150
Epoch 60/150
Epoch 61/150
Epoch 62/150
Epoch 63/150
Epoch 64/150
Epoch 65/150
Epoch 66/150
Epoch 67/150
Epoch 68/150
Epoch 69/150
Epoch 70/150
Epoch 71/150
Epoch 72/150
Epoch 73/150
Epoch 74/150
Epoch 75/150
Epoch 76/150
Epoch 77/150
Epoch 78

<keras.callbacks.History at 0x7f4d0071b0a0>

Aquí es donde ocurre el trabajo en tu CPU o GPU.

**Paso 7: Evaluar el modelo KERAS**

Hemos entrenado nuestra red neuronal en todo el conjunto de datos y podemos evaluar el rendimiento de la red en el mismo conjunto de datos. Idealmente, puedes separar tus datos en conjuntos de entrenamiento y prueba. La función evaluar() devolverá una lista con dos valores. El primero será la pérdida del modelo en el conjunto de datos y el segundo será la precisión del modelo en el conjunto de datos. Aquí, no estamos interesados ​​en la precisión, por lo que ignoraremos el valor de la pérdida.

In [9]:
# Evaluar el modelo de keras
_, accuracy = model.evaluate(X, y)
print('Accuracy: %.2f' % (accuracy*100))

Accuracy: 77.86


Reúne todo el código anterior en un archivo .py, por ejemplo llamado 'my_first_neural_network.py'. Si intenta ejecutar este ejemplo en un cuaderno IPython o Jupyter, es posible que obtenga un error.

Luego puede ejecutar el archivo python como un script desde su línea de comando de la siguiente manera:

```bash
python my_first_neural_network.py
```

Ejecutando este ejemplo, deberías ver un mensaje para cada uno de los 150 epochs imprimiendo la pérdida y la precisión, seguido por la evaluación final del modelo entrenado en el conjunto de datos de entrenamiento.

Nos encantaría que la pérdida fuera a cero y la precisión a 1.0. Esto no es posible para ningún problema de aprendizaje automático, excepto los más triviales. En su lugar, siempre tendremos algún error en nuestro modelo. El objetivo es elegir una configuración de modelo y una configuración de entrenamiento que logren la pérdida más baja y la precisión más alta posible para un conjunto de datos dado.

> Las redes neuronales son un algoritmo estocástico, lo que significa que el mismo algoritmo en los mismos datos puede entrenar un modelo diferente con diferentes habilidades cada vez que se ejecuta el código. Esta es una característica, no un error.

> La variación en el rendimiento del modelo significa que para obtener una aproximación razonable de cómo se está desempeñando mi modelo, es posible que tenga que ajustarlo muchas veces y calcular el promedio de las puntuaciones de precisión.

**Paso 8: Hacer predicciones**

Entonces, después de entrenar mi modelo unas cuantas veces y obtener un promedio de todas las precisiones obtenidas, ¿cómo hago predicciones?

Hacer predicciones es tan fácil como llamar a la función predict() en el modelo. Estamos usando una función de activación sigmoidal en la capa de salida, por lo que las predicciones serán una probabilidad en el rango entre 0 y 1. Podemos convertirlos fácilmente en una predicción binaria precisa para esta tarea de clasificación redondeándolos.

In [None]:
# hacer predicciones de probabilidad con el modelo. En este caso, estamos usando nuevamente el mismo conjunto de datos como si fueran datos nuevos.
predictions = model.predict(X)
# predicciones redondas
rounded = [round(x[0]) for x in predictions]

Podemos convertir la probabilidad en 0 o 1 para predecir clases nítidas directamente:

In [None]:
# make class predictions with the model
predictions = (model.predict(X) > 0.5).astype(int)

El ejemplo completo a continuación hace predicciones para cada ejemplo en el conjunto de datos, luego imprime los datos de entrada, la clase predicha y la clase esperada para los primeros 5 ejemplos en el conjunto de datos.

In [None]:
# primera red neuronal con keras hacer predicciones
from numpy import loadtxt
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
# cargar el conjunto de datos
dataset = loadtxt('../assets/pima-indians-diabetes.csv', delimiter=',')
# dividir en variables de entrada (X) y salida (y)
X = dataset[:,0:8]
y = dataset[:,8]
# definir el modelo de keras
model = Sequential()
model.add(Dense(12, input_shape=(8,), activation='relu'))
model.add(Dense(8, activation='relu'))
model.add(Dense(1, activation='sigmoid'))
# compilar el modelo keras
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
# ajuste el modelo de keras en el conjunto de datos
model.fit(X, y, epochs=150, batch_size=10, verbose=0)
# hacer predicciones de clase con el modelo
predictions = (model.predict(X) > 0.5).astype(int)
# resumir los primeros 5 casos
for i in range(5):
	print('%s => %d (expected %d)' % (X[i].tolist(), predictions[i], y[i]))

La razón por la que podrías obtener errores en un cuaderno de Jupyter es debido a las barras de progreso de salida durante el entrenamiento. Puedes desactivarlos fácilmente estableciendo verbose=0 en la llamada a las funciones fit() y evaluate(), como acabamos de hacer en el ejemplo.

Podemos ver que la mayoría de las filas se predice correctamente. De hecho, esperaríamos que alrededor del 76.9% de las filas se predijeran correctamente de acuerdo con el rendimiento estimado del modelo en la sección anterior.

**Paso 9: Guarda tu modelo**

Guardar modelos requiere que tengas la biblioteca h5py instalada. Normalmente se instala como una dependencia con TensorFlow. También puedes instalarlo fácilmente de la siguiente manera:

```bash
sudo pip install h5py
```

Keras separa las preocupaciones de guardar la arquitectura de tu modelo y guardar los pesos de tu modelo.

La estructura del modelo se puede describir y guardar usando dos formatos diferentes: JSON y YAML. Ambos guardan la arquitectura del modelo y los pesos por separado. Los pesos del modelo se guardan en un archivo en formato HDF5 en todos los casos.

Keras también admite una interfaz más simple para guardar tanto los pesos del modelo como la arquitectura del modelo juntos en un solo archivo H5.

Guardar el modelo de esta manera incluye todo lo que necesitamos saber sobre el modelo, incluyendo:

Pesos del modelo.
Arquitectura del modelo.
Detalles de compilación del modelo (pérdida y métricas).
Estado del optimizador del modelo.

Esto significa que podemos cargar y usar el modelo directamente, sin tener que volver a compilarlo.

> Nota: esta es la forma preferida para guardar y cargar tu modelo de Keras.

Puedes guardar tu modelo llamando a la función save() en el modelo y especificando el nombre del archivo.

El ejemplo a continuación lo demuestra primero ajustando un modelo, evaluándolo y guardándolo en el archivo model.h5.

In [None]:
# MLP para Pima Indians Conjunto de datos guardado en un solo archivo
from numpy import loadtxt
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
# cargar el conjunto de datos de los indios pima
dataset = loadtxt("pima-indians-diabetes.csv", delimiter=",")
# dividir en variables de entrada (X) y salida (Y)
X = dataset[:,0:8]
Y = dataset[:,8]
# definir modelo
model = Sequential()
model.add(Dense(12, input_dim=8, activation='relu'))
model.add(Dense(8, activation='relu'))
model.add(Dense(1, activation='sigmoid'))
# compilar modelo
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
# ajustar el modelo
model.fit(X, Y, epochs=150, batch_size=10, verbose=0)
# evaluar el modelo
scores = model.evaluate(X, Y, verbose=0)
print("%s: %.2f%%" % (model.metrics_names[1], scores[1]*100))
# guardar el modelo y la arquitectura en un solo archivo
model.save("model.h5")
print("Saved model to disk")

Un código equivalente para guardar el modelo es el siguiente:

```py
# equivalente a: modelo.guardar("modelo.h5")
from tensorflow.keras.models import save_model
save_model(model, "model.h5")
```

> Si deseas saber cómo guardar su modelo usando JSON o YAML, vaya a https://machinelearningmastery.com/save-load-keras-deep-learning-models/

**Paso 10: Carga tu modelo**

Tu modelo guardado puede ser cargado más tarde llamando a la función load_model() y pasando el nombre del archivo. La función devuelve el modelo con la misma arquitectura y pesos.

En el siguiente código, cargamos el modelo, resumimos la arquitectura y lo evaluamos en el mismo conjunto de datos para confirmar que los pesos y la arquitectura son los mismos.

In [None]:
# cargar y evaluar un modelo guardado
from numpy import loadtxt
from tensorflow.keras.models import load_model
 
# modelo de carga
model = load_model('model.h5')
# resumir modelo
model.summary()
# cargar conjunto de datos
dataset = loadtxt("pima-indians-diabetes.csv", delimiter=",")
# dividir en variables de entrada (X) y salida (Y)
X = dataset[:,0:8]
Y = dataset[:,8]
# evaluar el modelo
score = model.evaluate(X, Y, verbose=0)
print("%s: %.2f%%" % (model.metrics_names[1], score[1]*100))

Fuente:

https://keras.io/examples/

https://machinelearningmastery.com/tutorial-first-neural-network-python-keras/

https://keras.io/examples/vision/image_classification_from_scratch/