In [2]:
# import libraries

import numpy as np
import matplotlib.pyplot       as plt

In [3]:
# load data from file 
data = np.loadtxt('datasets/diabetes.data',delimiter=',')
data.shape

(768, 9)

In [4]:
#verifica el tipo de la variable data
type(data)

numpy.ndarray

In [5]:
# separa los datos en X y y
X = data[:,:8]
y = data[:,8].astype(int)

# imprime el tamaño de X y y
print("[INFO]\nX: %s\ny: %s"%(X.shape,y.shape))

[INFO]
X: (768, 8)
y: (768,)


**Sequential**  es un modelo que permite crear redes neuronales de forma secuencial, capa por capa, sin bifurcaciones ni conexiones complicadas entre capas. Cada capa en un modelo Sequential toma la salida de la capa anterior como entrada y produce una salida para la siguiente capa. Es una forma simple y directa de construir modelos de redes neuronales en Keras.

**Dense**  es una capa completamente conectada en una red neuronal, donde cada neurona en una capa está conectada a todas las neuronas de la capa anterior y siguiente. La capa Dense es fundamental para la mayoría de las arquitecturas de redes neuronales y se utiliza comúnmente en tareas de clasificación y regresión.

**Dropout** es una técnica de regularización utilizada para prevenir el sobreajuste en modelos de redes neuronales al azarmente desactivar un porcentaje de unidades de una capa durante el entrenamiento. Esto ayuda a mejorar la generalización del modelo al reducir la dependencia de unidades específicas.

**Adam**es un algoritmo de optimización popular utilizado para ajustar los pesos de una red neuronal durante el entrenamiento. Combina técnicas de descenso de gradiente estocástico con adaptación de la tasa de aprendizaje por cada parámetro de la red. Adam ajusta automáticamente la tasa de aprendizaje durante el entrenamiento, lo que lo hace eficiente y efectivo en una variedad de problemas de optimización.

In [6]:

from keras.models import Sequential
from keras.layers import Dense, Dropout
from keras.optimizers import Adam

from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

Para construir un modelo en Keras, se utiliza la clase Sequential para definir la arquitectura de la red neuronal, donde se pueden agregar capas utilizando la clase Dense. Cada capa Dense representa una capa completamente conectada en la red, especificando el número de unidades (neuronas) y la función de activación a utilizar. La función de activación determina la salida de cada neurona y puede ser relu, sigmoid, tanh, entre otras. Estas capas se encadenan secuencialmente, y al final se compila el modelo especificando la función de pérdida, el optimizador (como Adam) y las métricas a seguir durante el entrenamiento.

En este caso se utiliza una sola neurona en la capa de salida porque esta neurona representa la probabilidad de pertenencia a una de las dos clases mediante una salida sigmoidal, donde valores cercanos a 0 indican la clase negativa y valores cercanos a 1 indican la clase positiva. Esta configuración simplifica el modelo y es adecuada para problemas de clasificación binaria.

In [7]:
num_classes = 2
hl1 = 12
hl2 = 8
hl3 = 1
#multilayer feedforward

model = Sequential()
model.add(Dense(hl1, input_dim=8, activation='relu'))
model.add(Dense(hl2, activation='relu'))
model.add(Dense(hl3, activation='sigmoid'))  
model.summary()

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


In [8]:
#separar datos train test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)
# Escalar características
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

La función **compile** se utiliza para configurar el proceso de entrenamiento de un modelo neuronal, donde se especifican el tipo de pérdida (loss) a minimizar durante el entrenamiento, el optimizador (optimizer) para ajustar los pesos de la red y las métricas para evaluar el rendimiento del modelo. La pérdida representa la discrepancia entre las predicciones del modelo y los valores reales, mientras que el optimizador determina cómo se actualizan los pesos de la red para minimizar esta pérdida durante el entrenamiento. Estos parámetros son cruciales para definir cómo el modelo aprende a partir de los datos y cómo se evalúa su rendimiento.

En un modelo de Keras para clasificación binaria, se utiliza la función de pérdida `binary_crossentropy`, que calcula la pérdida entre las etiquetas y las predicciones para un problema de dos clases. 

En Keras, el método **fit** se utiliza para entrenar un modelo de red neuronal con un conjunto de datos. Los parámetros **epochs** especifican el número de veces que se recorrerán todos los datos durante el entrenamiento, mientras que **batch_size** determina el tamaño del lote de datos que se utilizará en cada iteración del entrenamiento. Juntos, estos parámetros controlan la duración y la granularidad del proceso de entrenamiento del modelo.

In [9]:
#'binary_crossentropy'

model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
model.fit(X_train, y_train, epochs=100, batch_size=10)

Epoch 1/100
[1m54/54[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 8ms/step - accuracy: 0.6658 - loss: 0.6682
Epoch 2/100
[1m54/54[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 8ms/step - accuracy: 0.6982 - loss: 0.6294
Epoch 3/100
[1m54/54[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 8ms/step - accuracy: 0.6743 - loss: 0.6034
Epoch 4/100
[1m54/54[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 8ms/step - accuracy: 0.6825 - loss: 0.5462
Epoch 5/100
[1m54/54[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 8ms/step - accuracy: 0.6806 - loss: 0.5206
Epoch 6/100
[1m54/54[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 7ms/step - accuracy: 0.6825 - loss: 0.5179
Epoch 7/100
[1m54/54[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 7ms/step - accuracy: 0.7021 - loss: 0.5255
Epoch 8/100
[1m54/54[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 9ms/step - accuracy: 0.7245 - loss: 0.5019
Epoch 9/100
[1m54/54[0m [32m━━━━━━━━━━━━━━━━━

<keras.src.callbacks.history.History at 0x1f160c94cd0>

Cuando se hace una predicción con un modelo de Keras que utiliza una neurona con salida sigmoidal, la salida de las predicciones estará en el rango de 0 a 1, representando la probabilidad de que cada entrada pertenezca a la clase positiva. Valores cercanos a 0 indican baja probabilidad de pertenencia a la clase positiva, mientras que valores cercanos a 1 indican alta probabilidad. Las predicciones pueden interpretarse como la confianza del modelo en la clasificación de cada entrada.

In [10]:
predictions = model.predict(X_test)
predictions[:10]

[1m8/8[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 31ms/step


array([[0.11356289],
       [0.41614625],
       [0.17912087],
       [0.35972434],
       [0.4984173 ],
       [0.92622626],
       [0.45723963],
       [0.08912256],
       [0.7462695 ],
       [0.24451536]], dtype=float32)

In [11]:
# round predictions 
rounded = [round(x[0]) for x in predictions]
rounded[:10]

[0, 0, 0, 0, 0, 1, 0, 0, 1, 0]

In [12]:
print("etiqueta 10 primeros datos de prueba:  ",y_test[:10],\
      "\nprediccion 10 primeros datos de prueba:",rounded[:10])

etiqueta 10 primeros datos de prueba:   [0 1 0 1 0 1 1 0 1 0] 
prediccion 10 primeros datos de prueba: [0, 0, 0, 0, 0, 1, 0, 0, 1, 0]


In [13]:
_, accuracy = model.evaluate(X_test, y_test)
print('Accuracy: %.2f' % (accuracy*100))


[1m8/8[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 11ms/step - accuracy: 0.7664 - loss: 0.4767 
Accuracy: 77.06


# Crear una función que automatice el proceso
La función agrega capas de dropout entre las capas densas. Los parámetros de configuración se envian a la función. 

In [14]:
def create_model(neurons_per_layer, input_dim, activation_func, dropout_rate):
    model = Sequential()
    model.add(Dense(neurons_per_layer[0], input_dim=input_dim, activation=activation_func))
    model.add(Dropout(dropout_rate))
    neurons_per_layer.pop(0)
    for neurons in neurons_per_layer:
        model.add(Dense(neurons, activation=activation_func))
        model.add(Dropout(dropout_rate))
    model.add(Dense(1, activation='sigmoid'))
    return model

In [15]:
neurons_per_layer = [64, 32]        # Número de neuronas en cada capa oculta
activation_func   = 'relu'          # Función de activación
dropout_rate      = 0.2             # Tasa de dropout
input_dim         =  X_train.shape[1] #dimension de datos

model = create_model(neurons_per_layer, input_dim, activation_func, dropout_rate)
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
model.summary()

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


In [16]:
model.fit(X_train, y_train, epochs=50, batch_size=32, validation_data=(X_test, y_test))
loss, accuracy = model.evaluate(X_test, y_test)
print(f'Loss: {loss}, Accuracy: {accuracy}')


Epoch 1/50


[1m17/17[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 71ms/step - accuracy: 0.6647 - loss: 0.6604 - val_accuracy: 0.6970 - val_loss: 0.6167
Epoch 2/50
[1m17/17[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 27ms/step - accuracy: 0.7440 - loss: 0.5705 - val_accuracy: 0.7532 - val_loss: 0.5605
Epoch 3/50
[1m17/17[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 20ms/step - accuracy: 0.7527 - loss: 0.5365 - val_accuracy: 0.7619 - val_loss: 0.5203
Epoch 4/50
[1m17/17[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 22ms/step - accuracy: 0.7468 - loss: 0.5153 - val_accuracy: 0.7619 - val_loss: 0.4981
Epoch 5/50
[1m17/17[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 22ms/step - accuracy: 0.7663 - loss: 0.5236 - val_accuracy: 0.7706 - val_loss: 0.4828
Epoch 6/50
[1m17/17[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 24ms/step - accuracy: 0.7340 - loss: 0.5219 - val_accuracy: 0.7879 - val_loss: 0.4766
Epoch 7/50
[1m17/17[0m [32m━━━━━━━━━━━━━━━