In [1]:
# import libraries

import numpy as np
import matplotlib.pyplot       as plt

In [2]:
# load data from file 
data = np.loadtxt('datosML/diabetes.data',delimiter=',')
data.shape

(768, 9)

In [3]:
#verifica el tipo de la variable data
type(data)

numpy.ndarray

In [4]:
# separa los datos en X y y
X = data[:,:8]
y = data[:,8].astype(int)

# imprime el tamaño de X y y
print("[INFO]\nX: %s\ny: %s"%(X.shape,y.shape))

[INFO]
X: (768, 8)
y: (768,)


**Sequential**  es un modelo que permite crear redes neuronales de forma secuencial, capa por capa, sin bifurcaciones ni conexiones complicadas entre capas. Cada capa en un modelo Sequential toma la salida de la capa anterior como entrada y produce una salida para la siguiente capa. Es una forma simple y directa de construir modelos de redes neuronales en Keras.

**Dense**  es una capa completamente conectada en una red neuronal, donde cada neurona en una capa está conectada a todas las neuronas de la capa anterior y siguiente. La capa Dense es fundamental para la mayoría de las arquitecturas de redes neuronales y se utiliza comúnmente en tareas de clasificación y regresión.

**Dropout** es una técnica de regularización utilizada para prevenir el sobreajuste en modelos de redes neuronales al azarmente desactivar un porcentaje de unidades de una capa durante el entrenamiento. Esto ayuda a mejorar la generalización del modelo al reducir la dependencia de unidades específicas.

**Adam**es un algoritmo de optimización popular utilizado para ajustar los pesos de una red neuronal durante el entrenamiento. Combina técnicas de descenso de gradiente estocástico con adaptación de la tasa de aprendizaje por cada parámetro de la red. Adam ajusta automáticamente la tasa de aprendizaje durante el entrenamiento, lo que lo hace eficiente y efectivo en una variedad de problemas de optimización.

In [9]:

from keras.models import Sequential
from keras.layers import Dense, Dropout
from keras.optimizers import Adam

from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

ModuleNotFoundError: No module named 'distutils'

Para construir un modelo en Keras, se utiliza la clase Sequential para definir la arquitectura de la red neuronal, donde se pueden agregar capas utilizando la clase Dense. Cada capa Dense representa una capa completamente conectada en la red, especificando el número de unidades (neuronas) y la función de activación a utilizar. La función de activación determina la salida de cada neurona y puede ser relu, sigmoid, tanh, entre otras. Estas capas se encadenan secuencialmente, y al final se compila el modelo especificando la función de pérdida, el optimizador (como Adam) y las métricas a seguir durante el entrenamiento.

En este caso se utiliza una sola neurona en la capa de salida porque esta neurona representa la probabilidad de pertenencia a una de las dos clases mediante una salida sigmoidal, donde valores cercanos a 0 indican la clase negativa y valores cercanos a 1 indican la clase positiva. Esta configuración simplifica el modelo y es adecuada para problemas de clasificación binaria.

In [5]:
num_classes = 2
hl1 = 12
hl2 = 8
hl3 = 1
#multilayer feedforward

model = Sequential()
model.add(Dense(hl1, input_dim=8, activation='relu'))
model.add(Dense(hl2, activation='relu'))
model.add(Dense(hl3, activation='sigmoid'))  
model.summary()

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense (Dense)               (None, 12)                108       
                                                                 
 dense_1 (Dense)             (None, 8)                 104       
                                                                 
 dense_2 (Dense)             (None, 1)                 9         
                                                                 
Total params: 221 (884.00 Byte)
Trainable params: 221 (884.00 Byte)
Non-trainable params: 0 (0.00 Byte)
_________________________________________________________________


In [12]:
#separar datos train test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)
# Escalar características
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

La función **compile** se utiliza para configurar el proceso de entrenamiento de un modelo neuronal, donde se especifican el tipo de pérdida (loss) a minimizar durante el entrenamiento, el optimizador (optimizer) para ajustar los pesos de la red y las métricas para evaluar el rendimiento del modelo. La pérdida representa la discrepancia entre las predicciones del modelo y los valores reales, mientras que el optimizador determina cómo se actualizan los pesos de la red para minimizar esta pérdida durante el entrenamiento. Estos parámetros son cruciales para definir cómo el modelo aprende a partir de los datos y cómo se evalúa su rendimiento.

En un modelo de Keras para clasificación binaria, se utiliza la función de pérdida `binary_crossentropy`, que calcula la pérdida entre las etiquetas y las predicciones para un problema de dos clases. 

En Keras, el método **fit** se utiliza para entrenar un modelo de red neuronal con un conjunto de datos. Los parámetros **epochs** especifican el número de veces que se recorrerán todos los datos durante el entrenamiento, mientras que **batch_size** determina el tamaño del lote de datos que se utilizará en cada iteración del entrenamiento. Juntos, estos parámetros controlan la duración y la granularidad del proceso de entrenamiento del modelo.

In [8]:
#'binary_crossentropy'

model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
model.fit(X_train, y_train, epochs=100, batch_size=10)

Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78

<keras.src.callbacks.History at 0x280325c6970>

Cuando se hace una predicción con un modelo de Keras que utiliza una neurona con salida sigmoidal, la salida de las predicciones estará en el rango de 0 a 1, representando la probabilidad de que cada entrada pertenezca a la clase positiva. Valores cercanos a 0 indican baja probabilidad de pertenencia a la clase positiva, mientras que valores cercanos a 1 indican alta probabilidad. Las predicciones pueden interpretarse como la confianza del modelo en la clasificación de cada entrada.

In [37]:
predictions = model.predict(X_test)
predictions[:10]



array([[0.44262314],
       [0.52369165],
       [0.00602657],
       [0.0861876 ],
       [0.5521601 ],
       [0.8478794 ],
       [0.00208336],
       [0.02506901],
       [0.02953195],
       [0.30570748]], dtype=float32)

In [40]:
# round predictions 
rounded = [round(x[0]) for x in predictions]
rounded[:10]

[0, 1, 0, 0, 1, 1, 0, 0, 0, 0]

In [41]:
print("etiqueta 10 primeros datos de prueba:  ",y_test[:10],\
      "\nprediccion 10 primeros datos de prueba:",rounded[:10])

etiqueta 10 primeros datos de prueba:   [0 0 0 0 1 1 0 0 0 1] 
prediccion 10 primeros datos de prueba: [0, 1, 0, 0, 1, 1, 0, 0, 0, 0]


In [42]:
_, accuracy = model.evaluate(X_test, y_test)
print('Accuracy: %.2f' % (accuracy*100))


Accuracy: 74.46


# Crear una función que automatice el proceso
La función agrega capas de dropout entre las capas densas. Los parámetros de configuración se envian a la función. 

In [28]:
def create_model(neurons_per_layer, input_dim, activation_func, dropout_rate):
    model = Sequential()
    model.add(Dense(neurons_per_layer[0], input_dim=input_dim, activation=activation_func))
    model.add(Dropout(dropout_rate))
    neurons_per_layer.pop(0)
    for neurons in neurons_per_layer:
        model.add(Dense(neurons, activation=activation_func))
        model.add(Dropout(dropout_rate))
    model.add(Dense(1, activation='sigmoid'))
    return model

In [34]:
neurons_per_layer = [64, 32]        # Número de neuronas en cada capa oculta
activation_func   = 'relu'          # Función de activación
dropout_rate      = 0.2             # Tasa de dropout
input_dim         =  X_train.shape[1] #dimension de datos

model = create_model(neurons_per_layer, input_dim, activation_func, dropout_rate)
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
model.summary()

Model: "sequential_8"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_24 (Dense)            (None, 64)                576       
                                                                 
 dropout_13 (Dropout)        (None, 64)                0         
                                                                 
 dense_25 (Dense)            (None, 32)                2080      
                                                                 
 dropout_14 (Dropout)        (None, 32)                0         
                                                                 
 dense_26 (Dense)            (None, 1)                 33        
                                                                 
Total params: 2689 (10.50 KB)
Trainable params: 2689 (10.50 KB)
Non-trainable params: 0 (0.00 Byte)
_________________________________________________________________


In [36]:
model.fit(X_train, y_train, epochs=50, batch_size=32, validation_data=(X_test, y_test))
loss, accuracy = model.evaluate(X_test, y_test)
print(f'Loss: {loss}, Accuracy: {accuracy}')


Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50
Loss: 0.5381998419761658, Accuracy: 0.7445887327194214
