# EJEMPLO - RED NEURONAL DENSA BÁSICA

## Paso 1: Importar librerías 

In [1]:
import numpy as np
from sklearn.model_selection import train_test_split
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Input
from tensorflow.keras.utils import to_categorical

2024-12-10 18:40:52.260676: I tensorflow/core/platform/cpu_feature_guard.cc:210] This TensorFlow binary is optimized to use available CPU instructions in performance-critical operations.
To enable the following instructions: AVX2 FMA, in other operations, rebuild TensorFlow with the appropriate compiler flags.


## Paso 2: Preparación de los datos

Creamos los datos dividios en dos. Una matriz de 4x2 para los datos de entrenamiento y un array de 4 elementos para los datos objetivo.

In [2]:
# Generación de datos simulados
np.random.seed(42)
X = np.random.rand(1000, 2)  # 1000 muestras con 2 características
y = (X[:, 0] + X[:, 1] > 1).astype(int)  # Etiquetas binarias: 1 si la suma de las características > 1

print(X)
print(y)

[[0.37454012 0.95071431]
 [0.73199394 0.59865848]
 [0.15601864 0.15599452]
 ...
 [0.75137509 0.65695516]
 [0.95661462 0.06895802]
 [0.05705472 0.28218707]]
[1 1 0 0 1 0 1 0 0 0 0 0 1 0 0 0 1 1 0 1 0 0 0 0 0 1 1 1 0 0 0 1 0 0 1 0 0
 1 0 0 1 0 0 1 1 0 1 1 0 0 0 0 1 1 0 0 1 1 0 1 1 0 0 1 0 0 0 1 1 1 1 0 0 1
 0 1 0 1 1 0 1 1 0 0 0 0 0 0 1 1 0 1 0 1 0 0 1 0 1 1 0 1 0 0 0 1 0 0 1 1 1
 0 0 1 1 1 1 0 0 0 1 1 0 1 1 0 1 0 1 0 1 0 1 1 0 1 1 1 1 1 1 0 0 1 0 0 1 0
 0 0 0 1 1 0 1 0 0 1 0 0 1 0 1 1 0 1 0 0 1 0 0 0 1 0 1 1 0 0 0 1 1 1 1 1 0
 0 0 0 0 1 0 1 1 0 1 1 1 1 1 1 1 1 1 0 0 1 1 1 0 1 1 0 0 1 0 0 0 0 0 0 1 0
 1 1 0 1 1 0 0 0 0 1 1 1 1 0 0 1 0 1 1 1 1 0 1 1 0 0 0 1 1 1 0 1 1 1 1 0 1
 1 0 1 1 0 0 1 1 1 1 0 1 0 0 0 1 1 1 1 0 1 0 0 0 0 1 1 1 1 1 0 1 0 0 0 0 0
 0 1 0 0 0 0 0 0 1 0 0 1 0 1 0 0 0 1 0 1 1 0 0 0 0 0 1 1 1 0 1 0 0 1 1 0 0
 0 0 1 0 1 0 1 1 0 1 0 0 0 0 0 0 0 0 0 1 1 0 1 0 1 1 0 1 0 1 0 0 0 1 1 1 0
 0 1 1 0 1 1 0 0 1 1 0 0 0 1 1 0 0 0 0 1 1 0 1 0 1 0 1 0 1 1 0 1 1 1 0 1 1
 1 0 0 0 0 1 0 1 0 

## Paso 3: División de los datos

In [3]:
# Dividir los datos en entrenamiento, validación y pruebas
X_train, X_temp, y_train, y_temp = train_test_split(X, y, test_size=0.2, random_state=42)
X_val, X_test, y_val, y_test = train_test_split(X_temp, y_temp, test_size=0.5, random_state=42)

## Paso 4: Creación del modelo 

Creación del modelo de Red Neuronal Densa (RND) básica y añadiremos la definición de cada una de las capas

Elemento Model:
+ Sequential(): inicializa una red neuronal secuencial

+ add():
    + Capa Input: permite especificar el número de características de los datos de entradas (en este caso tenemos 2 variables).
    + Capa Dense: en este caso se crean 2 capas, una con 16 neuronas  y la de output con 1
    + El atributo 'activation' establece la función de activación a utilizar para cada una de las capas. 

+ compile():
    + loss: especifica la función de pérdida (loss function)
    + optimizer: ajusta los pesos del modelo durante el entrenamiento con el objetivo de minimizar la función de pérdida.
    + metrics: son utilizadas para evaluar el modelo.

In [None]:
import matplotlib.pyplot as plt

def draw_nn_diagram():
    fig, ax = plt.subplots(figsize=(10, 6))
    ax.axis("off")

    # Capas del modelo
    layers = {
        "Input Layer": {"size": 2, "color": "orange"},
        "Hidden Layer": {"size": 16, "color": "green"},
        "Output Layer": {"size": 1, "color": "red"},
    }
    layer_spacing = 4  # Espaciado entre capas
    max_neurons = max([v["size"] for v in layers.values()])  # Máximo de neuronas por capa

    # Dibujar las capas y conexiones
    layer_positions = []
    for i, (name, props) in enumerate(layers.items()):
        x = i * layer_spacing
        y_start = (max_neurons - props["size"]) / 2

        layer_pos = []
        for j in range(props["size"]):
            y = max_neurons - y_start - j - 1
            circle = plt.Circle((x, y), 0.4, color=props["color"], ec="black", lw=1.5)
            ax.add_patch(circle)
            layer_pos.append((x, y))
        layer_positions.append(layer_pos)
        
        # Etiqueta de la capa
        ax.text(x, max_neurons + 0.5, name, ha="center", fontsize=12, color=props["color"])

    # Dibujar conexiones entre capas
    for i in range(len(layer_positions) - 1):
        current_layer = layer_positions[i]
        next_layer = layer_positions[i + 1]

        for start in current_layer:
            for end in next_layer:
                ax.plot([start[0] + 0.4, end[0] - 0.4], [start[1], end[1]], "k-", lw=0.5)

    # Título
    
    plt.show()

draw_nn_diagram()


#### OPCIÓN 1

In [5]:
model = Sequential()
model.add(Input(shape=(2,)))
model.add(Dense(16, activation="relu"))
model.add(Dense(1, activation="sigmoid"))

#### OPCIÓN 2

In [6]:
model = Sequential([
    Input(shape=(2,)),               # Capa de entrada
    Dense(16, activation="relu"),    # Capa oculta
    Dense(1, activation="sigmoid")   # Capa de salida
])

In [7]:
model.compile(loss="binary_crossentropy", optimizer="adam", metrics=["binary_accuracy", "AUC"])

## Paso 5: Entrenamiento el modelo con los datos de training

fit():
+   epochs: número de iteraciones. En general, es posible que necesites experimentar con diferentes valores de épocas para encontrar el equilibrio correcto entre subajuste y sobreajuste.

In [8]:
# Entrenar el modelo
history = model.fit(
    X_train, y_train,
    validation_data=(X_val, y_val),
    epochs=20,
    batch_size=32
)

Epoch 1/20
[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 11ms/step - AUC: 0.4749 - binary_accuracy: 0.4625 - loss: 0.6959 - val_AUC: 0.8037 - val_binary_accuracy: 0.6100 - val_loss: 0.6810
Epoch 2/20
[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - AUC: 0.7694 - binary_accuracy: 0.6077 - loss: 0.6794 - val_AUC: 0.9109 - val_binary_accuracy: 0.5700 - val_loss: 0.6689
Epoch 3/20
[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - AUC: 0.8700 - binary_accuracy: 0.5659 - loss: 0.6643 - val_AUC: 0.9553 - val_binary_accuracy: 0.5500 - val_loss: 0.6580
Epoch 4/20
[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - AUC: 0.9202 - binary_accuracy: 0.5643 - loss: 0.6544 - val_AUC: 0.9736 - val_binary_accuracy: 0.5800 - val_loss: 0.6474
Epoch 5/20
[1m25/25[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - AUC: 0.9379 - binary_accuracy: 0.6046 - loss: 0.6384 - val_AUC: 0.9812 - val_binary_accur

+ Epoch X/Y: indica el número de la época actual (X) y el número total de épocas a entrenar (Y).
+ AUC: precisión del modelo según la métrica AUC sobre los datos de entrenamiento durante la época actual en el conjunto de entrenamiento.
+ binary_accuracy: precisión del modelo según la métrica binary_accuracy sobre los datos de entrenamiento durante la época actual en el conjunto de entrenamiento.
+ loss: pérdida del modelo calculada con la función de pérdida definida (binary_crossentropy en este caso) sobre los datos de entrenamiento.
Un valor menor significa que el modelo está aprendiendo mejor.
+ val_binary_AUC: precisión del modelo según la métrica AUAC sobre el conjunto de validación después de la época actual.
+ val_binary_accuracy: precisión del modelo según la métrica binary_accuracy sobre el conjunto de validación después de la época actual.
+ val_loss: pérdida del modelo en el conjunto de validación después de la época actual. Si la val_loss aumenta con el tiempo, puede ser un indicativo de sobreajuste.

## Paso 6: Evaluación el modelo con los datos de testing

In [9]:
# Evaluar el modelo en el conjunto de pruebas
test_loss, test_accuracy, test_auc = model.evaluate(X_test, y_test)
print(f"Conjunto de prueba - Pérdida: {test_loss}, Precisión: {test_accuracy}, AUC: {test_auc}")

[1m4/4[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 4ms/step - AUC: 0.9973 - binary_accuracy: 0.8860 - loss: 0.4372
Conjunto de prueba - Pérdida: 0.4264422655105591, Precisión: 0.8999999761581421, AUC: 0.9969806671142578


## Paso 7: Generación de predicciones

In [13]:
# Generar predicciones
predictions = model.predict(X_test)
predicted_classes = predictions.round()  # Convertir probabilidades en clases binarias

[1m4/4[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 1ms/step 


El código realiza una predicción utilizando el modelo entrenado (model) en el conjunto de datos de entrenamiento (training_data): 
+ predict:devuelve las predicciones del modelo

+ round: redondea los valores de las predicciones a los enteros más cercanos. Este paso es común cuando se trata de problemas de clasificación binaria, donde las predicciones a menudo representan probabilidades y se redondean a 0 o 1 para obtener etiquetas binarias.

In [11]:
# Mostrar algunas predicciones y etiquetas reales
for i in range(10):  # Mostrar las primeras 10 predicciones
    print(f"Entrada: {X_test[i]}, Predicción: {predicted_classes[i]}, Real: {y_test[i]}")

Entrada: [0.64399954 0.40873417], Predicción: [1.], Real: 1
Entrada: [0.07125673 0.01210848], Predicción: [0.], Real: 0
Entrada: [0.50761038 0.24240973], Predicción: [0.], Real: 0
Entrada: [0.80744016 0.8960913 ], Predicción: [1.], Real: 1
Entrada: [0.13071038 0.88660422], Predicción: [1.], Real: 1
Entrada: [0.40076306 0.55964033], Predicción: [1.], Real: 0
Entrada: [0.61341139 0.16703395], Predicción: [0.], Real: 0
Entrada: [0.06649627 0.74112065], Predicción: [0.], Real: 0
Entrada: [0.7325721  0.21494038], Predicción: [1.], Real: 0
Entrada: [0.8766536  0.40348287], Predicción: [1.], Real: 1


In [12]:
model.summary()

2 + 1 = 3

16 x 3 = 48

16 + 1 = 17

17 x 1 = 17

48 + 17 = 65