## PRIMERA RED NEURONAL

Emulación de una puerta XOR

Importamos librerías necesarias

In [1]:
import keras
from keras.layers import Dense
import numpy as np


Arquitectura del modelo de RN para puerta XOR

In [2]:
model = keras.Sequential([
    keras.layers.Input(shape=(2,)),
    keras.layers.Dense(units=16,activation='relu'),
    keras.layers.Dense(units=1,activation='sigmoid')
])

Compilación del modelo

In [3]:
model.compile(loss='mean_squared_error',
              optimizer='adam',
              metrics=['binary_accuracy'])

Preparación de los datos

In [4]:
training_data = np.array ([[0,0],[0,1],[1,0],[1,1]], dtype="float32")
target_data = np.array([[0],[1],[1],[0]],dtype="float32")

Entrenamiento del modelo

In [5]:
model.fit(training_data,target_data,epochs=100)

Epoch 1/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 627ms/step - binary_accuracy: 0.5000 - loss: 0.2593
Epoch 2/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 28ms/step - binary_accuracy: 0.2500 - loss: 0.2590
Epoch 3/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 29ms/step - binary_accuracy: 0.5000 - loss: 0.2587
Epoch 4/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 27ms/step - binary_accuracy: 0.5000 - loss: 0.2585
Epoch 5/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 28ms/step - binary_accuracy: 0.5000 - loss: 0.2582
Epoch 6/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 27ms/step - binary_accuracy: 0.5000 - loss: 0.2580
Epoch 7/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 26ms/step - binary_accuracy: 0.5000 - loss: 0.2577
Epoch 8/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 25ms/step - binary_accuracy: 0.5000 - loss: 0.2574

<keras.src.callbacks.history.History at 0x261a6d03e90>

Evaluación del modelo

In [6]:
scores = model.evaluate(training_data, target_data)
print("\n%s: %.2f%%" % (model.metrics_names[1], scores[1]*100))

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 101ms/step - binary_accuracy: 1.0000 - loss: 0.2317

compile_metrics: 100.00%


Predicción

In [7]:
print (model.predict(training_data).round())

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 48ms/step
[[0.]
 [1.]
 [1.]
 [0.]]


## RED NEURONAL PARA CLASIFICACIÓN DE DÍGITOS (Dataset MNIST)

Carga del dataset

In [8]:
(X_train, y_train) , (X_test, y_test) = keras.datasets.mnist.load_data()

In [9]:
print(X_train.shape)

(60000, 28, 28)


In [10]:
print(X_test.shape)

(10000, 28, 28)


Cada muestra de entrenamiento y test son arrays de 28x28 cada uno, pero como la Red Neuronal necesita valores de 1 dimensión, se pasan a vectores:

In [11]:
X_train_lista = X_train.reshape(len(X_train),28*28)
X_test_lista = X_test.reshape(len(X_test),28*28)

In [12]:
print(X_train_lista.shape)

(60000, 784)


In [13]:
print(X_test_lista.shape)

(10000, 784)


Ahora se puede generar una red neuronal con solamente una capa de salida de 10 nodos y la entrada de 784 nodos. Sería de la siguiente manera:

In [15]:
model = keras.Sequential([
    keras.layers.Input(shape=(784,)),
    keras.layers.Dense(10, activation='sigmoid')
])

En la celda anterior vemos como es la arquitectura de nuestra Red Neuronal:  

- La capa **Input** indica cuántas entradas tiene la red neuronal. 
- **Dense** nos indica que los nodos están todos conectados (es una red “densa”) y la función de activación es *sigmoide*
- El siguiente paso es establecer los parámetros de la red y entrenarla.
    - El primero de estos argumentos es la *función de pérdida* (loss) que usaremos para evaluar el grado de error entre las salidas calculadas y las salidas deseadas de los datos de entrenamiento.
    - Por otro lado, especificamos un *optimizador* que es la forma en que tenemos que especificar el algoritmo de optimización que permite a la red neuronal en Keras calcular el peso de los parámetros de los datos de entrada y la función de pérdida definida.
- Y finalmente debemos indicar la métrica que usaremos para monitorear el proceso de aprendizaje (y prueba) de nuestra red neuronal.
  
En este ejemplo solo consideraremos la precisión (fracción de imágenes que están clasificadas correctamente).

Pasamos a compilar el modelo:

In [16]:
model.compile(
    optimizer='adam',
    loss='sparse_categorical_crossentropy',
    metrics=['accuracy']
)

Una vez que nuestro modelo ha sido definido y el método de aprendizaje configurado, está listo para ser entrenado.  
Para esto podemos entrenar o “ajustar” el modelo a los datos de entrenamiento disponibles invocando el método **fit()** del modelo

In [17]:
model.fit(X_train_lista,y_train,epochs=5)

Epoch 1/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 936us/step - accuracy: 0.7735 - loss: 17.2823
Epoch 2/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 950us/step - accuracy: 0.8821 - loss: 5.9188
Epoch 3/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 961us/step - accuracy: 0.8806 - loss: 5.7135
Epoch 4/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 953us/step - accuracy: 0.8827 - loss: 5.5689
Epoch 5/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 938us/step - accuracy: 0.8901 - loss: 5.1051


<keras.src.callbacks.history.History at 0x261a6e9dad0>

Con *epochs* indicamos el número de veces que utilizaremos todos los datos en el proceso de entrenamiento/aprendizaje.

### Evaluación del modelo
En este punto, la red neuronal en Keras se ha entrenado y su comportamiento con los nuevos datos de prueba ahora se puede evaluar utilizando el método de *evaluate()*.  
Este método devuelve dos valores:

In [18]:
test_loss, test_acc = model.evaluate(X_test_lista, y_test)

[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 856us/step - accuracy: 0.8816 - loss: 6.0157


Estos valores indican qué tan bien o mal se comporta nuestro modelo con los nuevos datos que nunca ha visto.  
Estos datos han sido almacenados en *X_test_lista* y *y_test* cuando hemos realizado *mnist.load_data()* y los pasamos al método como argumentos.  
La salida del evaluate nos indica la *pérdida(loss)* y la *exactitud(accuracy)*.  

Aplicado a datos que el modelo nunca había visto antes, clasifica el 88% de ellos correctamente.

### Mejora del modelo

El modelo de red neuronal se puede mejorar añadiendo una capa intermedia de neuronas, de esta manera:

In [20]:
model = keras.Sequential([
    keras.layers.Input(shape=(784,)),
    keras.layers.Dense(100, activation='relu'),
    keras.layers.Dense(10, activation='sigmoid')
])

In [21]:
model.compile(
    optimizer='adam',
    loss='sparse_categorical_crossentropy',
    metrics=['accuracy']
)

In [22]:
model.fit(X_train_lista, y_train, epochs=5)

Epoch 1/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 2ms/step - accuracy: 0.7580 - loss: 6.8936
Epoch 2/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 2ms/step - accuracy: 0.8818 - loss: 0.4865
Epoch 3/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 2ms/step - accuracy: 0.9197 - loss: 0.3132
Epoch 4/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 2ms/step - accuracy: 0.9298 - loss: 0.2751
Epoch 5/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 2ms/step - accuracy: 0.9408 - loss: 0.2242


<keras.src.callbacks.history.History at 0x261af921f50>

In [23]:
model.evaluate(X_test_lista, y_test)

[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step - accuracy: 0.9292 - loss: 0.3009


[0.25829678773880005, 0.9381999969482422]

Vemos como, efectivamente, añadiendo una nueva hidden layer obtenemos una mejora de casi 4 puntos en el accuracy.