<a href="https://colab.research.google.com/github/SerArtDev/redes-neuronales/blob/main/redes_neuronales_otras_redes.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Otros Tipos de Redes

Además de las redes de regresión y clasificación, existen otras más optimas para otros casos.



## Red Neuronal Convolucional (CNN)
Esta está especializada en reconocimiento de imágenes para clasificarlas o detectar objetos. La clasificación de imágenes se puede mediante una red neuronal de clasificación, pero es menos óptima que la covolucional, ya que esta última aplica procesado previo a pasar por la red a las imágenes. Estos preprocesados tienen como objetivo resaltar características de la imagen, resaltar bordes, hacer más claros los objetos de interés y reducir los parámetros de entrada a la red, reduciendo así la probabilidad de overfitting.

Una arquitectura típica para un modelos de CNN es el siguiente:

Imagen -> Capa de convolución > Capa de agrupamiento > Capa de convolución > Capa de agrupamiento > Red Neuronal secuencial densa > Capa de salida

Mientras que en una red neuronal de clasificación tradicional la imagen se convierte en un vector de n x 1, donde n es la cantidad de pixeles, el cual es pasado a la capa de entrada, en una red convolucional se pasa a la capa de entrada una matriz de la forma n x m x 3, donde n y m son los las lados de las imágenes y 3 es por cada capa de color (RGB).

La convolución consiste en aplicar un producto punto entre cada una de las capas RGB de la imagen y una matriz filtro (o kernel). Este filtro es el que permite realzar cosas como los bordes de elementos, realzar colores, etc. De esta forma, la red detecta de mejor forma estas características de la imagen. Adicional a esto, en la red convolucional también se aplica una función de activación a cada pixel. Típicamente se usa la función ReLU.

La capa de agrupamiento se encarga en reducir la cantidad de datos que serán propagados por la red sin perder las características importantes de la imagen. Existen dos formas principales de lograr esto: max pooling y average pooling.
El primero consiste en tomar grupos de pixeles de ixj dimensiones, tomar el valor más alto de estos y representarlos en un solo pixel, descartando a los otros. Average pooling consiste en sacar el valor promedio de este grupo de pixeles y representarlo también en un solo pixel. De estas dos formas, si, por ejemplo, tenemos una imagen de 16x16 y tomamos grupos de 2x2, obtendremos una imagen de 8x8 pixeles, reduciendo significativamente la cantidad de datos que entrará a la red.


In [2]:
import keras
from keras.models import Sequential
from keras.layers import Dense, Flatten
from keras.layers import Conv2D, MaxPooling2D
from keras.utils import to_categorical
# Vamos a usar un set de datos con imágenes de distintos números para ser categorizados
from keras.datasets import mnist

In [4]:
# Estos datos cuentan con un set de entrenamiento y otro de verificación
(X_train, y_train), (X_test, y_test) = mnist.load_data()

# Cambiamos la forma de los datos
X_train = X_train.reshape(X_train.shape[0], 28, 28, 1).astype('float32')
X_test = X_test.reshape(X_test.shape[0], 28, 28, 1).astype('float32')

# Normalizamos los datos para que los pixeles tengan valores de 0 a 1.
X_train /= 255
X_test /= 255

In [5]:
# La variable de salida está categorizada de 0 a 9, pero esto debe ser
# convertido para trabajar en una red neuronal
y_train = to_categorical(y_train, 10)
y_test = to_categorical(y_test, 10)
# Se obtienen la cantidad de clases
num_classes = y_test.shape[1]

In [7]:
# Creamos el modelo de red convolucional
model = Sequential()
# Se crea la capa convolucional de 16 filtros, cada uno de 5x5.
model.add(Conv2D(32, (5, 5), input_shape=(28, 28, 1), activation='relu'))
# Se crea la capa de agrupamiento
model.add(MaxPooling2D(pool_size=(2, 2)))
# Se crea una capa que vuelva la imagen en un vector unidimensional para ser
# pasado a red
model.add(Flatten())
# Se crea una capa oculta de 100 neuronas
model.add(Dense(100, activation='relu'))
# Se crea la capa de salida con las 10 neuronas correspondientes a las
# categorías, con función de activación softmax
model.add(Dense(num_classes, activation='softmax'))
# Se compila el modelo
model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
# Se entrena al modelo
model.fit(X_train, y_train, validation_data=(X_test, y_test), epochs=10, batch_size=200)

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


Epoch 1/10
[1m300/300[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m32s[0m 99ms/step - accuracy: 0.8590 - loss: 0.5105 - val_accuracy: 0.9772 - val_loss: 0.0740
Epoch 2/10
[1m300/300[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m40s[0m 97ms/step - accuracy: 0.9786 - loss: 0.0753 - val_accuracy: 0.9838 - val_loss: 0.0516
Epoch 3/10
[1m300/300[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m29s[0m 97ms/step - accuracy: 0.9859 - loss: 0.0485 - val_accuracy: 0.9857 - val_loss: 0.0434
Epoch 4/10
[1m300/300[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m41s[0m 97ms/step - accuracy: 0.9884 - loss: 0.0373 - val_accuracy: 0.9863 - val_loss: 0.0433
Epoch 5/10
[1m300/300[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m42s[0m 102ms/step - accuracy: 0.9909 - loss: 0.0304 - val_accuracy: 0.9858 - val_loss: 0.0457
Epoch 6/10
[1m300/300[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m29s[0m 97ms/step - accuracy: 0.9941 - loss: 0.0207 - val_accuracy: 0.9871 - val_loss: 0.0411
Epoch 7/10
[1m

<keras.src.callbacks.history.History at 0x79877691eb00>

In [8]:
# Evaluamos el modelo
scores = model.evaluate(X_test, y_test, verbose=0)
print("Error: %.2f%%" % (100-scores[1]*100))

Error: 1.20%


## Redes Neuronales Recurrentes (RNN)
Este tipo de redes toma la salida de una red junto a un peso como un dato de entrada para una segunda red, de tal forma que esta segunda red tiene su dato de entrada normal y, adicional, el dato de salida de la primer red. Así, la salida de la segunda red está influenciada por la primera. Esto es útil para aplicaciones donde el contexto es importante, por ejemplo, una escena de una video, en donde un fotograma tiene sentido respecto a los anteriores. Este tipo de redes son muy útiles modelando secuencias y patrones de datos, como textos, genomas, escritura a mano y mercados financieros. Un tipo de RNN muy popular es la llamada Long Short-term memory model (LSTM), que se usa para aplicaciones como:

 - Generación de imágenes
 - Escritura a mano
 - Reconocimiento de palabras en imágenes
 - Descripción automática de videos

## Autoencoders
Estos son capaces de comprimir datos sin que les especifique cómo hacerlo. Estos son entrenados de forma no supervisada encontrando patrones utilizados para comprimir la información. Estos algoritmos son buenos comprimiendo únicamente información para la cual fueron entrenados, por lo tanto, uno que haya sido entrenado para comprimir imagenes de carros difícilmente podrá comprimir de forma correcta una imagen de una moto. Existen también los decoders, los cuales pueden tomar esta información comprimida y devolverla a su forma original.

Un tipo popular de encoder es el Restricted Boltzmann Machines (RBMs). Este se utiliza para estimar datos faltantes de un conjunto de datos, balancear un conjunto de datos, y detectar características importante de un conjunto de datos.