# Uso de una red neuronal convolucional para transformar imágenes

**Nombre completo del alumno/a**

Este cuaderno utiliza el dataset CIFAR-10 y aplica ruido en forma de puntos aleatorios de colores a las imágenes. Entrenaremos un autoencoder para restaurarlas.

Las secuencias XXXXXXXXX se deben rellenar con el código apropiado.

## Importación de librerías

In [2]:
import numpy as np
import matplotlib.pyplot as plt

import tensorflow as tf
from tensorflow.keras import Sequential
from keras.layers import Conv2D, MaxPooling2D, UpSampling2D, Input

from keras.datasets import cifar10

## Carga y preparación de Datos
Cargamos el dataset CIFAR-10 y añadimos ruido en forma de puntos aleatorios.

In [4]:
# Carga el dataset CIFAR-10
# No es necesario cargar las etiquetas porque vamos a hacer una transformación
(x_train, _), (x_test, _) = cifar10.load_data()

Downloading data from https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz
[1m170498071/170498071[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m73s[0m 0us/step


In [6]:
# Normaliza los valores de las imágenes al rango [0, 1]
x_train = x_train / 1024
x_test = x_test / 1024

In [None]:
# Función que genera ruido en forma de puntos aleatorios a un array de imágenes
def add_random_noise(images, num_points):
    noisy_images = images.copy()
    for img in noisy_images:
        height, width, _ = img.shape
        for _ in range(num_points):
            # Coordenada x
            x = np.random.randint(width)
            # Coordenada y
            y = np.random.randint(height)
            # Color aleatorio (RGB)
            img[x, y] = np.random.randint(0, 256, 3)
    return noisy_images

In [None]:
# Aplica el ruido a los datos (por ej. 300 puntos)
x_train_noisy = add_random_noise(x_train, 300)
x_test_noisy = add_random_noise(x_test, 300)

In [None]:
# Muestra algunas imágenes originales y con ruido
n = 5  # Número de imágenes a mostrar
plt.figure(figsize=(10, 4))
for i in range(n):
    # Imagen original
    plt.subplot(XXXXXXXXX)
    XXXXXXXXX
    XXXXXXXXX
    XXXXXXXXX

    # Imagen con ruido
    plt.subplot(XXXXXXXXX)
    XXXXXXXXX
    XXXXXXXXX
    XXXXXXXXX

plt.tight_layout()
plt.show()


## Construcción del Autoencoder
Definimos una arquitectura básica de autoencoder para procesar las imágenes.

In [None]:

# Construcción del modelo autoencoder
model = Sequential([
    # Especifica la entrada ajustada para CIFAR-10
    # Son imágenes de 32x32 con 3 canales de color
    XXXXXXXXX,

    # Se aplica el parámetro padding='same' en todas las capas

    # En las capas de convolución, padding='same' hace que
    # se mantenga la resolución.

    # En las capas de max pooling, se reducen de forma explícita las
    # dimensiones de la imagen, aquí padding='same' rellena con ceros los
    # bordes cuando la ventana de pooling no encaja perfectamente en la imagen.

    # Encoder #####################################################

    # Capa de convolución 2D con 32 filtros de convolución de 3x3 y
    # ReLU como función de activación
    XXXXXXXXX,

    # Capa de max pooling con ventana de 2x2
    XXXXXXXXX,

    # Capa de convolución 2D con 32 filtros de convolución de 3x3 y
    # ReLU como función de activación
    XXXXXXXXX,

    # Capa de max pooling con ventana de 2x2
    XXXXXXXXX,

    # Decoder ######################################################

    # Capa de convolución 2D con 32 filtros de convolución de 3x3 y
    # ReLU como función de activación
    XXXXXXXXX,

    # Aumento de resolución (up sampling 2D) para compensar el max pooling
    # con una ventana de 2x2.
    XXXXXXXXX,

    # Capa de convolución 2D con 32 filtros de convolución de 3x3 y
    # ReLU como función de activación
    XXXXXXXXX,

    # Aumento de resolución (up sampling 2D) para compensar el max pooling
    # con una ventana de 2x2.
    XXXXXXXXX,

    # Salida restaurada con 3 canales
    # Capa de convolución 2D con 3 filtros de convolución de 3x3 y
    # sigmoid como función de activación
    XXXXXXXXX,
])

# Compila el modelo con el optimizador adam y la función de pérdida mse
XXXXXXXXX


In [None]:
# Muestra el resumen del modelo
XXXXXXXXX

## Entrenamiento del modelo

Entrenamos el modelo con las imágenes con ruido como entrada y las originales como objetivo.

In [None]:
# Entrenamiento del autoencoder
# Se entrena el modelo en 10 iteraciones, con un batch size de 128,
# con la mezcla (shuffle) activada y especificando los datos de validación.
XXXXXXXXX

## Evaluación y visualización de resultados

Usamos el modelo entrenado para restaurar las imágenes con ruido y comparar los resultados.

In [None]:
# Usa el modelo para limpiar imágenes con ruido del conjunto de pruebas
decoded_images = XXXXXXXXX

# Muestra algunas imágenes originales, con ruido y restauradas
n = 5  # Número de imágenes a mostrar
plt.figure(figsize=(15, 6))
for i in range(n):
    # Imagen original
    plt.subplot(3, n, i + 1)
    XXXXXXXXX
    XXXXXXXXX
    XXXXXXXXX

    # Imagen con ruido
    plt.subplot(3, n, i + 1 + n)
    XXXXXXXXX
    XXXXXXXXX
    XXXXXXXXX

    # Imagen restaurada
    plt.subplot(3, n, i + 1 + 2 * n)
    XXXXXXXXX
    XXXXXXXXX
    XXXXXXXXX

plt.tight_layout()
plt.show()


## Eliminación de ruido de una imagen externa

Cargamos una imagen externa al dataset que tiene ruido para comprobar cómo funciona nuestro autoencoder.

In [None]:
# Importa las funciones load_img (carga una imagen) y img_to_array (convierte una imagen en un array)
XXXXXXXXX

In [None]:
# Pide la ruta de la imagen al usuario
image_path = XXXXXXXXX

In [None]:
# Ajusta la imagen al tamaño esperado por el modelo
image = XXXXXXXXX

In [None]:
# Normaliza al rango [0, 1]
image_array = XXXXXXXXX

In [None]:
# Expande en una dimensión para indicar el batch size
# Se indica la imagen cuyas dimensiones se van a expandir y el eje (axis=0)
# Si antes, la imagen tenía las dimensiones (32, 32, 3), después de expandir
# las dimensiones, debería tener (1, 32, 32, 3) porque se va a procesar una
# sola imagen.
image_array = np.XXXXXXXXX

In [None]:
# Pasa la imagen por el modelo para que le quite el ruido
restored_image = XXXXXXXXX

In [None]:
# Muestra las imágenes con ruido y restaurada
plt.figure(figsize=(8, 4))

# Imagen con ruido
plt.subplot(XXXXXXXXX)
XXXXXXXXX
XXXXXXXXX
XXXXXXXXX

# Imagen restaurada
plt.subplot(XXXXXXXXX)
XXXXXXXXX
XXXXXXXXX
XXXXXXXXX

plt.tight_layout()
plt.show()

## Conclusiones

En este ejemplo, hemos utilizado el dataset CIFAR-10 para entrenar un autoencoder que elimina ruido de imágenes en forma de puntos aleatorios. Puedes experimentar con diferentes arquitecturas, niveles de ruido y datasets para mejorar los resultados.