# Introducción

En este notebook se implementará el modelo EDSR para hacer upscaling

In [1]:
import os
import numpy as np
from PIL import Image
from PIL import ImageFilter

import cv2
import matplotlib.pyplot as plt

import tensorflow as tf

import random
import pathlib
from IPython import display

import pandas as pd

import time
import glob

# Preparacion del Dataset

In [2]:
tf.config.list_physical_devices()

[PhysicalDevice(name='/physical_device:CPU:0', device_type='CPU'),
 PhysicalDevice(name='/physical_device:GPU:0', device_type='GPU')]

In [3]:
print("Num GPUs Available: ", len(tf.config.experimental.list_physical_devices('GPU')))

Num GPUs Available:  1


In [4]:
input_path = "./Cat/"

In [21]:
import cv2
import os

# Función para dividir la imagen en parches de tamaño especificado
def extract_patches(image, patch_size):
    patches = []
    height, width = image.shape[:2]
    for y in range(0, height - patch_size + 1, patch_size):
        for x in range(0, width - patch_size + 1, patch_size):
            patch = image[y:y+patch_size, x:x+patch_size]
            patches.append(patch)
    return patches

# Ruta de la carpeta que contiene las imágenes de alta resolución
input_folder = "./Cat"
# Ruta de la carpeta donde se guardarán los parches de entrada
input_patch_folder = "./Cat_LR"
# Ruta de la carpeta donde se guardarán los parches de salida
output_patch_folder = "./Cat_HR"
# Tamaño de los parches de entrada y salida
input_patch_size = 48
output_patch_size = 96

# Iterar sobre todas las imágenes en la carpeta de entrada
for filename in os.listdir(input_folder):
    if filename.endswith(".jpg") or filename.endswith(".png"):
        # Leer la imagen
        image = cv2.imread(os.path.join(input_folder, filename))
                # Verificar que la imagen no esté vacía
        if image is None:
            print(f"Error: No se puede leer la imagen {filename}")
            continue
        
        # Reducir la imagen a la mitad de su tamaño original
        small_image = cv2.resize(image, (0, 0), fx=0.5, fy=0.5)
        
        # Dividir la imagen reducida en parches de entrada
        input_patches = extract_patches(small_image, input_patch_size)
        
        # Dividir la imagen original en parches de salida
        output_patches = extract_patches(image, output_patch_size)
        
        # Guardar los parches de entrada y salida
        for i, (input_patch, output_patch) in enumerate(zip(input_patches, output_patches)):
            cv2.imwrite(os.path.join(input_patch_folder, f"{filename}_{i}.png"), input_patch)
            cv2.imwrite(os.path.join(output_patch_folder, f"{filename}_{i}.png"), output_patch)


Error: No se puede leer la imagen 10125.jpg
Error: No se puede leer la imagen 10501.jpg
Error: No se puede leer la imagen 10820.jpg
Error: No se puede leer la imagen 11210.jpg
Error: No se puede leer la imagen 11565.jpg
Error: No se puede leer la imagen 11874.jpg
Error: No se puede leer la imagen 11935.jpg
Error: No se puede leer la imagen 140.jpg
Error: No se puede leer la imagen 2663.jpg
Error: No se puede leer la imagen 3300.jpg
Error: No se puede leer la imagen 3491.jpg
Error: No se puede leer la imagen 4833.jpg
Error: No se puede leer la imagen 5553.jpg
Error: No se puede leer la imagen 660.jpg
Error: No se puede leer la imagen 7968.jpg
Error: No se puede leer la imagen 7978.jpg
Error: No se puede leer la imagen 8470.jpg
Error: No se puede leer la imagen 850.jpg
Error: No se puede leer la imagen 9171.jpg
Error: No se puede leer la imagen 936.jpg
Error: No se puede leer la imagen 9565.jpg
Error: No se puede leer la imagen 9778.jpg


In [34]:
train_input_dir =  './Cat_LR'
train_target_dir =  './Cat_HR'

In [35]:
def load_image(file_path):
    img = tf.io.read_file(file_path)
    img = tf.image.decode_jpeg(img)
    img = tf.cast(img, tf.float32)
    img = (tf.cast(img, tf.float32) / 255)
    return img

In [36]:
def preprocess_image(file_path_input, file_path_target):
    input_img = load_image(file_path_input)
    target_img = load_image(file_path_target)
    return input_img, target_img

In [37]:
BATCH_SIZE = 1000

In [38]:
train_input_dataset = tf.data.Dataset.list_files(str(train_input_dir), shuffle=False)
train_target_dataset = tf.data.Dataset.list_files(str(train_target_dir), shuffle=False)
train_dataset = tf.data.Dataset.zip((train_input_dataset, train_target_dataset))
train_dataset = train_dataset.map(preprocess_image, num_parallel_calls=tf.data.AUTOTUNE)
train_dataset = train_dataset.batch(BATCH_SIZE)

In [39]:
train_input_dataset.

<TensorSliceDataset element_spec=TensorSpec(shape=(), dtype=tf.string, name=None)>

# Creacion del modelo

El modelo EDSR se entrena por parches NxN en este caso en el paper se entreno 48x48.

<img src="EDSR_structure.png">

In [27]:
class EDSR(tf.keras.models.Model):
    
    def __init__(self,B,F):
        super(EDSR, self).__init__()
        self.B = B #Numero de resblocks
        self.F = F #Numero de Filtros

        #Primeras capas
        xinput = tf.keras.layers.Input(shape=(48,48,3))
        xlast = tf.keras.layers.Conv2D(filters=self.F,kernel_size=3,strides=1,padding='SAME')(xinput)

        x = self.res_block(xlast)
        
        #B ResBlock´s
        for i in range(self.B - 1):
            x = self.res_block(x)

        x = tf.keras.layers.Conv2D(filters=self.F,kernel_size=3,strides=1,padding='SAME')(x)

        x = x + xlast

        #Upsample
        x = tf.keras.layers.Conv2D(filters=self.F,kernel_size=3,strides=1,padding='SAME')(x)
        x = tf.nn.depth_to_space(x,block_size=2)

        out = tf.keras.layers.Conv2D(filters=3,kernel_size=3,strides=1,padding='SAME')(x)

        self.model = tf.keras.models.Model(xinput,out)

    def res_block(self,x):
        
        x1 = tf.keras.layers.Conv2D(filters=self.F,kernel_size=3,strides=1,padding='SAME',activation="relu")(x)
        x2 = tf.keras.layers.Conv2D(filters=self.F,kernel_size=3,strides=1,padding='SAME')(x1)

        output = x2 + x
        return output
    
        
    def call(self, inputs):
        return self.model(inputs)

In [28]:
B = 32
F = 256

In [29]:
model = EDSR(B,F)

In [30]:
model.model.summary()

Model: "model_1"
__________________________________________________________________________________________________
 Layer (type)                   Output Shape         Param #     Connected to                     
 input_2 (InputLayer)           [(None, 48, 48, 3)]  0           []                               
                                                                                                  
 conv2d_68 (Conv2D)             (None, 48, 48, 256)  7168        ['input_2[0][0]']                
                                                                                                  
 conv2d_69 (Conv2D)             (None, 48, 48, 256)  590080      ['conv2d_68[0][0]']              
                                                                                                  
 conv2d_70 (Conv2D)             (None, 48, 48, 256)  590080      ['conv2d_69[0][0]']              
                                                                                            

In [32]:
lr = 0.001  
optimizer = tf.keras.optimizers.Adam(learning_rate=lr)

model.compile(loss='mean_absolute_error', optimizer=optimizer)

In [33]:
history = model.fit(train_input_dataset,epochs=40)

Epoch 1/40


ValueError: in user code:

    File "C:\Users\Daniel Marin\anaconda3\envs\tf\lib\site-packages\keras\engine\training.py", line 1160, in train_function  *
        return step_function(self, iterator)
    File "C:\Users\Daniel Marin\anaconda3\envs\tf\lib\site-packages\keras\engine\training.py", line 1146, in step_function  **
        outputs = model.distribute_strategy.run(run_step, args=(data,))
    File "C:\Users\Daniel Marin\anaconda3\envs\tf\lib\site-packages\keras\engine\training.py", line 1135, in run_step  **
        outputs = model.train_step(data)
    File "C:\Users\Daniel Marin\anaconda3\envs\tf\lib\site-packages\keras\engine\training.py", line 993, in train_step
        y_pred = self(x, training=True)
    File "C:\Users\Daniel Marin\anaconda3\envs\tf\lib\site-packages\keras\utils\traceback_utils.py", line 70, in error_handler
        raise e.with_traceback(filtered_tb) from None
    File "C:\Users\DANIEL~1\AppData\Local\Temp\__autograph_generated_fileq5ry3dqz.py", line 12, in tf__call
        retval_ = ag__.converted_call(ag__.ld(self).model, (ag__.ld(inputs),), None, fscope)

    ValueError: Exception encountered when calling layer "edsr_1" "                 f"(type EDSR).
    
    in user code:
    
        File "C:\Users\Daniel Marin\AppData\Local\Temp\ipykernel_7648\2607297361.py", line 40, in call  *
            return self.model(inputs)
        File "C:\Users\Daniel Marin\anaconda3\envs\tf\lib\site-packages\keras\utils\traceback_utils.py", line 70, in error_handler  **
            raise e.with_traceback(filtered_tb) from None
        File "C:\Users\Daniel Marin\anaconda3\envs\tf\lib\site-packages\keras\engine\input_spec.py", line 250, in assert_input_compatibility
            raise ValueError(
    
        ValueError: Exception encountered when calling layer "model_1" "                 f"(type Functional).
        
        Input 0 of layer "conv2d_68" is incompatible with the layer: expected min_ndim=4, found ndim=0. Full shape received: ()
        
        Call arguments received by layer "model_1" "                 f"(type Functional):
          • inputs=tf.Tensor(shape=(), dtype=string)
          • training=True
          • mask=None
    
    
    Call arguments received by layer "edsr_1" "                 f"(type EDSR):
      • inputs=tf.Tensor(shape=(), dtype=string)


In [None]:
pd.DataFrame(history.history).plot()
plt.xlabel('Epoch num.')
plt.show()