<image src="https://raw.githubusercontent.com/ramiro999/pytorch-exploration/main/images/Banner%20Hands-on-ResNet.png" width=100%>

# <font color='#4C5FDA'> **ResNet: Redes neuronales residuales** </font>

ResNet, o Red Residual, es un tipo de red neuronal convolucional diseñada para facilitar el entrenamiento de redes muy profundas. Fue introducida por Kaiming He y otros en el trabajo <font color="EB9A54">"Deep Residual Learning for Image Recognition"</font> durante el ILSVRC de 2015, donde ganó el primer lugar en varias categorías.

<font color="EB9A54">**¿Por qué utilizar ResNet?**</font>

Facilita el entrenamiento de redes profundas: Uno de los principales desafíos en el entrenamiento de redes profundas es el problema de la desaparición/exploración de gradientes. ResNet aborda esto mediante el uso de conexiones residuales que permiten que los gradientes fluyan directamente a través de las capas sin pasar por transformaciones lineales, facilitando el entrenamiento de redes con cientos o incluso miles de capas.

- Reutilización de características: Las conexiones de salto (skip connections) permiten que la red ajuste la información y reutilice las características aprendidas anteriormente, lo cual es eficaz para la generalización.

- Flexibilidad y adaptabilidad: ResNet ha demostrado ser efectiva en una variedad de tareas de visión por computadora más allá de la clasificación de imágenes, como la detección de objetos y la segmentación semántica.

<font color="EB9A54">**Beneficios sobre otras redes neuronales**</font>

- Reducción del problema del desvanecimiento de gradientes: A diferencia de las redes convencionales donde el gradiente puede desvanecerse a medida que aumenta la profundidad, las conexiones residuales en ResNet permiten que el gradiente se propague eficazmente a través de muchas más capas.

- Mejor rendimiento con mayor profundidad: Mientras que en redes convencionales el rendimiento puede empezar a degradarse o saturarse a medida que la red se profundiza, ResNet puede escalar eficazmente a cientos de capas sin degradación del rendimiento.

- Eficiencia en entrenamiento y convergencia más rápida: Las conexiones residuales mejoran la eficiencia del entrenamiento permitiendo convergencias más rápidas con menores tasas de error.

- Versatilidad y robustez: ResNet ha establecido nuevos estándares en varios benchmarks y competiciones, demostrando su robustez y versatilidad en diferentes dominios de aplicación.

<image src="https://raw.githubusercontent.com/ramiro999/pytorch-exploration/main/images/resnet.png" >

In [None]:
#@title PyTorch stuff
import torch
torch.manual_seed(0)
from torch import optim, nn
from torch.nn import functional as F
from torchvision import transforms as T
from torchvision import models, datasets
from torch.utils.data import DataLoader, Dataset, random_split

## <font color='#4C5FDA'> **ResNet56** </font>

In [None]:
conv_k_3 = lambda channel1, channel2, stride: nn.Conv2d(channel1, channel2, stride = stride, kernel_size=3, padding=1)

In [None]:
class residual_block(nn.Module):

"""
    Implementa un bloque residual que contiene dos capas convolucionales con una conexión residual.
    SE puede modificar el tamaño de los mapas de activación a través de la opción `change_size`.

    Atributos:
        conv1 (nn.Module): Primera capa convolucional del bloque.
        bn1 (nn.Module): Primera capa de normalización por lotes.
        conv2 (nn.Module): Segunda capa convolucional del bloque.
        bn2 (nn.Module): Segunda capa de normalización por lotes.
        residual (nn.Module, opcional): Capa adicional para adaptar las dimensiones del tensor de entrada al tamaño deseado.
    """

def __init__(self, in_channel, out_channel, stride=1, change_size = True):
    super().__init__()
    self.conv1 = conv_k_3(in_channel, out_channel, stride)
    self.bn1 = nn.BatchNorm2d(out_channel)
    self.conv2 = conv_k_3(out_channel, out_channel, 1)
    self.bn2 = nn.BatchNorm2d(out_channel)

    # Condicional para adaptar la dimensión del tensor de entrada a la salida deseada
    if change_size:
      self.residual = nn.Sequential(nn.Conv2d(in_channel,
                                              out_channel,
                                              kernel__size=1,
                                              stide=stride,
                                    nn.BatchNorm2d(out_channel))
                                    )

def forward(self, x):
  identity = x if not self.change_size else self.residual(x)  # Calcula la identidad, que es x o una versión adaptada de x si se cambia el tamaño
  y = F.relu(self.bn1(self.conv1(x)))
  y = self.bn2(self.conv2(y))
  y += identity # Suma la identidad al resultado de las capas convolucionales
  return F.relu(y) # Aplica la activación ReLU antes de devolver el resultado

# <font color='#4C5FDA'> **Referencias** </font>

He, K., Zhang, X., Ren, S., & Sun, J. (2016). Deep Residual Learning for Image Recognition. Proceedings of the IEEE conference on computer vision and pattern recognition (CVPR).

https://arxiv.org/abs/1512.03385

---

Canziani, A., Paszke, A., & Culurciello, E. (2016). An Analysis of Deep Neural Network Models for Practical Applications.

https://arxiv.org/abs/1605.07678

---

Fundamentos de la implementación

https://github.com/JACantoral/DL_fundamentals/tree/main
