<a href="https://colab.research.google.com/github/orlandxrf/curso-dl/blob/main/notebooks/6a_OperacionConvolucion.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Operación de convolución 1D
$(w * x)(i) = \sum{_{a=0}} w_{a} \cdot x_{(i+a)}$<br>
<br>



## Convolución en 1D
Para aplicar convolución 1D en una señal de entrada 2d, podemos hacer lo siguiente. Primero, definimos nuestro tensor de entrada del tamaño [1, 1, 7] donde `batch_size=1`, `input_channels=1` y `signal_length=7`.<br>
<br>
Dada la entrada $x = [0,1,2,3,4,5,6]$ y los pesos (kernel) $w = [1, 2]$ calcular la salida

## Tamaño de la matriz resultante al aplicar la convolución
$o = \left( \frac{i + 2 \cdot p - k}{s} \right) + 1$<br>
<br>
$o = $ es el tamaño de la matriz resultante de la operación convolución<br>
$i = $ el tamaño de la entrada <br>
$p = $ se refiere al relleno (padding) `default=0`<br>
$k = $ el tamaño del kernel<br>
$s = $ (stride) número de pixeles por los que se mueve la ventana `default=1`<br>
<br>
De los valores dados arriba, tenemos:<br>
<br>
$o = \left( \frac{7 + 2 \cdot 0 - 2}{1} \right) + 1 = \frac{5}{1} + 1 = 6$<br>





In [None]:
import torch
from torch import nn
import torch.nn.functional as F 

x = torch.tensor([0, 1, 2, 3, 4, 5, 6], dtype=torch.float)
w = torch.tensor([1, 2], dtype=torch.float)

print (f"x.shape:\t{x.shape}")
x = x.unsqueeze(0)
print (f"x.shape:\t{x.shape}")
x = x.unsqueeze(0)
print (f"x.shape:\t{x.shape}")

print (f"w.shape:\t{w.shape}")
w = w.unsqueeze(0).unsqueeze(0)
print (f"w.shape:\t{w.shape}")

o = F.conv1d(x, w)
print (f"\no.shape:\t {o.shape}")
print (f"out:\t {o.squeeze(0).squeeze(0)}")


output = ((7 + (2*0) - 2)/1) + 1
print (f"Output = {output}")


x.shape:	torch.Size([7])
x.shape:	torch.Size([1, 7])
x.shape:	torch.Size([1, 1, 7])
w.shape:	torch.Size([2])
w.shape:	torch.Size([1, 1, 2])

o.shape:	 torch.Size([1, 1, 6])
out:	 tensor([ 2.,  5.,  8., 11., 14., 17.])
Output = 6.0


## Convolución en 2D
$(w * x)(i,j) = \sum{_{a=0}} \sum{_{b=0}} w_{a,b} \cdot x_{(i+a),(j+b)}$<br>
<br>
Para aplicar convolución 2D en una señal de entrada 2D (por ejemplo, imágenes), podemos hacer lo siguiente. Primero, definimos nuestro tensor de entrada del tamaño $[1, 1, 3, 3]$ donde `batch_size=1`, `input_channels=1`, `input_height=3`, e `input_width=3`.<br>
<br>
Dada la entrada $x = [[0,1,2],[3,4,5],[6,7,8]]$ y los pesos (kernel) $w = [[0,1],[2,3]]$ calcular la operación de convolución de salida. 

## Tamaño de la matriz resultante al aplicar la convolución 2D
Dada la anterior ecuación:<br>
<br>
$o = \left( \frac{i + 2 \cdot p - k}{s} \right) + 1$<br>
<br>
$o = $ es el tamaño de la matriz resultante de la operación convolución<br>
$i = $ el tamaño de la entrada <br>
$p = $ se refiere al relleno (padding) `default=0`<br>
$k = $ el tamaño del kernel<br>
$s = $ (stride) número de pixeles por los que se mueve la ventana `default=1`<br>
<br>
$o_{height} = \left( \frac{3 + 2 \cdot 0 - 2}{1} \right) + 1 = 2$<br>
<br>
$o_{width} = \left( \frac{3 + 2 \cdot 0 - 2}{1} \right) + 1 = 2$<br>
<br>
Resultado ($o_{height}$ x $o_{width}$) = ($2$ x $2$)






In [None]:
import torch
from torch import nn
import torch.nn.functional as F 

x = torch.tensor([
  [0,1,2],
  [3,4,5],
  [6,7,8]
], dtype=torch.float)

w = torch.tensor([
  [0,1],
  [2,3]
], dtype=torch.float)

print (f"x.shape:\t {x.shape}")
print (f"w.shape:\t {w.shape}")

# (in_channels, out_channels, kernel_size, stride=1, padding=0)
x = x.unsqueeze(0).unsqueeze(0)
w = w.unsqueeze(0).unsqueeze(0)

print (f"x.shape:\t {x.shape}")
print (f"w.shape:\t {w.shape}")

o = F.conv2d(x, w)
print (f"\no.shape:\t {o.shape}")
print (f"\nout:\t {o.squeeze(0).squeeze(0)}")


x.shape:	 torch.Size([3, 3])
w.shape:	 torch.Size([2, 2])
x.shape:	 torch.Size([1, 1, 3, 3])
w.shape:	 torch.Size([1, 1, 2, 2])

o.shape:	 torch.Size([1, 1, 2, 2])

out:	 tensor([[19., 25.],
        [37., 43.]])
