<a href="https://colab.research.google.com/github/LuisPeMoraRod/AI-Laboratories/blob/main/IA_Quiz_RedConvolucional.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Quiz Red Convulucional

*   Mauricio Calderon
*   Luis Pedro Morales



1. Investigue cómo es el proceso de visualización de los ojos humanos y haga analogías respecto a una red neuronal convolucional.

El proceso de visualización de los ojos humanos es bastante complejo, pero podemos separarlo en ciertas etapas de manera que podemos comparar dichas etapas y una red neuronal convolucional. Algunos de los aspectos que comparten o bien son bastantes similares entre si, son los siguientes.


*   Captación de información: Al igual que el ojo humano captura información visual del entorno, una red neuronal convolucional toma imágenes como entrada y las procesa capa por capa para extraer características relevantes.

* Extracción de características: En el ojo humano, la retina y las células fotorreceptoras realizan una primera etapa de procesamiento para convertir la luz en señales eléctricas. En una una red neuronal convolucional, las capas iniciales también están diseñadas para extraer características básicas, como bordes, texturas y colores.

* Jerarquía de características: Tanto en el ojo humano como en una una red neuronal convolucional, las características extraídas se organizan en una jerarquía. En el ojo, las células de la retina transmiten señales a través de las células de la retina y luego al nervio óptico. En una una red neuronal convolucional, las características se agrupan en capas más profundas, donde las capas posteriores combinan características más abstractas y complejas.

* Procesamiento localizado: En el ojo humano, diferentes partes de la retina son sensibles a diferentes regiones del campo visual. De manera similar, en una una red neuronal convolucional, las capas convolucionales utilizan filtros locales para detectar características en regiones específicas de la imagen.

* Transmisión de información: Al igual que las señales eléctricas se transmiten desde el ojo al cerebro, una una red neuronal convolucional transmite información a través de las capas hacia las capas finales, donde se toman decisiones o se realizan predicciones.




2. Investigue cuál es la fórmula de la convolución y muestre un ejemplo paso a paso del cálculo.

R/

La fórmula de la convolución en el contexto de una red neuronal convolucional  se puede expresar de la siguiente manera:

$y\left(i,j\right)=\sum _m​\:\sum _n\:x\left(i−m,j−n\right)⋅w\left(m,n\right)+b$

Donde:


*  $y\left(i,j\right)$ es el valor resultante en la posición $\left(i,j\right)$ de la capa de salida.
*  $x\left(i−m,j−n\right)$ es el valor en la posición $\left(i−m,j−n\right)$ de la capa de entrada.
*   $w(m,n)$ es el peso asociado a la conexión entre la entrada y la capa de salida.
*   $b$ es el sesgo (bias) que se agrega al resultado final.



A continuación, se muestra un ejemplo paso a paso para ilustrar cómo se realiza el cálculo de la convolución.


Supongamos que tenemos una matriz de entrada de tamaño 3x3 y un filtro de convolución de tamaño 2x2:


Matriz de entrada: $\begin{pmatrix}1&2&3\\ 4&5&6\\ 7&8&9\end{pmatrix}$

Matriz filtro: $\begin{pmatrix}2&0\\ 1&2\end{pmatrix}$

Como primer paso vamos a colocar el filtro en la esquina superior izquierda de la matriz de entrada (matriz principal), de manera que luego padamos realizar las multiplicaciones y sumando los resultados de la siguiente manera.

Esquina superior izquierda de la matriz principal

$\begin{pmatrix}1&2\\ 4&5\end{pmatrix}$

Matriz filtro.

$\begin{pmatrix}2&0\\ 1&2\end{pmatrix}$

Realizando las operaciones 

$\left(1\cdot 2\right)\:+\:\left(2\cdot 0\right)\:+\left(4\cdot 1\right)\:+\:\left(5\cdot 2\right)\:=\:14$

En este caso el resultado es 14, esto representa el resultado de la convolución para la posición superior izquierda de la capa de salida.

Lo que tenemos que hacer con las demás, es ir desplazando columna por columna el filtro y luego vamos también bajando fila por fila, de manera que vayamos obteniendo todos los resultados de la matriz de convolución, esta matriz es la que se conoce como la capa de salida.

En nuestro ejemplo la capa de salida completa sería

$\begin{pmatrix}14&20\\ 20&25\end{pmatrix}$

Como podemos ver esta matriz de capa de salida tiene las mismas dimensiones que la matriz de filtro, esto se debe a que las dimensiones de la capa de salida van a depender del tamaño de la matriz del filtro, asi como de aspectos externos como el stride y padding que en caso de tener alguno de estos dos, afectará también directamente en la matriz resultante.

3. Programe la convolución desde cero (no use librerías) para una matriz de cualquier tamaño inicializada con valores aleatorios entre 0 y 255 con los siguientes filtros también aleatorios entre -1, 0, 1.


*   Filtro de 2x2 con stride = 1
*   Filtro de 2x2 con stride = 2
*   Filtro de 3x3 con stride = 1
*   Filtro de 3x3 con stride = 2





In [3]:
import random

def convolution(input_matrix, filter_matrix, stride):
    input_rows, input_cols = len(input_matrix), len(input_matrix[0])
    filter_rows, filter_cols = len(filter_matrix), len(filter_matrix[0])
    
    # Calcular el tamaño de la matriz de salida
    output_rows = (input_rows - filter_rows) // stride + 1
    output_cols = (input_cols - filter_cols) // stride + 1
    
    # Inicializar la matriz de salida con ceros
    output_matrix = [[0] * output_cols for _ in range(output_rows)]
    
    # Recorrer la matriz de entrada y realizar la convolución
    for i in range(output_rows):
        for j in range(output_cols):
            # Calcular los índices de inicio y fin para la convolución
            start_i, start_j = i * stride, j * stride
            end_i, end_j = start_i + filter_rows, start_j + filter_cols
            
            # Realizar la convolución multiplicando los elementos y sumándolos
            conv_sum = 0
            for m in range(start_i, end_i):
                for n in range(start_j, end_j):
                    conv_sum += input_matrix[m][n] * filter_matrix[m-start_i][n-start_j]
            
            # Asignar el resultado de la convolución a la posición correspondiente en la matriz de salida
            output_matrix[i][j] = conv_sum
    
    return output_matrix

def start_convolution(dim):

  # Generar una matriz de entrada aleatoria de tamaño dimxdim con valores entre 0 y 255
  input_matrix = [[random.randint(0, 255) for _ in range(dim)] for _ in range(dim)]

  # Generar filtros aleatorios de los tamaños y valores especificados
  filter_2x2_stride_1 = [[random.choice([-1, 0, 1]) for _ in range(2)] for _ in range(2)]
  filter_2x2_stride_2 = [[random.choice([-1, 0, 1]) for _ in range(2)] for _ in range(2)]
  filter_3x3_stride_1 = [[random.choice([-1, 0, 1]) for _ in range(3)] for _ in range(3)]
  filter_3x3_stride_2 = [[random.choice([-1, 0, 1]) for _ in range(3)] for _ in range(3)]

  # Realizar las convoluciones utilizando los filtros y strides especificados
  result_2x2_stride_1 = convolution(input_matrix, filter_2x2_stride_1, stride=1)
  result_2x2_stride_2 = convolution(input_matrix, filter_2x2_stride_2, stride=2)
  result_3x3_stride_1 = convolution(input_matrix, filter_3x3_stride_1, stride=1)
  result_3x3_stride_2 = convolution(input_matrix, filter_3x3_stride_2, stride=2)

  # Imprimir los resultados
  print("Resultado de la convolución con filtro 2x2 y stride 1:")
  for row in result_2x2_stride_1:
      print(row)

  print("\nResultado de la convolución con filtro 2x2 y stride 2:")
  for row in result_2x2_stride_2:
      print(row)

  print("\nResultado de la convolución con filtro 3x3 y stride 1:")
  for row in result_3x3_stride_1:
      print(row)

  print("\nResultado de la convolución con filtro 3x3 y stride 2:")
  for row in result_3x3_stride_2:
      print(row)
  return (result_2x2_stride_1, result_2x2_stride_2, result_3x3_stride_1, result_3x3_stride_2)


#Inicializando el la convolución

results = start_convolution(8)

Resultado de la convolución con filtro 2x2 y stride 1:
[-313, -109, -100, -252, -112, 91, -3]
[128, 45, 30, 195, 9, -99, 20]
[73, 106, 197, 52, 210, 59, -217]
[98, -104, -296, -103, 42, 13, 120]
[-234, 29, 271, 72, -37, 86, 100]
[-118, -13, -51, -81, -146, 32, -43]
[266, 26, -221, -74, 19, -199, -137]

Resultado de la convolución con filtro 2x2 y stride 2:
[-185, -291, -64, -282]
[-297, -200, 58, -247]
[-158, -79, -40, -235]
[-61, -103, -91, 63]

Resultado de la convolución con filtro 3x3 y stride 1:
[78, 710, 3, 400, 542, 244]
[574, -29, 424, 252, 346, 241]
[-174, 332, -188, 89, 242, 550]
[338, 97, 289, 276, 140, 605]
[287, 128, 35, -85, 332, 72]
[213, 140, 99, 200, 59, 460]

Resultado de la convolución con filtro 3x3 y stride 2:
[697, 215, 871]
[323, 247, 417]
[753, 151, 448]


4. A las salidas anteriores prográmeles el max pooling desde cero (no use librerías) y despliegue los resultados. 

In [5]:
def max_pooling(mat):
    rows = len(mat)
    cols = len(mat)
    i, j = 0, 0
    new_mat = []

    while i < rows:
        new_row = []
        j = 0
        while j < cols:
            segment = []
            segment.append(mat[i][j])
            segment.append(mat[i][j+1])
            segment.append(mat[i+1][j])
            segment.append(mat[i+1][j+1])
            new_row.append(max(segment))
            j += 2
        print(new_row)
        new_mat.append(new_row)
        i += 2
    return new_mat

result_2x2_stride_2 = results[1]
result_3x3_stride_1 = results[2]

print("\nMax pooling para el resultado de la convolución con filtro 2x2 y stride 2:")
max22_2 = max_pooling(result_2x2_stride_2)

print("\nMax pooling para el resultado de la convolución con filtro 3x3 y stride 1:")
max33_1 = max_pooling(result_3x3_stride_1)


Max pooling para el resultado de la convolución con filtro 2x2 y stride 2:
[-185, 58]
[-61, 63]

Max pooling para el resultado de la convolución con filtro 3x3 y stride 1:
[710, 424, 542]
[338, 289, 605]
[287, 200, 460]
