<a href="https://colab.research.google.com/github/santiagogiasone/COVID-PersonLimiter/blob/master/HPC%20(directorio)/Cuaderno_1_grupo17_2021.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

### **Introducción**




El siguiente ejemplo modifica el color de una imágen parametrizada, dando como resultado una nueva imagen con los colores diametralmente opuestos en el circulo cromatico). El cálculo de la Inversion de Color se realiza convirtiendo los 3 canales RGB, que representan a los colores R (rojo)-G(verde)-B(azul) de cada pixel, generando el complemento del valor de cada componente:
<center><br>$ Pixel= (255-R, 255-G, 255-B)$</center></br>

El objetivo del ejercicio es comparar y analizar la ejecucion en forma secuencial (usando solo CPU) y su version paralela (usando GPU).

---



### **Armado del ambiente**
Toma la direcciòn web de una imagen con acceso público en internet, la deja disponible al contexto de ejecuciòn del cuaderno colab.

Obtencion de imagen

In [None]:
### Parámetros de ejecución

#@markdown ### Especifique la URL de la imagen:
url_imagen = "https://columnacero.com/pic/25689/spider-man-un-nuevo-universo.jpg" #@param {type:"string"}
#link a imagen de prueba https://columnacero.com/pic/25689/spider-man-un-nuevo-universo.jpg
# Leo la imagen desde internet y la almaceno "localmente" como imagen.jpg
!wget {url_imagen} -O imagen.jpg

 Tener en cuenta que tambien es necesario instalar la libreria de la GPU como asi tambien verificar que este activo el entorno de ejecucion de GPU

In [None]:
!pip install pycuda



---



### **Desarrollo CPU**

In [None]:
 %matplotlib inline
from datetime import datetime

tiempo_total_cpu = datetime.now()

import  matplotlib.pyplot as plt
import numpy
from PIL import Image 
from PIL import UnidentifiedImageError


# --------------------------------------------
# Definición de función que transforma el tiempo en  milisegundos 
tiempo_en_ms = lambda dt:(dt.days * 24 * 60 * 60 + dt.seconds) * 1000 + dt.microseconds / 1000.0
# --------------------------------------------

try:
    img_cpu_nombre = 'imagen.jpg'
    image = Image.open( img_cpu_nombre ) 
      
    # Obtengo las proporsiones de la imagen. 
    img_ancho, img_alto = image.size 

    #Convierto la imagen a array.
    img_pic_cpu = numpy.asarray(image)
    img_pic_cpu = img_pic_cpu.astype(numpy.int32())

    # Genero el array resultado mismo tamaño que el de la imagen original
    img_picR_cpu = numpy.empty_like(img_pic_cpu)

    # Muestro los atributos de la imagen y como se ve antes del seudo filtro.
    print("Imagen: " + img_cpu_nombre + " -" + image.mode + "- [" + str(img_ancho) + ", " + str(img_alto) + "]" )  

    plt.figure()
    imgplot=plt.imshow(img_pic_cpu)

    tiempo_img = datetime.now()

    # Se realiza la inversion de color
    for y  in range( 0, img_alto ): #(int)(img_alto/2)
      for x in range( 0, img_ancho ):
        pixel_R, pixel_G, pixel_B = img_pic_cpu[y][x]
        img_picR_cpu[y][x] = [255-pixel_R, 255-pixel_G, 255-pixel_B]

    tiempo_img = datetime.now() - tiempo_img

    # Muestro la imagen luego de la inversion del color.
    plt.figure()
    imgplot = plt.imshow( img_picR_cpu )

    tiempo_total_cpu = datetime.now() - tiempo_total_cpu

    print( "Tiempo de conversión de imagen:", tiempo_en_ms( tiempo_img   ), "[ms]" )
    print( "Tiempo Total:",                   tiempo_en_ms( tiempo_total_cpu ), "[ms]" )

except FileNotFoundError:
    print("No se ha descargado ninguna imagen. Por favor, inserte una URL que contenga una imagen en la seccion -Armado de Ambiente-")
except UnidentifiedImageError:
    print("La URL proporcionada no es valida o no contiene una imagen")
except MemoryError:
    print("La imagen supera el maximo de memoria disponible en el entorno")
except KeyboardInterrupt:
    print("Se ha cancelado la ejecucion")
except:
    print("Error desconocido")



---




### **Desarrollo GPU**




In [None]:
%matplotlib inline
from datetime import datetime
tiempo_total_gpu = datetime.now()

import matplotlib.pyplot as plt
import numpy
from PIL import Image
from PIL import UnidentifiedImageError
try:
  import pycuda.driver as cuda
  import pycuda.autoinit
  from pycuda.compiler import SourceModule
except ModuleNotFoundError:
    print("No se han instalado las librerias necesarias ver seccion -Armado del ambiente-")
  

try:
  # --------------------------------------------
  # Definición de función que transforma el tiempo en  milisegundos 
  tiempo_en_ms = lambda dt:(dt.days * 24 * 60 * 60 + dt.seconds) * 1000 + dt.microseconds / 1000.0
  # --------------------------------------------

  img_gpu_nombre = 'imagen.jpg'
  image = Image.open( img_gpu_nombre ) 
    
  # Obtengo las proporciones de la imagen. 
  img_ancho, img_alto  = image.size 

  # Convierto la imagen comprimida en JPEG/PNG a array
  img_O_cpu = numpy.asarray(image)
  img_O_cpu = img_O_cpu.astype( numpy.int32() )
  img_R_cpu = numpy.empty_like( img_O_cpu)

  # Reservo los 2 vectores en GPU(3 pixeles usa RGB * (el tamaño del array))
  img_O_gpu = cuda.mem_alloc( img_O_cpu.nbytes )
  img_R_gpu = cuda.mem_alloc( img_R_cpu.nbytes )

  # GPU - Copio la memoria al GPU.
  cuda.memcpy_htod( img_O_gpu, img_O_cpu )
  cuda.memcpy_htod( img_R_gpu, img_R_cpu )

  # CPU - Defino la función kernel que ejecutará en GPU.
  module = SourceModule("""
  __global__ void kernel_img( int ancho, int alto, int *img_O, int *img_R )
  {
    // Calculo las coordenadas del Thread en dos dimensiones.
    int idx = threadIdx.x + blockIdx.x*blockDim.x;
    int idy = threadIdx.y + blockIdx.y*blockDim.y;
    int red=0;
    int green=0;
    int blue=0;

    // Verifico que los Thread, esten dentro de las dimensiones de la imagen.
    if( idx < ancho && idy < alto )
    {
      //calculo el valor de cada pixel
      red=255-(img_O[(idx+(idy*ancho))*3  ]);// Componente Rojo del pixel.
      green=255-(img_O[((idx+(idy*ancho))*3)+1]);// Componente Verde del pixel.
      blue=255-(img_O[((idx+(idy*ancho))*3)+2]);// Componente Azul del pixel.

      //escribo el color de cada pixel.
      img_R[(idx+(idy*ancho))*3  ] = red;
      img_R[((idx+(idy*ancho))*3)+1] = green;
      img_R[((idx+(idy*ancho))*3)+2] = blue;
    }
  }
  """) 

  # Muestro los atributos de la imagen y como se ve antes del filtro.
  print("Imagen: " + img_gpu_nombre + " -" + image.mode + "- [" + str(img_ancho) + ", " + str(img_alto ) + "]" )  

  # CPU - Genero la función kernel.
  kernel = module.get_function("kernel_img")

  tiempo_img = datetime.now()

  dim_hilo_x = 16
  dim_bloque_x = numpy.int( (img_ancho+dim_hilo_x-1) / dim_hilo_x )

  dim_hilo_y = 10
  dim_bloque_y = numpy.int( (img_alto+dim_hilo_y-1) / dim_hilo_y )

  print( "Thread: [", dim_hilo_x, ",", dim_hilo_y, " ], Bloque : [", dim_bloque_x, ",", dim_bloque_y, "]" )
  print( "Total de Thread: [", dim_hilo_x*dim_bloque_x, ",", dim_hilo_y*dim_bloque_y, " ]", " = ", dim_hilo_x*dim_bloque_x*dim_hilo_y*dim_bloque_y )

  tiempo_img = datetime.now()

  kernel( numpy.int32(img_ancho), numpy.int32(img_alto), img_O_gpu, img_R_gpu, block=(dim_hilo_x,dim_hilo_y, 1 ), grid=(dim_bloque_x, dim_bloque_y,1) ) 

  tiempo_img = datetime.now() - tiempo_img

  # GPU - Copio el resultado desde la memoria GPU.
  cuda.memcpy_dtoh( img_R_cpu, img_R_gpu )

  # Muestro la imagen Original el filtro.
  plt.figure()
  imgplot=plt.imshow( img_O_cpu )

  # Muestro la imagen luego de aplicarle el filtro.
  plt.figure()
  imgplot=plt.imshow( img_R_cpu )

  tiempo_total_gpu = datetime.now() - tiempo_total_gpu

  print("Tiempo GPU  : ", tiempo_en_ms( tiempo_img ), "[ms]" )
  print("Tiempo TOTAL: ", tiempo_en_ms( tiempo_total_gpu ), "[ms]" )

except FileNotFoundError:
    print("No se ha descargado ninguna imagen. Por favor, inserte una URL que contenga una imagen en la seccion -Armado de Ambiente-")
except UnidentifiedImageError:
    print("La URL proporcionada no es valida o no contiene una imagen")
except MemoryError:
    print("La imagen supera el maximo de memoria disponible en el entorno")
except KeyboardInterrupt:
    print("Se ha cancelado la ejecucion")
except:
    print("Error desconocido")

### **Metricas**




In [None]:
### **Metricas**
try:
  print("CPU=")
  print("Imagen: " + img_cpu_nombre + " -" + image.mode + "- [" + str(img_ancho) + ", " + str(img_alto) + "]" )  
  print( "Tiempo Total de CPU:",                   tiempo_en_ms( tiempo_total_cpu ), "[ms]" )
except AttributeError:
  print("Se debe ejecutar el Codigo que convierte la imagen mediante CPU para obtener alguna metrica") 

print("")
print("vs")
print("")

try: 
  print("GPU=")
  print("Imagen: " + img_gpu_nombre + " -" + image.mode + "- [" + str(img_ancho) + ", " + str(img_alto ) + "]" )  
  print( "Tiempo Total de GPU:",                   tiempo_en_ms( tiempo_total_gpu ), "[ms]" )
except AttributeError:
  print("Se debe ejecutar el Codigo que convierte la imagen mediante GPU para obtener alguna metrica") 

### Conclusiones
El tiempo de procesamiento de la imagen cuando se ejecuta el Algoritmo de forma paralela (es decir con la GPU) es considerablemente menor que si se realiza de forma secuencial (con la CPU). 
Para este tipo de proyectos, donde para una gran cantidad de datos se realiza el mismo calculo repetidamente, es muy recomendable resolverlo con GPU ya que se trata de tareas que pueden ser paralelizables.

### Bibliografia
[1] Algoritmo de inversion de color de imagen OpenCV. Anónimo. (s. f.) https://programmerclick.com/article/1612326767/

[2] Valiente Waldo: Prueba 2 - Imagen - CPU. (27/06/2021). GitHub. https://github.com/wvaliente/SOA_HPC/blob/main/Ejercicios/Prueba%202%20-%20Imagen%20-%20CPU.ipynb

[3] Valiente Waldo: Prueba 2 - Imagen - GPU. (27/06/2021). GitHub: https://github.com/wvaliente/SOA_HPC/blob/main/Ejercicios/Prueba%202%20-%20Imagen%20-%20GPU.ipynb

[4] Valiente Waldo: Ejemplo Hola Mundo GPU. (23/06/2021). GitHub. https://github.com/wvaliente/SOA_HPC/blob/main/Ejercicios/Prueba%200%20-%20Hola%20Mundo%20GPU.ipynb