---
# 1 Introducción

El siguiente cuaderno realiza el binomio de Newton[1] entre los componentes de dos vectores. El ejercicio se resuelve tanto usando únicamente CPU como tambien CPU-GPU para ver los tiempos de respuesta de cada tipo de ejecución.

El binomio de Newton esta dado por la formnula:

 <center> $(a+b)^n$ </center>

**Donde:**

$a$ y $b$ son cada uno de los componentes de los vectores.

$n$ es el parámetro potencia que solicita el código.

Este cuaderno resuelvo hasta el binomio de potencia 4.

Tipos de binomio:

Potencia: 0

$(a+b)^0 = 1$

Potencia: 1

$(a+b)^1 = a+b$

Potencia: 2

$(a+b)^2 = a^2+2a*b+b^2$

Potencia: 3

$(a+b)^3 = a^3+3a^2*b+3a*b^2+b^3$

Potencia: 4

$(a+b)^4 = a^4+4a^3*b+6a^2*b^2+4a*b^3+b^4$


Estos ejercicios están resueltos en lenguaje Python[2] en la plataforma Colab[3]


---
# 2 Armado del ambiente
No son necesarios la ejecuciones previas de armado del ambiente.

---
# 3 Desarrollo


In [None]:
# --------------------------------------------
#@title 3.1 Parámetros de ejecución de CPU { vertical-output: true }

class ParametroException(Exception):
  #Ocurre cuando los parametros ingresados son incorrectos.
  def __init__(self,*args,**kwargs):
    Exception.__init__(self,*args,**kwargs)

try:
  cantidad =   30000#@param {type: "number"}
  potencia =   3#@param {type: "number"}

  # --------------------------------------------
  if potencia < 0 or potencia > 4 or type(potencia) != type(1):
    raise ParametroException
  if cantidad < 0:
    raise ParametroException

  from datetime import datetime

  tiempo_total = datetime.now()
  import sys
  import numpy

  # --------------------------------------------
  # Definición de función que transforma el tiempo en  milisegundos 
  tiempo_en_ms = lambda dt:(dt.days * 24 * 60 * 60 + dt.seconds) * 1000 + dt.microseconds / 1000.0


  x_cpu = numpy.random.randn(cantidad)
  x_cpu = x_cpu.astype(numpy.float32())

  y_cpu = numpy.random.randn(cantidad)
  y_cpu = y_cpu.astype(numpy.float32()) 

  res_cpu = numpy.empty_like (x_cpu)
  
  tiempo_bucle = datetime.now()


  if potencia == 0:
    for i in range(0, cantidad):
      res_cpu[i] = 1
  elif potencia == 1:
    for i in range(0, cantidad):
      res_cpu[idx] = X[idx] + Y[idx]
  elif potencia == 2:
    for i in range(0, cantidad):
      res_cpu[i] = pow(x_cpu[i],2) + 2*x_cpu[i]*y_cpu[i]+pow(y_cpu[i],2)
  elif potencia == 3:
    for i in range(0, cantidad):
      res_cpu[i] = pow(x_cpu[i],3) + 3*pow(x_cpu[i],2)*y_cpu[i]+3*x_cpu[i]*pow(y_cpu[i],2)+pow(y_cpu[i],3)
  elif potencia == 4:
    for i in range(0, cantidad):
      res_cpu[i] = pow(x_cpu[i],4) + 4*pow(x_cpu[i],3)*y_cpu[i]+6*pow(x_cpu[i],2)*pow(y_cpu[i],2)+ 4*x_cpu[i]*pow(y_cpu[i],3)+pow(y_cpu[i],4)

  tiempo_bucle = datetime.now() - tiempo_bucle

  """
  # CPU - Informo el resutlado.
  print( "------------------------------------")
  print( "X: " )
  print( x_cpu )
  print( "------------------------------------")
  print( "Y: " )
  print( y_cpu )
  print( "------------------------------------")
  print( "Resultado: " )
  print( res_cpu )

  """

  tiempo_total = datetime.now() - tiempo_total
  print( "Cantidad de elementos: ", cantidad)
  print("Tiempo CPU: ", tiempo_en_ms( tiempo_total ), "[ms]" )
  print("Tiempo bucle: ", tiempo_en_ms( tiempo_bucle   ), "[ms]" )
except ParametroException as err:
  print("Los parametros ingresados son incorrectos.")
  print("Cantidad debe ser un numero entero positivo.")
  print("Potencia debe ser un numero entero comprendido entre 0 y 4.")
  print(err)
except NameError as err:
  print(err)
except Exception as err:
  print("Ocurrió un error inesperado.")
  print(type(err))
  print(err)


Cantidad de elementos:  30000
Tiempo CPU:  483.314 [ms]
Tiempo bucle:  479.462 [ms]


---
#4 Tabla de pasos
Tabla de pasos de la ejecución del programa CPU:

 Procesador | Función | Detalle
------------|---------|----------
CPU      |  Custom Exception                | Se crea una excepcion customizada
CPU      |  @param                | Lectura del tamaño de vectores desde Colab.
CPU      |  validación                | Se validan los parametros ingresados.
CPU      |  import                | Importa los módulos para funcionar.
CPU      |  datetime.now()        | Toma el tiempo inicial.
CPU      |  numpy.random.randn( Cantidad ) | Inicializa los vectores A, B y R.
CPU      |  bucle                | Realiza el binomio de los vectores A y B, guardando el resultado en R. 
CPU      |  datetime.now()        | Toma el tiempo final.
CPU      |  print()               | Informa los resultados.



---
# 5 Conclusiones

Como se puede ver en las ejecuciones, para poco cálculo la ejecución secuencial en CPU es más rápida ya que la ejecución CPU-GPU tiene que hacer la reserva de memoria en el GPU, copiar los datos a trabajar y despues copiar otra vez los resultados al vector correspondiente, por lo que se traduce en un overhead enorme y por los pocos datos a procesar no tiene sentido.

Pero si la carga de datos a procesar es muy grande la diferencia entre trabajar secuencialmente con trabajar con los threads del GPU de forma paralela es muy amplia y ahí si tiene sentido y da una respuesta muchisimo más rapida trabajar con el GPU.


Al trabajar con el procesamiento paralelo se elimina el for lo que se traduce a una menor complejidad computacional y una respuesta más rapida.

---
# 6 Bibliografía

[1] Binomio de Newtom: [Wiki](https://es.wikipedia.org/wiki/Teorema_del_binomio)

[2] Introducción a Python: [Página Colab](https://github.com/wvaliente/SOA_HPC/blob/main/Documentos/Python_Basico.ipynb) 

[3] MARKDOWN SYNTAX Colab: [PDF](https://github.com/wvaliente/SOA_HPC/blob/main/Documentos/markdown-cheatsheet-online.pdf)