# 1. Introducción

En el siguiente ejercicio se realizará el **producto escalar** entre dos vectores de igual dimensiones.

El algoritmo está basado en la función **dot** nivel 1[1], de la biblioteca **BLAS**[2] que resuelve la ecuación:
<center>$res = \sum_{i-1}^{n} X_i * Y_i$</center>

La idea principal es mostrar la perfomance del funcionamiento de **estructuras de una dimensión** para gran cantidad de elementos.

Se utilizará exclusivamente el lenguaje Python [3] con bibliotecas estándares en la plataforma Colab [4][5].

---
# 2. Armado del ambiente

### Importación de **bibliotecas**

In [None]:
from datetime import datetime
import numpy
import math

---
# 3. Desarrollo


In [None]:
#@title ### 3.1. Parámetros de ejecución {vertical-output: true}
#@markdown ---
#@markdown Cantidad de elementos de los arrays X e Y:
cant_elementos = 50000#@param {type: "integer"}
#@markdown ---

# Validamos la cantidad de elementos de los arrays
if not (type(cant_elementos) is int):
  raise TypeError("El parámetro de entrada debe ser un entero.") 
if cant_elementos <= 0:
  raise Exception("La cantidad de dimensiones de los arrays deben ser al menos 1.")

# Definición de función que transforma el tiempo en milisegundos 
tiempo_en_ms = lambda dt:(dt.days * 24 * 60 * 60 + dt.seconds) * 1000 + dt.microseconds / 1000.0

# El ejercicio podría fallar si no se importaron los recursos necesarios
# Es por eso que envolvemos el código en un bloque try, de esta forma
# se le indica al usuario cómo proceder
try:
  # Capturamos el tiempo inicial
  tiempo_total = datetime.now()

  # Defino los vectores a partir del tamaño indicado
  # El contenido de los mismos son números enteros aleatorios
  x_cpu = numpy.random.randint(1, 10, cant_elementos)
  x_cpu = x_cpu.astype(numpy.int64())
  y_cpu = numpy.random.randint(1,10, cant_elementos)
  y_cpu = y_cpu.astype(numpy.int64())

  # Capturamos el tiempo inicial del algoritmo
  tiempo_bucles = datetime.now()

  # Realizamos las multiplicaciones
  for idx in range(0, cant_elementos):
    y_cpu[idx] = x_cpu[idx] * y_cpu[idx]

  # Computamos los resultados parciales
  res_cpu = 0
  for idx in range(0, cant_elementos):
    res_cpu += y_cpu[idx]

  # Capturamos el tiempo total del algoritmo y de todo el ejercicio
  tiempo_bucles = datetime.now() - tiempo_bucles
  tiempo_total = datetime.now() - tiempo_total

  # Mostramos el resultado del proceso
  print("Cantidad de elementos en los arrays: ", cant_elementos, "\n")
  print("Tiempo DOT: ", tiempo_en_ms(tiempo_bucles), "[ms]")
  print("Tiempo total: ", tiempo_en_ms(tiempo_total), "[ms]\n")
  print("Resultado de DOT: ", res_cpu)
except:
  print("Ups! Algo salió mal, ¿realizó el armado previo del ambiente?")

---
#4. Tabla de pasos del programa

 Procesador | Función | Detalle
------------|---------|----------
CPU      |  import                | Importa bibliotecas necesarias.
CPU      |  @param                | Leemos la cantidad de elementos de los vectores X e Y.
CPU      |  datetime.now()        | Toma el tiempo inicial del ejercicio.
CPU      |  numpy.random.randint | Inicializa los vectores X e Y con enteros aleatorios.
CPU      |  astype | Castea los vectores a un tipo de dato especificado.
CPU      |  datetime.now()        | Toma el tiempo inicial del algoritmo.
CPU      |  1er y 2do for                | Genera el producto escalar. 
CPU      |  datetime.now()        | Toma los tiempos finales.
CPU      |  print()               | Informa el resultado.



---
# 5. Conclusiones

Se realizaron las siguientes pruebas:

Cantidad de elementos|Tiempo DOT [ms]|Tiempo Total [ms]|Relación tiempos [%] 
---|---|---|---
50K|49.61|53.76|92.28
500k|460.52|487.51|94.46
5M|4421.43|4644.34|95.20
50M|45434.35|48093.43|94.47

Podemos decir que:
*   Alrededor del **94%** del tiempo total es invertido en la aplicación del algoritmo, lo cual parece razonable.
*   Los tiempos crecen **linealmente** con la cantidad de elementos de los vectores.

En la versión GPU tendremos más información para seguir extrayendo conclusiones.

---
# 6 Bibliografía

[1] Función DOT de biblioteca BLAS: [Referencia](https://software.intel.com/content/www/us/en/develop/documentation/mkl-developer-reference-c/top/blas-and-sparse-blas-routines/blas-routines/blas-level-1-routines-and-functions/cblas-dot.html)

[2] Biblioteca BLAS: [Referencia](http://www.netlib.org/blas/)

[3] Introducción a Python: [Página Colab](https://github.com/wvaliente/SOA_HPC/blob/main/Documentos/Python_Basico.ipynb) 

[4] Sintaxis Markdown Colab: [PDF](https://github.com/wvaliente/SOA_HPC/blob/main/Documentos/markdown-cheatsheet-online.pdf)

[5] Tutorial Point Colab: [PDF](https://github.com/wvaliente/SOA_HPC/blob/main/Documentos/markdown-cheatsheet-online.pdf)