<a href="https://colab.research.google.com/github/jdeiros/soa-2020/blob/master/HPC/Deiros_Jeronimo_ejercicio_1_cpu.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#1. Introducción
Por lo general, las computadoras se utilizan para compilar y analizar los resultados de encuestas y estudios de opinión.

El siguiente cuaderno calcula la **moda** de los **N** valores de los elementos de un vector (vector_resultados), lo hace en forma secuencial y utilizando el procesador CPU. Cada elemento del vector se inicializa con resultados aleatorios de puntajes (numeros enteros entre 0 y 9).

El algoritmo se basa en un ejemplo práctico del libro "C/C++ Cómo Programar"[1] 

Su objetivo es aprender a utilizar Python[2] en la plataforma Colab [3] y la programación secuencial.

#2. Armado de ambiente

No es necesario para este ejercicio.

#3. Desarrollo


In [1]:
# --------------------------------------------
#@title 3.1 Parámetros de ejecución { vertical-output: true }

cantidad_elementos =   50000#@param {type: "number"}
# --------------------------------------------
import numpy as np
from datetime import datetime

tiempo_total = datetime.now()

# Definición de función que transforma el tiempo en  milisegundos 
tiempo_en_ms = lambda dt:(dt.days * 24 * 60 * 60 + dt.seconds) \
              * 1000 + dt.microseconds / 1000.0
try:
    # Inicializo el vector resultados con puntajes (de 0 a 9) aleatorios
    # con cantidad de elementos ingresada.
    vector_resultados = np.random.randint(0, 10, size = cantidad_elementos)
    vector_resultados = vector_resultados.astype(np.int32())
    # Inicializo en cero el vector frecuencia (puntajes de 0 a 9)
    vector_frecuencia = [0 for i in range(10)]
    print("-------------------------------------------------")
    print("vector con numeros:")
    print(vector_resultados)
    
    tiempo_bucle = datetime.now()

    # CPU - suma las frecuencias.
    for i in range(0, cantidad_elementos):
        vector_frecuencia[vector_resultados[i]] += 1

    tiempo_bucle = datetime.now() - tiempo_bucle

    # CPU - Informo el resultado.
    print("-------------------------------------------------")
    print("vector frecuencia: ")
    print(vector_frecuencia)
        
    mas_grande = 0
    valor_moda = 0

    # obtengo la moda del vector_frecuencia
    for rango in range(0, len(vector_frecuencia)):
        if(vector_frecuencia[rango] > mas_grande):
            mas_grande = vector_frecuencia[rango]
            valor_moda = rango
    
    print("-------------------------------------------------")
    print(f"Para esta ejecución la moda es: {valor_moda}, ")
    print(f"cual ocurrió {mas_grande} veces.")

    tiempo_total = datetime.now() - tiempo_total
    print("-------------------------------------------------")
    print("Tiempo Total: ", tiempo_en_ms(tiempo_total),"[ms]")
    print("Tiempo bucle: ", tiempo_en_ms(tiempo_bucle), "[ms]" )

except Exception as e:
  print(f"error: {e}")



-------------------------------------------------
vector con numeros:
[4 4 8 ... 7 2 2]
-------------------------------------------------
vector frecuencia: 
[5031, 5004, 5003, 4874, 5133, 4946, 5070, 4949, 4908, 5082]
-------------------------------------------------
Para esta ejecución la moda es: 4, 
cual ocurrió 5133 veces.
-------------------------------------------------
Tiempo Total:  29.487 [ms]
Tiempo bucle:  14.049 [ms]


#4. Tabla de pasos

Paso | Procesador | Funcion | Detalle
------------ | ------------ | ------------- | -------------
1 | CPU | @param | Lectura del tamaño de vector de Colab.
2 | CPU | import | Importa los módulos para funcionar.
3 | CPU | datetime.now() | Toma el tiempo actual.
4 | CPU | np.random.randint(0, 10, size = cantidad_elementos) | Inicializa el vector _vector_resultados_ con puntajes (de 0 a 9) aleatorios en cada elemento, en una cantidad de elementos ingresada en el paso 1.
5 | CPU | [0 for i in range(10)] | inicializo el vector frecuencia a 0, este vector representará en cada posición el valor del puntaje (entre 0 y 9) y su contenido representará la cantidad de apariciónes en el vector resultados. Por esta razon es necesario inicializarlo a cero, para luego sumar las frecuencias.
6 | CPU | print | muestro los valores del vector_resultados
7 | CPU | bucle for | contabilizo las frecuencias de puntajes en el vector_resultados.
8 | CPU | print | imprimo los resultados del vector frecuencia
9 | CPU | bucle for | obtengo el valor de la moda y la cantidad de repeticiones.
10 | CPU | print | muestro los resultados
11 | CPU | print | informo tiempos de ejecución.

#5. Conclusiones

* ### 5.1 Breve repaso de los puntos mas relevantes del trabajo.
La moda es el valor mas frecuente entre un conjunto de valores. En este ejercicio se obtuvo la moda y la cantidad de ocurrencias de un conjunto de valores, que representan puntuaciones entre 0 a 9 generadas aleatoriamente, para una cantidad de elementos ingresada por parametro. Se utiliza un vector de frecuencia, cuyos indices representan cada valor de estos puntajes de 0 a 9, donde se cotabilizan las ocurrencias de cada valor en el vector de resultados, que simula el resultado de una encuesta de estos puntajes.
Se procesan los resultados a traves de un bucle for que recorre el vector resultados y contabiliza las apariciones de cada valor. 
Se capturan los tiempos de ejecucion para poder comparar luego con la ejecucion paralela utilizando el gpu.

* ### 5.2 Explicación sobre las lecciones aprendidas que deja el ejercicio.
En este ejercicio se aplicó el algoritmo para el calculo de las frecuencias extraido del libro Como Programar en C, C++ de Deitel & Deitel[1], adaptandolo al lenguaje Python.
Se aprendió a utlizar los cuadernos en el entorno Colab[1], aplicar estilos para la documentación en los cuadernos[4], Se aprende a usar parametros para la ejecucion de celdas de codigo en los cuadernos y se toman los tiempos de ejecucion que se utilizaran luego para compararlos con la ejecucion paralela.

* ### 5.3 Sugerencias para continuar con el ejercicio (funcionalidad o algoritmo).
Implementar diferentes algoritmos de vectores para poder compararlos con las ejecuciones en paralelo e lograr interiorizar en el uso de la herramienta colab, sobretodo para orientar el aprendizaje en analisis de datos y machine learning.



#6. Bibliografía

* [1] Como Programar en C C++ y Java 4ta Edición Harvey M. Deitel & Paul J. Deitel.
* [2] Python Básico - SOA UNLaM: [Python Básico](https://github.com/wvaliente/SOA_HPC/blob/main/Documentos/Python_Basico.ipynb)
* [3] Tutorial Point Colab: [Google Colab Tutorial](https://github.com/wvaliente/SOA_HPC/blob/main/Documentos/google_colab_tutorial.pdf)
* [4] Markdown cheatsheet online: [pdf](https://github.com/wvaliente/SOA_HPC/blob/main/Documentos/markdown-cheatsheet-online.pdf)