### Reduction operation: the sum of the numbers in the range [0, a)

In [1]:
import time
import sys
def reduc_operation(a):
    """Compute the sum of the numbers in the range [0, a)."""
    x = 0
    for i in range(a):
        x += i
    return x

# Secuencial
# Modificación 3.3 apartado C
value = int(sys.argv[1])

initialTime = time.time()
suma = reduc_operation(value)
finalTime = time.time()

print("Time taken by reduction operation:", (finalTime - initialTime), "seconds")

# Utilizando las operaciones mágicas de ipython
%timeit -r 2 reduc_operation(value)

print(f"\n \t Computing the sum of numbers in the range [0, value): {suma}\n")

Time taken by reduction operation: 0.03695273399353027 seconds
34.7 ms ± 1.36 ms per loop (mean ± std. dev. of 2 runs, 10 loops each)

 	 Computing the sum of numbers in the range [0, value): 499999500000



# Apartado 3.2
## Ejercicio A

In [2]:
lista = list(range(10**6))

A continuación se suman todos los elementos de las lista, primero usando un bucle `for` y posteriormente con la función `sum`. Se mostrarán los tiempo para cada operación.

In [3]:
# bucle for
initialTime = time.time()
total = 0
for elemento in lista:
    total += elemento
finalTime = time.time()

print("Tiempo con bucle for:")
print((finalTime - initialTime), "segundos")

# operación sum
print("Tiempo con función sum:")
%timeit -r 2 sum(lista)

Tiempo con bucle for:
0.05776619911193848 segundos
Tiempo con función sum:
5.79 ms ± 20.5 μs per loop (mean ± std. dev. of 2 runs, 100 loops each)


## Ejercicio B
A continuación se pasará la lista al tipo *array* de *numpy*, volviendo a realizar las operaciones anteriores y comprobando la mejora en tiempo.

In [4]:
import numpy as np

array = np.array(lista)

# bucle for
initialTime = time.time()
total = 0
for elemento in array:
    total += elemento
finalTime = time.time()

print("Tiempo con bucle for:")
print((finalTime - initialTime), "segundos")

# operación sum de numpy
print("Tiempo con función sum:")
%timeit -r 2 np.sum(array)

Tiempo con bucle for:
0.10205698013305664 segundos
Tiempo con función sum:
191 μs ± 378 ns per loop (mean ± std. dev. of 2 runs, 10,000 loops each)


Como se puede ver, hay una diferencia muy significativa entre ambos métodos.

## Ejercicio C
Primero, podemos ver que iterar en un bucle `for` sobre el tipo `range` es más eficiente que el tipo `list`. Si vamos a la [documentación de python](https://docs.python.org/es/3.13/library/stdtypes.html#range), donde se explican los rangos, podemos ver que "siempre se usa una cantidad fija (y pequeña) de memoria ... calcula los valores intermedios a medida que los va necesitando". Sin embargo, cuando se usa la función `sum`, las lista consiguen mejor rendimiento. No he encontrado documentación que hable sobre esto, pero intuyo que tiene que ver con la implementación de ambos tipos.

Sobre numpy, podemos ver que iterar con bucles sobre el tipo `array` de *numpy* es contraproducente, empeorando el rendimiento con respecto a los rangos y listas. Si vamos a la [documentación de numpy](https://numpy.org/doc/stable/user/whatisnumpy.html), en la introducción, podemos ver que es más rápido porque se usa vectorización y codigo optimizado y pre compilado en C. La función `sum` de *numpy* está optimizada y usa vectorización de datos; usar un bucle `for` significa perder toda la ventaja que ofrece el paquete.

# Apartado 3.2
## Ejercicio A
El bloque anterior lo modificamos a funciones para poder usar *numba*

In [5]:
from numba import njit

@njit
def suma_for_ndarray(array):
    total = 0
    for elemento in array:
        total += elemento
    return total

@njit
def suma_sum_ndarray(array):
    return np.sum(array)

print("Tiempo con bucle for:")
%timeit -r 2 suma_for_ndarray(array)

print("Tiempo con función sum:")
%timeit -r 2 suma_sum_ndarray(array)

Tiempo con bucle for:
567 μs ± 2.55 μs per loop (mean ± std. dev. of 2 runs, 1 loop each)
Tiempo con función sum:
148 μs ± 160 ns per loop (mean ± std. dev. of 2 runs, 10,000 loops each)


## Ejercicio B
Podemos ver una mejora sustancial al usar bucles `for` y también una mejora de en torno al 25% en la operación `sum` de *numpy*. El decorador `@njit` activa el modo [*nopython*](https://numba.readthedocs.io/en/stable/glossary.html#term-nopython-mode), usando instruccines nativas en vez del interprete de Python. Ambas operaciones mejoran, pero la operación `sum` de *numpy* sigue siendo más rápida porque no deja de ser código muy optimizado.

## Ejercicio C

- **Ejecución con $10^6$**
  + Usando **rangos**:
    ```
    Time taken by reduction operation: 0.03380131721496582 seconds
    34.1 ms ± 432 μs per loop (mean ± std. dev. of 2 runs, 10 loops each)

    Computing the sum of numbers in the range [0, value): 499999500000
    ```
  + Usando **listas**:
    ```
    Tiempo con bucle for:
    0.06768202781677246 segundos
    
    Tiempo con función sum:
    6.08 ms ± 33.7 μs per loop (mean ± std. dev. of 2 runs, 100 loops each)
    ```
  + Usando **numpy**:
    ```
    Tiempo con bucle for:
    0.10480070114135742 segundos
    
    Tiempo con función sum:
    221 μs ± 3.44 μs per loop (mean ± std. dev. of 2 runs, 1,000 loops each)
    ```
  + Usando **numba** y **numpy**:
    ```
    Tiempo con bucle for:
    579 μs ± 3.91 μs per loop (mean ± std. dev. of 2 runs, 1 loop each)
    
    Tiempo con función sum:
    134 μs ± 59 ns per loop (mean ± std. dev. of 2 runs, 10,000 loops each)
    ```

- **Ejecución con $10^7$**
  + Usando **rangos**:
    ```
    Time taken by reduction operation: 0.3205859661102295 seconds
    327 ms ± 158 μs per loop (mean ± std. dev. of 2 runs, 1 loop each)
    
    Computing the sum of numbers in the range [0, value): 49999995000000
    ```
  + Usando **listas**:
    ```
    Tiempo con bucle for:
    0.07353425025939941 segundos
    
    Tiempo con función sum:
    5.8 ms ± 17.4 μs per loop (mean ± std. dev. of 2 runs, 100 loops each)
    ```
  + Usando **numpy**:
    ```
    Tiempo con bucle for:
    0.12433743476867676 segundos
    
    Tiempo con función sum:
    177 μs ± 673 ns per loop (mean ± std. dev. of 2 runs, 10,000 loops each)
    ```
  + Usando **numba** y **numpy**:
    ```
    Tiempo con bucle for:
    604 μs ± 3.87 μs per loop (mean ± std. dev. of 2 runs, 1 loop each)
    
    Tiempo con función sum:
    128 μs ± 72.7 ns per loop (mean ± std. dev. of 2 runs, 10,000 loops each)
    ```