# Paralelización y concurrencia

## Objetivos

* Paralelizar una función con multiprocesos
* Paralelizar una función con multithreading
* Entender la diferencia entre multiprocesos y multithreading


 ## Introducción 

### Multiprocesamiento 
El multiprocesamiento es un sistema que tiene más de uno o dos procesadores. En Multiprocesamiento, se agregan CPU para aumentar la velocidad de cómputo del sistema. Debido al multiprocesamiento, hay muchos procesos que se ejecutan simultáneamente. El multiprocesamiento se clasifica en dos categorías:  
Multiprocesamiento síncrono y Multiprocesamiento asíncrono.
  
![title](https://media.geeksforgeeks.org/wp-content/uploads/20190522151746/Untitled-Diagram-341.png)
  
## Multithreading   
Multithreading es un sistema en el que se crean múltiples subprocesos de un proceso para aumentar la velocidad informática del sistema. En subprocesos múltiples, muchos subprocesos de un proceso se ejecutan simultáneamente y la creación de procesos en subprocesos múltiples se realiza de forma económica.  

![title](https://media.geeksforgeeks.org/wp-content/uploads/20190522151811/Untitled-Diagram-351.png)

En multiprocesamiento, se agregan CPU's para aumentar la potencia computacional, mientras que en multithreading, se crean muchos subprocesos de un solo proceso para aumentar la potencia computacional.

Sin el multiprocesamiento, los programas de Python tienen problemas para maximizar las especificaciones de su sistema debido al GIL (Global Interpreter Lock). Python no fue diseñado teniendo en cuenta que las computadoras personales pueden tener más de un core (muestra la antigüedad del lenguaje), por lo que el GIL es necesario porque Python no es seguro para subprocesos y hay un bloqueo forzado globalmente al acceder a un objeto Python. Aunque no es perfecto, es un mecanismo bastante efectivo para la gestión de la memoria.  

El multiprocesamiento nos permite crear programas que pueden ejecutarse simultáneamente (sin pasar por el GIL) y utilizar la totalidad del core del CPU. Aunque es fundamentalmente diferente de la biblioteca de threading, la sintaxis es bastante similar. La biblioteca de multiprocesamiento le da a cada proceso su propio intérprete de Python y cada uno su propio GIL.

Debido a esto, los problemas habituales asociados con el threading (como la data corruption y los death point) ya no son un problema. Como los procesos no comparten memoria, no pueden modificar la misma memoria simultáneamente.



Para entender un poco más sobre como funcionan ambos vamos a utlizar la biblioteca "Parallel" que nos permite paralelizar funciones con multiproceso o bien con multithreading para más información podemos encontrarla en [este link](https://python-parallel.readthedocs.io/en/latest/)

Para el siguiente ejemplo vamos a guardar el siguiente código en un archivo python y vamos a crear un nuevo ambiente virtual e instalar la biblioteca parallel con el comando:  
`pip3 install parallel`

In [None]:
import parallel
import requests

def guardar_en_archivo(texto):
    with open("datos.txt", "w") as my_file:
        my_file.write(texto)
        
# Con este decorador indicamos que queremos 
# convertir la función en una función paralela
@parallel.decorate 
def descargar_y_guardar(url):
    resp = requests.get(url)
    result = guardar_en_archivo(resp.json())
    return result

if __name__ == '__main__':
    urls = [
        'https://python.org',
        'https://python-requests.com',
        'https://rmotr.com'
    ]
    # paralelizmo, por default usará Threads
    results = descargar_y_guardar.map(urls, timeout=5, max_workers=4)
    print(results)

Otra forma de paralelizar es utilizando la biblioteca por default de multiprocesos como podemos ver en el siguiente código:

In [11]:
from multiprocessing import Pool

def f(x):
    return x*x


with Pool(5) as p:
    print(p.map(f, [1,2,3,4,5,6,7,8,9,10]))

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]


Parallel también nos permite ejecutar funciones de manera asyncrona de la siguiente forma:

In [None]:
@parallel.decorate
def get_especie_planta(texto):
    print(f"rosa: {texto}")

@parallel.decorate
def get_especie_animal(texto):
    print(f"leon: {texto}")

@parallel.decorate
def get_especie_insecto(texto):
    print(f"abeja: {texto}")

functions = {
    'planta': get_especie_planta.future('roja'),
    'animal': get_especie_animal.future('amarillo'),
    'insecto': get_especie_insecto.future('café'),
}
with parallel.async_par(functions, max_workers=5) as ex:
    print(" iniciamos la ejecución")
    resultados = ex.results(timeout=4)
    print("terminamos la ejecución")

## Highligts

La biblioteca **Parallel** utiliza decoradores para su escritura en el código, para más información sobre como funcionan los decoradores podemos ingresar a [este link](https://realpython.com/primer-on-python-decorators/)

## Bibliografía

https://docs.python.org/3/library/concurrency.html Concurrent Execution 2019

https://docs.python.org/3.7/library/multiprocessing.html Process-based parallelism 2019