# Programación Paralela

Alan Badillo Salas (badillo.soft@hotmail.com)

Los hilos en python son procesos independientes del proceso principal, que se ejecutan en "paralelo" para poder ejecutar diversas tareas al mismo tiempo. Para poder crear un proceso en paralelo debemos definir una función que resuelva una tarea, esta función tomará sus argumentos y resolverá la tarea al mandarla a llamar, sin embargo, mediante la clase `Thread` de la librería `threading` podemos invocar a la función en un proceso independiente (un hilo) al mismo tiempo que llamamos a la misma función u otras funciones en hilos independientes.

Imagina por ejemplo, un escenario, dónde tengamos que descargar archivos desde internet, y quisieramos que estos se descarguen al mismo tiempo en hilos distintos, lo que haríamos entonces, sería definir una función que reciba la url del archivo a descargar, quizás también el nombre del archivo a crear y dicha función debería ir a la url, traer el archivo, escribirlo en disco y finalmente finalizar con un estatus exitoso o fallido. Entonces, podemos mandar a llamar a esa función que descarga el archivo cuántas veces queramos en paralelo, para que mientras descarga un archivo, en otro hilo mandemos a descargar otro archivo sin esperar a que el primero finalice.

> **Nota:** Crear más hilos que los núcleos del CPU podría provocar bajar el rendimiento del programa y crear un efecto de lack de procesamiento por tener que atender a tantos hilos con tan pocos núcleos procesadores.

## Ejemplo 1 - Contador paralelo

El siguiente programa define un contador en paralelo que incrementa una variable que se accede globalmente, luego espera 10 segundos y muestra el valor de la variable.

Observa que la función utiliza `global n` para poder modificar la variable que no pertenece a la función. También nota que `threading.Thread(...)` llama a la función objetivo creando los hilos `t` e iniciándolos en paralelo. Finalmente el atributo `args = (parámetro1, parámetro2, ...)` define la tupla de parámetros que serán envíados a la función objetivo.

La función recibirá como parámetro su nombre y mostrará el valor actual de `n`, luego incrementará `n` una unidad, esperará 10 segundos y mostrará nuevamente el valor de `n`.

In [16]:
import threading
import time

n = 0

def contador(nombre):
    global n
    print("Inicio: Soy el hilo {} y n = {}".format(nombre, n))
    print("{}: Esperando 10 segundos...".format(nombre))
    n += 1
    time.sleep(10)
    print("Pasado 10 segundo: Soy el hilo {} y n = {}".format(nombre, n))
    
for i in range(10):
    t = threading.Thread(target = contador, args = ("H-{}".format(i), )) # 1-tupla (*, ) NO-TUPLA: (*)
    t.start()

Inicio: Soy el hilo H-0 y n = 0
Inicio: Soy el hilo H-1 y n = 0H-0: Esperando 10 segundos...

H-1: Esperando 10 segundos...
Inicio: Soy el hilo H-2 y n = 2
H-2: Esperando 10 segundos...
Inicio: Soy el hilo H-3 y n = 3
H-3: Esperando 10 segundos...
Inicio: Soy el hilo H-4 y n = 4
H-4: Esperando 10 segundos...
Inicio: Soy el hilo H-5 y n = 5
H-5: Esperando 10 segundos...
Inicio: Soy el hilo H-6 y n = 6
H-6: Esperando 10 segundos...
Inicio: Soy el hilo H-7 y n = 7
H-7: Esperando 10 segundos...
Inicio: Soy el hilo H-8 y n = 8
H-8: Esperando 10 segundos...
Inicio: Soy el hilo H-9 y n = 8
H-9: Esperando 10 segundos...
Pasado 10 segundo: Soy el hilo H-0 y n = 10
Pasado 10 segundo: Soy el hilo H-1 y n = 10
Pasado 10 segundo: Soy el hilo H-2 y n = 10
Pasado 10 segundo: Soy el hilo H-3 y n = 10
Pasado 10 segundo: Soy el hilo H-4 y n = 10
Pasado 10 segundo: Soy el hilo H-5 y n = 10
Pasado 10 segundo: Soy el hilo H-6 y n = 10
Pasado 10 segundo: Soy el hilo H-7 y n = 10
Pasado 10 segundo: Soy el hi

## Ejemplo 2 - Contador de tiempo variable

En está variación haremos que el contador espere `10 - i` segundos en finalizar. Así el primer hilo esperará 10 segundos antes de finalizar, el segundo hilo esperará 9 segundos, y así sucesivamente. También haremos el incremento pasando los `10 - i` segundos.

In [17]:
import threading
import time

n = 0

def contador(nombre, i):
    global n
    print("Inicio: Soy el hilo {} y n = {}".format(nombre, n))
    print("{}: Esperando {} segundos...".format(nombre, 10 - i))
    time.sleep(10 - i)
    n += 1
    print("Pasado {} segundo: Soy el hilo {} y n = {}".format(10 - i, nombre, n))
    
for i in range(10):
    t = threading.Thread(target = contador, args = ("H-{}".format(i), i))
    t.start()

Inicio: Soy el hilo H-0 y n = 0 
H-0: Esperando 10 segundos...
Inicio: Soy el hilo H-1 y n = 0
H-1: Esperando 9 segundos...
Inicio: Soy el hilo H-2 y n = 0
H-2: Esperando 8 segundos... 
Inicio: Soy el hilo H-3 y n = 0
H-3: Esperando 7 segundos...
Inicio: Soy el hilo H-4 y n = 0
H-4: Esperando 6 segundos...
Inicio: Soy el hilo H-5 y n = 0
H-5: Esperando 5 segundos...
Inicio: Soy el hilo H-6 y n = 0
H-6: Esperando 4 segundos...
Inicio: Soy el hilo H-7 y n = 0
H-7: Esperando 3 segundos...
Inicio: Soy el hilo H-8 y n = 0
H-8: Esperando 2 segundos...
Inicio: Soy el hilo H-9 y n = 0
H-9: Esperando 1 segundos...
Pasado 1 segundo: Soy el hilo H-9 y n = 1
Pasado 2 segundo: Soy el hilo H-8 y n = 2
Pasado 3 segundo: Soy el hilo H-7 y n = 3
Pasado 4 segundo: Soy el hilo H-6 y n = 4
Pasado 5 segundo: Soy el hilo H-5 y n = 5
Pasado 6 segundo: Soy el hilo H-4 y n = 6
Pasado 7 segundo: Soy el hilo H-3 y n = 7
Pasado 8 segundo: Soy el hilo H-2 y n = 8
Pasado 9 segundo: Soy el hilo H-1 y n = 9
Pasado 10

## Ejemplo 3 - Buscador sincronizado

En este último ejemplo veremos algo no tan trivial. Supongamos que tenemos una lista muy grande de archivos de textos (en este ejemplo supondremos que ya tenemos los archivos de texto cargados, pero simularemos en la función que toma algún tiempo aleatorio abrirlos). De dicha lista de archivos queremos saber si alguno contiene alguna palabra que nos interesa buscar. La función recibirá el número de clúster (suponiendo que hay 4 procesadores y 4 clústers) y recorrerá cada archivo en la lista múltiplo de su clúster, mientras no encuentre la palabra o no acabe la lista, continuará buscando.

In [24]:
import threading
import time
import random

archivos = [
    "Un dia soleado",
    "Un dia caluroso",
    "Un dia despejado",
    "Un dia frio",
    "Un dia seco",
    "Una tarde tranquila",
    "Una tarde triste",
    "Una tarde calida",
    "Una tarde magica",
    "Una noche bella",
    "Una noche fresca",
    "Una noche emotiva",
    "Una noche romantica",
]

encontrados = []

def buscar(palabra, cluster, clusters):
    # Empieza en el cluster, hasta el número de archivos
    # y avanza la cantidad de cluster
    # Ejemplo: cluster: 1, clusters: 8, archivos: 100
    # range(1, 100, 8) => 1, 9, 17, 25, 33, ...
    # Ejemplo: cluster: 2, clusters: 8, archivos: 100
    # range(2, 100, 8) => 2, 10, 18, 26, 34, ...
    for i in range(cluster, len(archivos), clusters):
        # Simulamos que tardamos un tiempo aleatorio hasta 3 segundos en recuperar el texto
        time.sleep(random.random() * 3)
        # Recuperamos el texto del archivo
        texto = archivos[i]
        # Obtenemos el índice de la palabra en el texto
        indice = texto.find(palabra)
        # Checamos si el índice es positivo
        if indice >= 0:
            # Agregamos el texto a los archivos encontrados
            print("Palabra {} encontrada por el cluster {} en el proceso {}".format(palabra, cluster, i))
            encontrados.append(texto)
    
threads = []
    
for cluster in range(4):
    t = threading.Thread(target = buscar, args = ("Una", cluster, 4))
    t.start()
    threads.append(t)
    
# Sicronizamos los hilos para esperar a que todos acaben
for t in threads:
    t.join()
    
# En este momento los hilos ya finalizaron
print(encontrados)

Palabra Una encontrada por el cluster 2 en el proceso 6
Palabra Una encontrada por el cluster 3 en el proceso 7
Palabra Una encontrada por el cluster 0 en el proceso 8
Palabra Una encontrada por el cluster 1 en el proceso 5
Palabra Una encontrada por el cluster 2 en el proceso 10
Palabra Una encontrada por el cluster 3 en el proceso 11
Palabra Una encontrada por el cluster 1 en el proceso 9
Palabra Una encontrada por el cluster 0 en el proceso 12
['Una tarde triste', 'Una tarde calida', 'Una tarde magica', 'Una tarde tranquila', 'Una noche fresca', 'Una noche emotiva', 'Una noche bella', 'Una noche romantica']
