# Multiprocesamiento

- Nicole Franco León
- Laura Ximena Clavijo Castellanos
- Leydi Catherine Corredor Martinez

Se puede definir como el uso de dos o más procesadores en una computadora para la ejecución de uno o varios procesos.
En python se puede abordar de diferentes maneras, siendo una de ellas es el módulo de **threading** el cual construye interfaces de hilado de alto nivel sobre el módulo de más bajo nivel

El módulo **threading** define las siguientes funciones:

#### threading.active_count()
Retorna el número de objetos Thread actualmente con vida. La cuenta retornada es igual al largo de la lista retornada por _enumerate()._

#### threading.current_thread()
Retorna el objeto Thread actual, correspondiente al hilo de control del invocador. Si el hilo de control del invocador no fue creado a través del módulo threading, se retorna un objeto hilo _dummy_ con funcionalidad limitada.

### threading.excepthook(args, /)
Gestiona una excepción lanzada por _Thread.run()_

El argumento args posee los siguientes atributos:

- exc_type: Tipo de excepción.
- exc_value: Valor de la excepción, puede ser None.
- exc_traceback: Rastreo de la excepción, puede ser None.
- thread: El hilo que ha lanzado la excepción, puede ser None.

Si _exc_type_ es _SystemExit_, la excepción es silenciosamente ignorada. De otro modo, la excepción se imprime en _sys.stderr._

Si esta función lanza una excepción, se llama a _sys.excepthook()_ para manejarla.

---

## Ejemplo

1. Para simular una tarea que conlleva una _x_ cantidad de tiempo, se definirá una función la cual simulará la ejecución de _x_ proceso en esa magnitud de tiempo, para ello se implementara el modulo **time** y mas especificamente la función **sleep** 

In [1]:
import time

In [2]:
# Definición de función

def longTask(task_id):
    print(f"Starting task processing: {task_id}")
    time.sleep(5)
    print(f"Completed task processing: {task_id}")


Se acaba de declarar una función la cual mostrará como se ejecutarán una tarea que requerirá una determinado tiempo de procesamiento

---

2. Se ejecutará un _for loop_ el cual permitirá evidenciar el tiempo que toma ejecutar la funcion previamente declarada

In [None]:
for x in range(10):
    longTask(x)

Starting task processing: 0
Completed task processing: 0
Starting task processing: 1
Completed task processing: 1
Starting task processing: 2
Completed task processing: 2
Starting task processing: 3


El proceso anterior tomará un total de 50 segundos en completarse, ya que  _fo loop_ iterará los números de 0 a 9 y entre cada iteración va a tomar un tiempo de 5 segundos, que es el tiempo asignado en nuestra función previamente declarada.
Dada la naturaleza de la programación lineal, en este ejemplo el iterador no pasará al siguiente número sin haber completado el anterior

---

3. Se implementará el módulo de **threading** el cual permitirá ejecutar varias tareas en diferentes procesos

In [3]:
import threading

In [4]:
threads = []
for x in range(10):
    t = threading.Thread(target = longTask, args = (x, ))
    threads.append(t)
    t.start()

for x in threads:
    x.join()

Starting task processing: 0
Starting task processing: 1
Starting task processing: 2
Starting task processing: 3
Starting task processing: 4
Starting task processing: 5
Starting task processing: 6
Starting task processing: 7
Starting task processing: 8
Starting task processing: 9
Completed task processing: 0
Completed task processing: 1
Completed task processing: 2
Completed task processing: 3
Completed task processing: 4
Completed task processing: 5
Completed task processing: 6
Completed task processing: 7
Completed task processing: 8
Completed task processing: 9


En la celda anterior se ejecuta el módulo de **threading** el cual distribuye los procesos que se están ejecutando según la memoria del dispositivo, de esta manera el proceso que tomaba 50 segundos tomara mucho menos tiempo, ya que inicia los procesos paralelamente y no depende de ellos mismos para poder completarse, ejecutando la función en aproximadamente 5 segundos. Finalmente, termina las 10 tareas, y las une nuevamente desde el proceso padre donde fue creado.

```mermaid
graph TD
    A["Hilo Inicial"] --> B["Lista de Tareas (10 tareas)"]
    B --> C[dividir en N hilos]
    C --> D[Hilo 1]
    C --> E[Hilo 2]
    C --> F[Hilo 3]
    C --> G[Hilo 4]
    D --> H["Ejecutar tarea (time.sleep)"]
    E --> H
    F --> H
    G --> H
    H --> I[Tarea completa]
    I --> J[Obtener resultados]

```

---

## Ejemplo 2

En este ejemplo se implementará un módulo llamado **multiprocessing** el cual permite crear procesos (spawning) utilizando una API similar al módulo threading. El paquete multiprocessing ofrece concurrencia tanto local como remota, esquivando el Global Interpreter Lock mediante el uso de subprocesos en lugar de hilos (threads).

1. Es necesario importar el módulo de *multiprocessing*

In [17]:
import multiprocessing as mp
from Task import longTask2

In [18]:
num_processes = mp.cpu_count()
print(f"El número de procesos que actualmente tiene tu equipo son: {num_processes}")

El número de procesos que actualmente tiene tu equipo son: 12


En el caso del computador donde se está ejecutando este código, el dispositivo cuenta con 12 núcleos

---

In [24]:

with mp.Pool(num_processes - 1) as pool:
    results = pool.map(longTask2, range(10))

for x in results:
    print(x)

['Starting task processing (MultiProcessing): 0', 'Completed task processing (MultiProcessing): 0']
['Starting task processing (MultiProcessing): 1', 'Completed task processing (MultiProcessing): 1']
['Starting task processing (MultiProcessing): 2', 'Completed task processing (MultiProcessing): 2']
['Starting task processing (MultiProcessing): 3', 'Completed task processing (MultiProcessing): 3']
['Starting task processing (MultiProcessing): 4', 'Completed task processing (MultiProcessing): 4']
['Starting task processing (MultiProcessing): 5', 'Completed task processing (MultiProcessing): 5']
['Starting task processing (MultiProcessing): 6', 'Completed task processing (MultiProcessing): 6']
['Starting task processing (MultiProcessing): 7', 'Completed task processing (MultiProcessing): 7']
['Starting task processing (MultiProcessing): 8', 'Completed task processing (MultiProcessing): 8']
['Starting task processing (MultiProcessing): 9', 'Completed task processing (MultiProcessing): 9']


Como se evidencia en este ejemplo este módulo lo que hace es que está distribuyendo la tarea asignada en los 12 núcleos que se identificaron previamente creando subprocesos por cada tarea a ejecutar, por tal razón su tiempo de ejecución es sustancialmente más corto que los 50 segundos iniciales de la función _longTask_

```mermaid

graph TD

    A["Tarea Inicial"] --> B["Lista de Tareas (10 tareas)"]
    B --> C[Identificar el número de núcleos]
    C --> D[Asignar tareas según el número de Núcleos]
    D --> E[Núcleo-1]
    D --> F[Núcleo-2]
    D --> G[Núcleo-3]
    D --> H[Núcleo-n]
    E --> I[Tarea-1]
    E --> J[Tarea-n]
    F --> K[Tarea-2]
    F --> L[Tarea-n]
    G --> M[Tarea-3]
    G --> N[Tarea-n]
    H --> O[Tarea-n]
    I --> P[Resultado-a]
    J --> P
    K --> Q[Resultado-b]
    L --> Q
    M --> R[Resultado-c]
    N --> R
    O --> S[Resultado-n]
    P --> T[Tarea finalizada]
    Q --> T
    R --> T
    S --> T
    T ~~~ U[Cada resultado que se completa al final de la tarea es independiente de los demás]


```