<div align="center">
    <img src="images/um_logo.png" alt="image">
</div>

# Multiprocessing

El multiprocessing es una técnica de programación que permite a una aplicación ejecutar múltiples procesos simultáneamente. Esto es particularmente útil en sistemas de cómputo con múltiples núcleos de procesador, donde se puede lograr una mejora significativa en el rendimiento al distribuir tareas entre diferentes procesos.

### ¿Qué es un Proceso?

Un proceso es una instancia de un programa que se ejecuta independientemente en el sistema operativo. Cada proceso tiene su propio espacio de memoria y, generalmente, realiza una secuencia de tareas o una tarea específica. En Python, el módulo `multiprocessing` permite crear procesos independientes, cada uno de los cuales puede ejecutar funciones y gestionar datos de forma concurrente.

### Ventajas del Multiprocessing

- **Paralelismo Verdadero**: A diferencia del threading, el multiprocessing permite que múltiples tareas se ejecuten en paralelo en diferentes núcleos de CPU, evitando problemas de concurrencia como el GIL (Global Interpreter Lock) en Python.
- **Estabilidad**: Los procesos son independientes, por lo que un fallo en un proceso no necesariamente afecta a los demás.
- **Uso eficiente de recursos**: Se puede hacer un uso más eficaz de los recursos del sistema al dividir las tareas en varios procesos.

### Desventajas del Multiprocessing

- **Uso de memoria**: Cada proceso tiene su propio espacio de memoria, lo cual puede resultar en un mayor consumo de recursos si no se gestiona adecuadamente.
- **Complejidad**: La gestión de múltiples procesos es más compleja en comparación con el threading, especialmente en términos de comunicación y sincronización entre procesos.
- **Overhead de creación de procesos**: Crear y destruir procesos tiene un costo computacional más alto que el threading.

## Usos Comunes del Multiprocessing

El multiprocessing se utiliza comúnmente en aplicaciones que requieren un alto rendimiento de cálculo y no pueden permitirse estar bloqueadas por tareas que consumen mucho tiempo. Algunos ejemplos incluyen:

- Procesamiento de imágenes y vídeo en tiempo real.
- Aplicaciones web que requieren el procesamiento de grandes volúmenes de datos de forma concurrente.
- Simulaciones científicas que necesitan realizar cálculos complejos y extensos.

En la siguiente sección, proporcionaremos ejemplos de código que demuestran cómo implementar multiprocessing en Python usando la biblioteca `multiprocessing`.


## Comandos Útiles en Linux para el Multiprocessing

### Ver la Cantidad de Núcleos del Procesador

Para determinar cuántos núcleos de CPU tiene tu sistema, puedes usar el comando `lscpu`. Este comando proporciona información detallada sobre la arquitectura de la CPU, incluyendo el número de núcleos:

```bash
lscpu
```

Línea que dice "CPU(s):" para el número total de núcleos, y "Core(s) per socket:" para ver cuántos núcleos físicos hay por socket.

### Ver la Carga de Cada Núcleo
Es posible ver la carga de trabajo actual de cada núcleo de CPU utilizando el comando `top` o `htop` (una versión mejorada de top con una interfaz más amigable). Estos comandos muestran una visión general en tiempo real del rendimiento del sistema.




## Ejemplo Simple de Multiprocessing en Python

Para empezar con multiprocessing en Python, vamos a ver un ejemplo básico que crea varios procesos para ejecutar una función simple. Este ejemplo demuestra cómo iniciar procesos y la manera de pasarles argumentos.

### Código Básico de Multiprocessing

Primero, importamos la biblioteca `multiprocessing` y luego definimos una función simple que los procesos ejecutarán. En este ejemplo, cada proceso imprimirá su número de identificación (ID) y un mensaje.

```python
import multiprocessing

def worker(num):
    """Función que será ejecutada por cada proceso."""
    print(f'Worker: {num}')

if __name__ == '__main__':
    # Lista para mantener los procesos
    processes = []

    # Crear procesos
    for i in range(5):  # Crear 5 procesos
        p = multiprocessing.Process(target=worker, args=(i,))
        processes.append(p)
        p.start()

    # Esperar a que todos los procesos terminen
    for p in processes:
        p.join()

    print("Procesamiento completado.")


## Explicación del Código de Multiprocessing

### Importación de Módulos
- Se importa `multiprocessing`, que es esencial para la creación y manejo de procesos múltiples en Python.

### Definición de la Función `worker`
- `worker(num)`: Función simple que imprime el ID del proceso. Cada proceso ejecutará esta función, mostrando su número identificador único.

### Creación y Gestión de Procesos
- Se crean varios procesos utilizando un bucle. Cada proceso se inicia con `p.start()` y se asigna a ejecutar la función `worker`.
- `p.join()`: Se utiliza para asegurarse de que el script principal espere a que todos los procesos terminen antes de continuar.

### Ejecución Concurrida
- La ejecución de los procesos es concurrente, lo cual significa que todos los procesos pueden ejecutarse al mismo tiempo, dependiendo de la disponibilidad de los núcleos del CPU.

Este script es un ejemplo básico que demuestra cómo múltiples procesos pueden ser creados y gestionados en Python para realizar tareas de forma simultánea.


In [None]:
#import multiprocessing
from multiprocessing import Process
import os, time

def child1():
    print("Child 1: %d, parent: %d" % (os.getpid(), os.getppid()))
    print("esperando...")
    time.sleep(5)
    os.system("ps ft")
    print("hijo muriendo...")


if __name__=="__main__":
    print("Parent ID",os.getpid())
    # creamos el objeto proceso (Process), no se ejecuta todavía
    p1=Process(target=child1)
    # p1.run()
#    child1()
    input("seguimos...")
    print("========================================================")
    print("Parent ID",os.getpid())
    p1.start()
    for i in range(10):
        print("Padre esperando a que el hijo muera...")
        time.sleep(1)

    print("PS  del padre (hijo muerto) -------------------------")
    os.system("ps ft")
    print("Padre libera al hijo zombie con join (simil wait)")
    p1.join()
    print(">>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>")
    os.system("ps ft")

    print("We're done")

    #p1.kill() # envia un SIG_KILL al p1


## Explicación General del Código de Multiprocessing en Python

### Importaciones Iniciales
- **`Process` de `multiprocessing`**: Utilizado para crear procesos independientes.
- **`os` y `time`**: Módulos para interacciones con el sistema operativo y control de tiempos, respectivamente.

### Función `child1`
- **Identificación de Procesos**: Imprime los identificadores del proceso hijo y su proceso padre.
- **Pausa y Comando Sistema**: El proceso hijo espera 5 segundos, ejecuta un comando del sistema para mostrar la jerarquía de procesos y finalmente indica su terminación.

### Flujo Principal
- **Creación de Proceso**: Se crea un proceso hijo pero no se inicia inmediatamente.
- **Inicio del Proceso Hijo**: Tras una interacción del usuario (presionar enter), el proceso hijo se inicia.
- **Espera del Proceso Padre**: El proceso padre imprime mensajes mientras espera que el hijo complete su ejecución.
- **Limpieza**: El padre espera que el hijo termine completamente usando `join()`, lo que también ayuda a prevenir procesos zombi.
- **Finalización**: Se imprime la jerarquía de procesos una vez que el hijo ha terminado y el script concluye su ejecución.

### Consideraciones Adicionales
- **`p1.run()` vs `p1.start()`**: Comentado en el código, `run()` ejecutaría la función `child1` en el mismo hilo y proceso, mientras que `start()` crea un nuevo proceso.
- **Control de Procesos**: Al final del script se comentan métodos para matar el proceso si fuera necesario, aunque no se utilizan activamente en el script proporcionado.

Este script demuestra cómo crear y gestionar un proceso en Python utilizando `multiprocessing`, con interacciones claras entre el proceso padre e hijo y cómo gestionar correctamente la finalización de procesos para evitar zombies.


In [4]:
from multiprocessing import Process
import os, time

def child1():
    print("Child 1",os.getpid())

def child2():
    print("Child 2",os.getpid())
    print("hijo trabajando....")
    time.sleep(4)


if __name__=="__main__":
   print("Parent ID",os.getpid())
   # se crean los procesos (no se ejecutan)
   p1=Process(target=child1)
   p2=Process(target=child2)

   # se ejecutan los procesos (hace fork internamente)
   p1.start()
   p2.start()

   # todo esto lo hace el padre
   # ident es un atributo del objeto Process
   print("PID p1: %d" % p1.ident)
   print("PID p2: %d" % p2.pid)
#   os.kill(p1.ident, signal.asdfas)

   # join() e is_alive() son metodos del objeto Process
   p1.join()
   alive='Yes' if p1.is_alive() else 'No'
   print("Is p1 alive?",alive)
   time.sleep(1)
   #os.system("ps fax")
   alive='Yes' if p2.is_alive() else 'No'
   print("Is p2 alive?",alive)
#   p2.kill() # envia el SIGKILL al proceso
#   p2.terminate() # envia el SIGTERM al proceso
   p2.join()
   print("We're done")


Parent ID 73279
Child 1 75591Child 2 
75594
hijo trabajando....
PID p1: 75591
PID p2: 75594
Is p1 alive? No
Is p2 alive? Yes
We're done


### Importaciones y Definición de Funciones
- **`Process` de `multiprocessing` y módulos `os`, `time`**: Se utilizan para crear procesos y manejar funcionalidades del sistema operativo y temporizadores.
- **`child1` y `child2`**: Funciones destinadas a ser ejecutadas por los procesos hijos. `child1` simplemente imprime su ID de proceso, mientras que `child2` imprime su ID y simula un trabajo mediante una pausa.

### Creación y Ejecución de Procesos
- **Creación de Procesos**: Se crean dos objetos de tipo `Process`, cada uno apuntando a una función diferente (`child1` y `child2`).
- **Ejecución de Procesos**: Los procesos se inician con el método `start()`, que efectivamente crea nuevos procesos (fork) y ejecuta las funciones asignadas.

### Interacciones y Monitoreo por el Proceso Padre
- **Monitoreo de PIDs**: Inmediatamente después de iniciar los procesos, se imprimen los identificadores de proceso (PID) de ambos procesos hijos.
- **Espera y Verificación**: El método `join()` es utilizado para esperar a que los procesos terminen su ejecución. `is_alive()` verifica si el proceso sigue activo, lo cual es útil para monitorear el estado del proceso.

### Finalización y Limpieza
- **Conclusión del Proceso**: El proceso padre espera a que ambos procesos hijos terminen completamente usando `join()`. Se verifica el estado de `is_alive()` para confirmar que los procesos ya no están activos.
- **Cierre del Script**: Se imprime un mensaje final para indicar que todos los procesos han concluido.

### Comentarios Adicionales
- Hay líneas comentadas que incluyen llamadas a `os.kill()`, `p2.kill()` y `p2.terminate()`, que serían métodos para terminar procesos de manera forzosa si fuera necesario, pero no se utilizan activamente en este ejemplo.

Este ejemplo muestra cómo gestionar múltiples procesos en Python, enfocándose en la creación, ejecución y supervisión de procesos, así como en la interacción entre el proceso padre y los procesos hijos.







In [None]:
from multiprocessing import Process, Pipe
import time

def f(conn):
    while True:
      msg = conn.recv()
      if msg == 'end':
        break
        
      print("H: " + msg.upper())
      
    
    conn.close()

if __name__ == '__main__':
    parent_conn, child_conn = Pipe()
    p = Process(target=f, args=(child_conn,))
    p.start()
    
    while True:
      msg = input()
      parent_conn.send(msg)
      if msg == 'end':
        break
      
    p.join()


Este script de Python utiliza `multiprocessing` y `Pipe` para establecer una comunicación continua y controlada entre procesos hasta que se envíe una señal de finalización. Aquí se detallan los elementos clave del código:

### Importación de Módulos y Definición de Funciones
- **`Process` y `Pipe` de `multiprocessing`**: Se utilizan para crear procesos independientes y un canal de comunicación bidireccional entre el proceso padre e hijo.
- **`f(conn)`**: Función que el proceso hijo ejecutará. Esta función entra en un bucle infinito, recibiendo mensajes de la conexión (`conn`), los convierte a mayúsculas, los imprime, y finaliza el bucle al recibir el mensaje `'end'`.

### Configuración del Pipe y Creación del Proceso
- **`Pipe()`**: Genera dos objetos de conexión, `parent_conn` y `child_conn`, que se utilizarán para la comunicación entre el proceso padre y el hijo.
- **Creación y Inicio del Proceso Hijo**: Se inicia el proceso hijo asignando `f` como su función objetivo y `child_conn` como argumento para la comunicación.

### Bucle de Comunicación y Control de Flujo
- **Entrada del Usuario**: El proceso padre entra en un bucle infinito donde solicita al usuario que ingrese mensajes. Estos mensajes son enviados al proceso hijo a través de `parent_conn`.
- **Finalización Condicionada**: Cuando el usuario introduce el mensaje `'end'`, el bucle se detiene y se envía este mensaje al hijo para indicarle que termine.

### Conclusión y Cierre de Procesos
- **Espera de Terminación del Hijo**: Después de enviar la señal de finalización, el padre espera a que el proceso hijo concluya su ejecución con `p.join()`.
- **Cierre de Conexiones**: La conexión en el lado del hijo se cierra después de recibir el mensaje de finalización para liberar los recursos de manera apropiada.

### Aspectos Clave del Código
- **Comunicación Bidireccional y Controlada**: Este ejemplo muestra cómo controlar un flujo de comunicación entre procesos mediante mensajes y cómo un proceso puede permanecer en espera activa de entrada hasta que se indique explícitamente que termine.
- **Respuesta Dinámica**: El proceso hijo responde inmediatamente procesando y mostrando cada mensaje que recibe, lo que es útil en escenarios donde se requiere un procesamiento en tiempo real de la entrada.


In [None]:
from multiprocessing import Process, Pipe
import time

def f(child_conn):
    child_conn.send([42, None, 'hello'])
    print("H: Hijo recibiendo: " + child_conn.recv())
    child_conn.send("hola mundo")
    print("H: " + child_conn.recv())
    child_conn.close()

if __name__ == '__main__':
    parent_conn, child_conn = Pipe()
    p = Process(target=f, args=(child_conn,))
    p.start()
    print ("P: " + str(parent_conn.recv()))   # prints "[42, None, 'hello']"
    parent_conn.send("enviando desde el padre...")
    for i in range(5):
        print("Padre haciendo cosas de padre...")
        time.sleep(1)

    print ("P: " + parent_conn.recv())
    parent_conn.send("hola")
    p.join()

Este script de Python utiliza `multiprocessing` con `Pipe` para crear un canal de comunicación entre procesos. A continuación, se detalla el funcionamiento del código:

### Importación de Módulos y Definición de Funciones
- **`Process` y `Pipe` de `multiprocessing`**: Se utilizan para crear procesos y establecer un canal de comunicación bidireccional entre ellos.
- **`f(child_conn)`**: Función que el proceso hijo ejecutará. Utiliza la conexión de la tubería (`child_conn`) para enviar y recibir mensajes.

### Configuración del Pipe y Creación del Proceso
- **`Pipe()`**: Crea una tubería que retorna dos objetos de conexión (`parent_conn` y `child_conn`) que pueden enviar y recibir mensajes entre ellos.
- **Creación del Proceso Hijo**: Se inicia un proceso que ejecutará la función `f` con `child_conn` como argumento.

### Comunicación Entre Procesos
- **Intercambio de Mensajes**: 
  - El proceso hijo envía una lista `[42, None, 'hello']` al proceso padre, que la recibe y la imprime.
  - El padre envía un mensaje de vuelta al hijo, y mientras, ejecuta algunas operaciones simuladas por `time.sleep(1)`.
  - El hijo recibe el mensaje del padre, envía un nuevo mensaje "hola mundo", y luego cierra su conexión.
  
### Recepción de Mensajes y Conclusión
- **Recepción de Mensajes por el Padre**: El padre recibe el mensaje "hola mundo" del hijo, envía un último mensaje "hola", y luego espera a que el proceso hijo concluya usando `join()`.

### Aspectos Clave del Código
- **Bidireccionalidad**: `Pipe()` permite una comunicación bidireccional, donde tanto el padre como el hijo pueden enviar y recibir mensajes.
- **Sincronización**: `join()` asegura que el proceso padre espere a que el hijo complete su ejecución antes de terminar, garantizando que todos los mensajes sean intercambiados correctamente.
- **Cierre de Conexiones**: Es importante cerrar las conexiones de la tubería en el proceso que ya no las necesita para liberar recursos.

Este ejemplo ilustra cómo los procesos pueden comunicarse de manera efectiva a través de un canal de tubería, facilitando el intercambio de datos y mensajes en aplicaciones que requieren coordinación entre múltiples procesos.