# Introduction

# Bibliothèques Python pour réaliser du parallélisme

## Threading

# https://timber.io/blog/multiprocessing-vs-multithreading-in-python-what-you-need-to-know/

La bibliothèque <span style="color:red">threading</span> utilise des threads pour réaliser du parallélisme.

Les threads possèdent un espace mémoire partagé ce qui permet de partager facilement des informations. Cependant il y a un fort risque de conflit lors d'écriture de données. La bibliothèque permet alors l'utilisation de verrou pour protéger les données.

Verrou : acquire - release

### Avantages
On peut facilement partager des données entre threads.

Les threads utilisent moins d'espace mémoire car cet espace est partagé entre les threads

On peut découper un problème en sous-problème.
### Inconvénients
Les threads ne bénéficient pas de la présence de plusieurs coeurs sur un processeur. Il n'y a pas de réelle parallélisme.

Il faut faire très attention lors de l'écriture du code car il faut vérifier les éventuels conflits.

Code plus dur

## Multiprocessing

La bibliothèque <b>multiprocessing</b> utilise des processus pour réaliser du parallélisme.

La mémoire n'est pas partagée, chaque processus ayant son propre espace mémoire.

Il est plus difficile de partager des informations car un processus ne peut pas accéder, en théorie, à l'espace mémoire d'un autre processus. Cependant on pourrait penser à 2 processus s'exécutant en parallèle et essayant d'écrire dans un même fichier. On peut également d'utiliser un pipe, c'est ce que propose la biliothèque multiprocessing. Elle met également à disposition des verrous comme la bibliothèque threading.

### Avantages
En créant différents processus on peut bénéficier d'un parallélisme physiquement réelle sur un processeur a plusieurs coeurs.

Si un processus crash, les autres processus peuvent continuer leur exécution.

Code plus simple
### Inconvénients
La création de nouveau processus nécessite plus de mémoire

# Différence entre processus et thread

![schema_prog_sys.png](attachment:schema_prog_sys.png)

(Schéma du cours de prog_sys)

Dans ce schéma nous voyons à gauche un thread seul qui représente donc un processus avec son espace mémoire (pile + registres). Un processus ne peut pas accéder à la mémoire d'un autre processus.

À droite nous avons plusieurs threads qui se partagent le même espace mémoire, chacun ayant sa propre pile et ses propres registres. Un thread peut accéder à la mémoire des autres threads.

# https://blog.floydhub.com/multiprocessing-vs-threading-in-python-what-every-data-scientist-needs-to-know/

# 2 exemples de codes : un thread et un multiprocessus

In [12]:
import random
import sys
from threading import Thread
import time

class Afficheur(Thread):

    """Thread chargé simplement d'afficher une lettre dans la console."""

    def __init__(self, lettre):
        Thread.__init__(self)
        self.lettre = lettre

    def run(self):
        """Code à exécuter pendant l'exécution du thread."""
        i = 0
        while i < 20:
            sys.stdout.write(self.lettre)
            sys.stdout.flush()
            attente = 0.2
            attente += random.randint(1, 60) / 100
            time.sleep(attente)
            i += 1

# Création des threads
thread_1 = Afficheur("1")
thread_2 = Afficheur("2")

# Lancement des threads
thread_1.start()
thread_2.start()

# Attend que les threads se terminent
thread_1.join()
thread_2.join()

12121212121222121212121211212211221212121

In [1]:
import multiprocessing
import threading
import time
import sys

def cpu_func(result, niters):
    '''
    A useless CPU bound function.
    '''
    for i in range(niters):
        result = (result * result * i + 2 * result * i * i + 3) % 10000000
    return result

class CpuThread(threading.Thread):
    def __init__(self, niters):
        super().__init__()
        self.niters = niters
        self.result = 1
    def run(self):
        self.result = cpu_func(self.result, self.niters)

class CpuProcess(multiprocessing.Process):
    def __init__(self, niters):
        super().__init__()
        self.niters = niters
        self.result = 1
    def run(self):
        self.result = cpu_func(self.result, self.niters)

class IoThread(threading.Thread):
    def __init__(self, sleep):
        super().__init__()
        self.sleep = sleep
        self.result = self.sleep
    def run(self):
        time.sleep(self.sleep)

class IoProcess(multiprocessing.Process):
    def __init__(self, sleep):
        super().__init__()
        self.sleep = sleep
        self.result = self.sleep
    def run(self):
        time.sleep(self.sleep)

if __name__ == '__main__':
    cpu_n_iters = int(sys.argv[1])
    sleep = 1
    cpu_count = multiprocessing.cpu_count()
    input_params = [
        (CpuThread, cpu_n_iters),
        (CpuProcess, cpu_n_iters),
        (IoThread, sleep),
        (IoProcess, sleep),
    ]
    header = ['nthreads']
    for thread_class, _ in input_params:
        header.append(thread_class.__name__)
    print(' '.join(header))
    for nthreads in range(1, 2 * cpu_count):
        results = [nthreads]
        for thread_class, work_size in input_params:
            start_time = time.time()
            threads = []
            for i in range(nthreads):
                thread = thread_class(work_size)
                threads.append(thread)
                thread.start()
            for i, thread in enumerate(threads):
                thread.join()
            results.append(time.time() - start_time)
        print(' '.join('{:.6e}'.format(result) for result in results))

ValueError: invalid literal for int() with base 10: '-f'