
# 03 ‚Äî Concurrence & Parall√©lisme en Python (Version **Universit√©**)

> **Objectif p√©dagogique** : √† la fin de ce chapitre, tu dois √™tre capable d‚Äô**expliquer** (oral d‚Äôentretien) et **impl√©menter** (live coding) un pipeline concurrent **correct** en Python, choisir entre **threads**, **processus**, et **asyncio**, et justifier tes choix (I/O‚Äëbound vs CPU‚Äëbound, GIL, co√ªts de pickling, backpressure, timeouts).

### Plan du cours
1. **Motivation & vocabulaire** (concurrence vs parall√©lisme, latence vs d√©bit)  
2. **Le GIL** (d√©finition, cons√©quences, mythes)  
3. **Threading** (quand, pourquoi, design patterns : producer/consumer, backpressure, poison pill)  
4. **Multiprocessing** (vrai parall√©lisme CPU, pickling, chunking, shared memory)  
5. **Asyncio** (concurrence coop√©rative, event loop, cancellation, timeouts)  
6. **√âtude de cas ‚Äúfeed ‚Üí strat√©gie ‚Üí OMS‚Äù** (combiner les mod√®les proprement)  
7. **Pi√®ges, bonnes pratiques, checklist d‚Äôentretien**  
8. **Exercices guid√©s** + corrig√©s



## 1) Motivation & vocabulaire (5 min)

**Pourquoi la concurrence ?**  
Dans un moteur de trading, tu dois souvent **consommer** des donn√©es (ticks, carnets d‚Äôordres), **calculer** des signaux, et **√©mettre** des ordres **en parall√®le** pour minimiser la **latence** et maximiser le **d√©bit**.

**Concurrence vs Parall√©lisme**  
- **Concurrence** : organiser des t√¢ches qui se **chevauchent** dans le temps (pas n√©cessairement ex√©cut√©es en m√™me temps).  
- **Parall√©lisme** : ex√©cuter **vraiment en m√™me temps** sur plusieurs c≈ìurs.  
Python (CPython) offre les deux, via des **threads** (concurrence utile en I/O), des **processus** (parall√©lisme CPU) et **asyncio** (concurrence coop√©rative mono‚Äëthread).

**Latence vs D√©bit**  
- **Latence** = temps de r√©ponse pour une t√¢che unique.  
- **D√©bit (throughput)** = nombre de t√¢ches trait√©es par unit√© de temps.  
Un bon design doit pr√©ciser ce qu‚Äôon optimise.



## 2) Le GIL (Global Interpreter Lock) ‚Äî ce qu‚Äôil faut dire √† l‚Äôoral

- Le **GIL** est un verrou global de l‚Äôinterpr√©teur **CPython** : √† un instant donn√©, **un seul thread** ex√©cute du **bytecode Python**.  
- **Implication** : pour du **CPU pur** (boucles Python lourdes), les threads **n‚Äôacc√©l√®rent pas** (ils se partagent le GIL).  
- **Mais** : les op√©rations **I/O** (r√©seau, disque) **lib√®rent** le GIL ‚Üí les threads peuvent **vraiment** se chevaucher en I/O (bon pour HTTP, sockets, DB).  
- Beaucoup de libs natives (NumPy) ex√©cutent du C qui **lib√®re** le GIL pendant l‚Äôop√©ration : un thread peut alors d√©coupler Python‚ÜîC.

**R√©sum√© d√©cidable**  
- **I/O‚Äëbound** ‚Üí `threading` **ou** `asyncio`  
- **CPU‚Äëbound** ‚Üí `multiprocessing` (ou Numba/Cython)

**Mythes fr√©quents**  
- ‚ÄúLe GIL emp√™che toute concurrence‚Äù ‚ùå Faux : il emp√™che seulement l‚Äôex√©cution **CPU Python** simultan√©e, pas l‚Äô**overlap d‚ÄôI/O**.



## 3) Threading ‚Äî Producer/Consumer, backpressure, poison pill 

### Quand utiliser les **threads** ?
- T√¢ches **I/O‚Äëbound** : lectures socket, appels r√©seau, √©criture disque, DB.  
- Tu veux un mod√®le pragmatique, simple √† lire, sans d√©pendre de l‚Äôevent loop `asyncio`.

### Pourquoi une **queue** ?
- **D√©coupler** producteur(s) et consommateur(s).  
- Impl√©menter une **r√©gulation (backpressure)** via `maxsize` : si les consommateurs ralentissent, le producteur **bloque** sur `put()`, √©vitant de saturer la m√©moire.  
- Faciliter l‚Äô**arr√™t propre** via **poison pill** (sentinelle `None`).

### Sch√©ma mental
```
[Producer(s)] --put()--> [ queue.Queue(maxsize=M) ] --get()--> [Consumer(s)]
   ‚Üë backpressure si file pleine                  ‚Üë poison pill pour arr√™ter
```


In [1]:

# Threading : pipeline robuste avec backpressure & poison pill
import threading, time, queue, random

q = queue.Queue(maxsize=200)    # r√©gulation
results = []
N_ITEMS = 2000

def producer(n=N_ITEMS):
    for i in range(n):
        q.put((i, random.random()))  # bloque si maxsize atteint
    for _ in range(4):               # 4 consommateurs => 4 pilules
        q.put(None)                  # poison pill

def consumer(cid):
    while True:
        item = q.get()               # bloque si vide
        if item is None:
            q.task_done()
            break
        i, x = item
        # Travail I/O simul√©
        time.sleep(0.0005)
        results.append((cid, i, x*2))
        q.task_done()

threads = [threading.Thread(target=consumer, args=(k,)) for k in range(4)]
for t in threads: t.start()
producer()
q.join()                             # attend le traitement complet
for t in threads: t.join()

len(results), results[:5]


(2000,
 [(0, 0, 0.7405738344840216),
  (1, 3, 0.2692098905282778),
  (3, 2, 0.32296949252872076),
  (2, 1, 1.1266421518297678),
  (2, 7, 1.8436315658140712)])


### Sections critiques & **race conditions**
D√®s qu‚Äôon **partage** un √©tat (ex : un compteur), deux threads peuvent √©crire **en m√™me temps** ‚Üí **race condition**.

**Rem√®de** : un **verrou** (`threading.Lock`) entourant la **plus petite** portion de code qui manipule l‚Äô√©tat (section critique).


In [2]:

# D√©monstration lock minimal
import threading

counter = 0
lock = threading.Lock()

def incr(n=10000):
    global counter
    for _ in range(n):
        # Prot√©ger seulement ce qui est n√©cessaire
        with lock:
            counter += 1

threads = [threading.Thread(target=incr) for _ in range(8)]
[t.start() for t in threads]
[t.join() for t in threads]
counter  # doit √™tre 80000 si tout va bien


80000


**Bonnes pratiques Threading (√† citer)**
- Pr√©f√©rer la **communication par messages** (queues) aux verrous sophistiqu√©s.  
- Les traitements doivent √™tre **idempotents** (rejouables sans casser l‚Äô√©tat).  
- G√©rer l‚Äô**arr√™t** (poison pill), les **timeouts** et la **journalisation** (logs).

---



## 4) Multiprocessing ‚Äî vrai parall√©lisme CPU (12 min)

### Quand utiliser **multiprocessing** ?
- T√¢ches **CPU‚Äëbound** (calcul num√©rique pur en Python) qui ne b√©n√©ficient pas d‚Äôune lib C optimis√©e.  
- Exploiter **plusieurs c≈ìurs** sans GIL partag√©.

### Co√ªts/Contraintes
- **Pickling** : les donn√©es √©chang√©es entre process sont **s√©rialis√©es** ‚Üí co√ªt non n√©gligeable.  
- **Spawn/Fork** : lancement de process co√ªteux (surtout `spawn` sur Windows/macOS).  
- Favoriser des **gros ‚Äúchunks‚Äù** de travail (coarse‚Äëgrained) pour amortir les co√ªts.

### Exemple


In [None]:

from multiprocessing import Pool
import math, time

def cpu_heavy(n):
    s=0.0
    for i in range(10_000):
        s += math.sqrt((i*n) % 97)
    return s

t0 = time.perf_counter()
with Pool(4) as p:
    res = p.map(cpu_heavy, [10,11,12,13])
elapsed = time.perf_counter()-t0
len(res), f"{elapsed:.3f}s"



**Tips ‚Äúentretien‚Äù**
- Les objets envoy√©s √† un worker doivent √™tre **picklables**.  
- **Chunking** : grouper des t√¢ches plut√¥t que d‚Äôenvoyer 1 micro‚Äët√¢che = 1 message.  
- En data science, voir aussi **shared_memory** (tableaux partag√©s) pour limiter les copies.

---



## 5) Asyncio ‚Äî Concurrence coop√©rative mono‚Äëthread (15 min)

### Pourquoi **asyncio** ?
- Des milliers de **petites I/O** concurrentes (HTTP, websockets) avec un **faible overhead**.  
- Contr√¥le fin : **timeouts**, **cancellation**, **gather**/`TaskGroup` (3.11+).

### Sch√©ma mental
```
          +-------------------+
          |   Event Loop      |
await --> |   planifie/ordonne| --> d'autres coroutines progressent
          +-------------------+
```

**Id√©e cl√©** : √† chaque `await`, la coroutine **rend la main**. Si elle attend I/O, **une autre** peut avancer.


In [None]:

# Timeout global avec asyncio.wait_for + gather
import asyncio, random

async def fetch(symbol):
    await asyncio.sleep(random.random()/5)  # I/O simul√©
    return symbol, 100 + random.random()

async def main():
    syms = [f"SYM{i}" for i in range(10)]
    try:
        res = await asyncio.wait_for(
            asyncio.gather(*[fetch(s) for s in syms]),
            timeout=2.0
        )
        print("OK", len(res))
    except asyncio.TimeoutError:
        print("Timeout global")

asyncio.run(main())



### Queue `asyncio` : producer/consumers
- Tr√®s proche du mod√®le `queue.Queue`, mais **non bloquant**.  
- Parfait pour un **collecteur de ticks** qui pousse dans un bus interne.


In [None]:

import asyncio, random

async def producer(ch, n=50):
    for i in range(n):
        await ch.put((i, random.random()))
    for _ in range(3):
        await ch.put(None)

async def consumer(ch, cid):
    while True:
        item = await ch.get()
        if item is None:
            ch.task_done()
            break
        await asyncio.sleep(0.002)  # I/O simul√©
        ch.task_done()

async def run():
    ch = asyncio.Queue(maxsize=20)
    prod = asyncio.create_task(producer(ch, 100))
    cons = [asyncio.create_task(consumer(ch, k)) for k in range(3)]
    await asyncio.gather(prod)
    await ch.join()
    for c in cons:
        await c

asyncio.run(run())



**√Ä citer en entretien**
- `await` = point de suspension coop√©ratif ; pas de pr√©emption.  
- **Timeouts** via `asyncio.wait_for`, **cancellation** via `task.cancel()`.  
- **Pas** de data race Python (mono‚Äëthread), mais attention au **partage mutable** entre coroutines.

---



## 6) √âtude de cas : **Feed ‚Üí Strat√©gie ‚Üí OMS** (10 min)

**Contexte** : tu re√ßois des ticks (I/O), tu calcules un signal (l√©ger CPU), tu routes un ordre (I/O).  
**Design recommand√©** (simple & robuste) :
```
[Ticker Thread/Async] --(queue)--> [Strategy Worker(s)] --(queue)--> [OMS Adapter (I/O)]
```
- **Entr√©e** (I/O) : `threading` **ou** `asyncio`  
- **Traitement** (l√©ger CPU) : **threads** conviennent (ou m√™me synchrone si simple)  
- **Sortie** (I/O vers broker) : **Adapter** + `threading`/`asyncio`

**Pourquoi pas `multiprocessing` ici ?**  
- Le calcul est l√©ger. Co√ªts de **pickling** > gains.  
- R√©serve `multiprocessing` aux t√¢ches **CPU lourdes** (pricing massif offline, backtests).



## 7) Pi√®ges, bonnes pratiques, checklist d‚Äôentretien (8 min)

**Pi√®ges classiques**
- Oublier la **backpressure** (file non born√©e ‚Üí OOM).  
- Pas de **poison pill** ‚Üí threads zombies √† l‚Äôarr√™t.  
- Verrous trop larges ‚Üí **contention** + perf d√©grad√©e.  
- Pas de **timeout** sur I/O ‚Üí blocages invisibles.  
- M√©langer trop de mod√®les (threads + async + process) sans raison.

**Bonnes pratiques**
- **Simplicit√© d‚Äôabord** : un seul mod√®le si possible.  
- **Messages/queues** > partage d‚Äô√©tat + verrous.  
- **Idempotence** des handlers, **logs** clairs, **metrics** (latence, taille de file, d√©bit).  
- Tests : **d√©terministes** (stubs pour I/O), pas de `sleep` arbitraires (utiliser des queues/√©v√©nements).

**Checklist entretien (√† recaser)**
- ‚ÄúGIL ‚áí threads pour I/O, `multiprocessing` pour CPU‚Äù  
- ‚ÄúPipeline queue avec **maxsize** (backpressure) + **poison pill**‚Äù  
- ‚Äú**Timeouts** & **cancellation** en `asyncio`‚Äù  
- ‚Äú**Pickling** entre process, penser **chunking** / **shared_memory**‚Äù



## 8) Exercices guid√©s (avec corrig√©s)

### Exercice A ‚Äî Pipeline threads avec mesure de d√©bit
**T√¢che** : √©tends l‚Äôexemple ‚Äúproducer/consumer‚Äù pour afficher le **d√©bit (items/s)** et la **latence moyenne** par item.  
**Indice** : timestamp √† la production + calcul √† la consommation.

> üëâ Corrig√© ci‚Äëdessous.


In [None]:

# Corrig√© Exercice A (simplifi√©)
import time, threading, queue, statistics, random

q = queue.Queue(maxsize=500)
times = []
N = 3000

def prod():
    for i in range(N):
        q.put((i, time.perf_counter()))
    for _ in range(4): q.put(None)

def cons():
    while True:
        item = q.get()
        if item is None:
            q.task_done(); break
        i, t0 = item
        # Simule un petit travail
        time.sleep(0.0003)
        times.append(time.perf_counter()-t0)
        q.task_done()

t0 = time.perf_counter()
ts = [threading.Thread(target=cons) for _ in range(4)]
for t in ts: t.start()
prod()
q.join()
for t in ts: t.join()
elapsed = time.perf_counter()-t0
throughput = N/elapsed
lat = statistics.mean(times)
throughput, lat



### Exercice B ‚Äî `multiprocessing` avec chunking
**T√¢che** : transforme une liste de 400 ‚Äújobs‚Äù en 8 chunks de 50 et distribue-les via `Pool.map`.  
**But** : illustrer l‚Äôamortissement des co√ªts de messaging/pickling.

*(√Ä faire en autonomie ‚Äî v√©rifie le temps total avec et sans chunking.)*

### Exercice C ‚Äî `asyncio` + timeout par requ√™te
**T√¢che** : lance 50 `fetch()` en parall√®le avec un **timeout par requ√™te** (pas juste global).  
**Indice** : enveloppe **chaque** coroutine avec `wait_for` et g√®re `TimeoutError` **individuellement**.

---

## Glossaire express
- **Backpressure** : m√©canisme qui ralentit la production quand la consommation ne suit pas.  
- **Poison pill** : sentinelle pour arr√™ter proprement un worker.  
- **Idempotence** : r√©p√©ter une action produit le m√™me √©tat final.  
- **Pickling** : s√©rialisation Python pour IPC entre process.  
- **Cancellation** : annuler une coroutine/Task en `asyncio`.
