
# 01 ‚Äî Structures de donn√©es & Complexit√©s (version **compl√®te**)

**Objectifs du cours**
- Comprendre **en profondeur** les structures Python (`list`, `tuple`, `dict`, `set`, `deque`, `heapq`, etc.)  
- Ma√Ætriser les **complexit√©s** (temps & m√©moire) et **cas limites** fr√©quents en entretien  
- Savoir **choisir la bonne structure** selon le **cas d'usage** (+ pi√®ges √† √©viter)  
- Disposer d'**exemples concrets**, d'**exercices** et d'une **fiche m√©mo**

**Notation** : toutes les √©quations sont en bloc `$$ ... $$` pour un rendu parfait.



## 1) Mod√®le interne (mentale) √† avoir

- `list` : **tableau dynamique contigu** en m√©moire ‚Üí acc√®s index **O(1)**, mais insertion/suppression **au milieu** = **O(n)** (d√©calage des √©l√©ments).
- `tuple` : comme `list` mais **immutable** ‚Üí hashable si √©l√©ments hashables (peut servir de cl√© de dict).
- `dict` / `set` : **table de hachage** ‚Üí op√©rations moyennes **O(1)**, **pas d'ordre logique** (mais ordre d'insertion pr√©serv√© depuis Py ‚â• 3.7 pour `dict`).  
- `deque` : **double-ended queue** bas√©e sur des **blocs** (linked) ‚Üí **O(1)** append/pop aux **deux extr√©mit√©s** ; acc√®s index **O(n)**.
- `heapq` : **min-heap** (tas binaire) ‚Üí `heappush`/`heappop` **O(log n)**, le plus petit √©l√©ment en t√™te.

**Rappel complexit√©s asymptotiques**  
$$ \text{O(1)} < \text{O}(\log n) < \text{O}(n) < \text{O}(n \log n) < \text{O}(n^2) $$



## 2) Tableau de complexit√©s (d√©taill√©)

| Structure | Acc√®s | Recherche | Insertion | Suppression | It√©ration | Remarques |
|---|---:|---:|---:|---:|---:|---|
| `list` | O(1) | O(n) | O(n) milieu / O(1) fin | O(n) milieu / O(1) fin | O(n) | Tableau contigu + over-allocation |
| `tuple` | O(1) | O(n) | ‚Äî | ‚Äî | O(n) | Immutable, hashable |
| `dict` | O(1)* | O(1)* | O(1)* | O(1)* | O(n) | *Amorti, d√©pend du hash/colisions |
| `set` | ‚Äî | O(1)* | O(1)* | O(1)* | O(n) | Ensemble (√©l√©ments uniques) |
| `deque` | O(n) | O(n) | O(1) extr√©mit√©s | O(1) extr√©mit√©s | O(n) | Id√©al files/rolling windows |
| `heapq` | ‚Äî | ‚Äî | O(log n) | O(log n) | O(n) | Min-heap, acc√®s direct non support√© |

**Pourquoi `list.insert(i, x)` est O(n) ?**  
Parce qu'il faut **d√©caler** en m√©moire **tous les √©l√©ments √† droite** de `i`.  



## 3) D√©monstrations de co√ªts : insert/pop au milieu vs en fin

On mesure l'impact **amorti** : en fin `append/pop` ~O(1), **au milieu** ~O(n).


In [1]:

import time, random

def bench_insert_middle(n=20000, reps=3):
    ts=[]
    for _ in range(reps):
        lst=list(range(n))
        t0=time.perf_counter()
        lst.insert(n//2, -1)
        ts.append(time.perf_counter()-t0)
    return sum(ts)/len(ts)

def bench_append(n=20000, reps=500):
    ts=[]
    for _ in range(reps):
        lst=[]
        t0=time.perf_counter()
        lst.append(1)
        ts.append(time.perf_counter()-t0)
    return sum(ts)/len(ts)

mid = bench_insert_middle()
end = bench_append()
print(f"insert(milieu) temps moyen: {mid*1e6:.2f} ¬µs")
print(f"append(fin)     temps moyen: {end*1e6:.4f} ¬µs  (~O(1))")


insert(milieu) temps moyen: 117.13 ¬µs
append(fin)     temps moyen: 0.1648 ¬µs  (~O(1))



## 4) Dictionnaires & Ensembles : hashing, collisions, pi√®ges

- **Hashing** : `dict` et `set` s'appuient sur `__hash__` et `__eq__` pour les cl√©s.  
- **Cl√©s valides** : **immutables** et **hashables** (ex : `str`, `int`, `tuple` d'objets hashables).  
- **Collisions** : g√©r√©es par **open addressing** (d√©tails CPython) ; la complexit√© reste **O(1) amorti**.

**Pi√®ges classiques**
- Utiliser une **liste** en cl√© ‚Üí ‚ùå (non hashable) ; utiliser un **tuple** ‚Üí ‚úÖ
- Cl√©s mutables (ex : `list`), ou objets dont `__hash__` d√©pend d'attributs qui changent ‚Üí **comportements bizarres**.


In [2]:

# Cl√© tuple correcte
prices = {("EURUSD", "2024-01-01"): 1.09}
print("cl√© tuple OK:", prices[("EURUSD","2024-01-01")])

# Cl√© liste -> TypeError
try:
    bad = {["EURUSD","2024-01-01"]: 1.09}  # noqa
except TypeError as e:
    print("Erreur attendue:", e)


cl√© tuple OK: 1.09
Erreur attendue: unhashable type: 'list'



## 5) `deque` pour fen√™tres glissantes (rolling) en **O(1) amorti**

Exemple : moyenne mobile sur un flux (√©vite `sum` √† chaque pas).


In [3]:

from collections import deque
def rolling_mean(iterable, n):
    d=deque(maxlen=n); s=0.0
    for x in iterable:
        if len(d)==n:
            s -= d[0]
        d.append(x); s += x
        yield s/len(d)

print(list(rolling_mean([1,2,3,4,5,6], 3)))


[1.0, 1.5, 2.0, 3.0, 4.0, 5.0]



## 6) `heapq` (min-heap) : file de priorit√©, top‚Äëk, fusion de flux ordonn√©s

- `heappush(h, x)`, `heappop(h)` ‚Üí **O(log n)**
- Obtenir le **top‚Äëk** efficacement (au lieu de trier tout)  
- Fusionner **k listes tri√©es** (`heapq.merge`) ‚Üí utile pour consolider des flux tri√©s par timestamp.


In [4]:

import heapq, random

# Top-k (k plus grands) avec min-heap de taille k
def topk(iterable, k=5):
    h=[]
    for x in iterable:
        if len(h)<k:
            heapq.heappush(h, x)
        else:
            if x>h[0]:
                heapq.heapreplace(h, x)  # pop+push O(log k)
    return sorted(h, reverse=True)

data=[random.randint(0,1000) for _ in range(1000)]
print("Top 5:", topk(data, 5))


Top 5: [999, 998, 997, 997, 995]


In [5]:

# Fusion de flux tri√©s (tapez 'help(heapq.merge)')
import heapq
a=[1,4,9]; b=[2,3,10]; c=[5,6,7,8]
print("merge:", list(heapq.merge(a,b,c)))


merge: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]



## 7) `list` vs `deque` : quand choisir quoi ?

- **`list`** : acc√®s al√©atoire rapide, **parcours** et **manipulations en fin**.
- **`deque`** : **file** FIFO/LIFO, besoins d'**append/pop aux deux extr√©mit√©s**, **sliding window**.
- Acc√®s `deque[i]` ‚Üí **O(n)** ; `list[i]` ‚Üí **O(1)**.  
**R√®gle** : si tu fais souvent `pop(0)`/`insert(0, x)` ‚Üí prends une **`deque`**.



## 8) Exercices (avec corrections)

### Exo 1 ‚Äî Choix de structure
> Tu re√ßois un flux de 10 millions d'IDs (peut contenir des doublons). Tu dois renvoyer la **liste des IDs uniques** et pouvoir tester `id in ...` rapidement. **Que choisis-tu ? Pourquoi ?**

**Attendu** : `set` pour unicit√© + membership O(1). Si ordre d'arriv√©e requis ‚Üí `dict` (cl√©=id) pour pr√©server l'ordre (Py ‚â•3.7) ou `OrderedDict`.

---

### Exo 2 ‚Äî Rolling maximum en O(1) amorti
> Impl√©mente `rolling_max(arr, k)` qui renvoie le maximum de chaque fen√™tre de taille `k` **en O(1) amorti**.

**Indication** : Utilise une `deque` qui garde des indices et des valeurs **monotoniquement d√©croissantes**.


In [6]:

from collections import deque

def rolling_max(arr, k):
    q = deque()
    res = []
    for i, x in enumerate(arr):
        # Retire les indices qui sortent de la fen√™tre
        if q and q[0] <= i-k:
            q.popleft()
        # Maintient la deque d√©croissante (valeurs)
        while q and arr[q[-1]] <= x:
            q.pop()
        q.append(i)
        if i >= k-1:
            res.append(arr[q[0]])
    return res

print(rolling_max([1,3,-1,-3,5,3,6,7], 3))  # [3,3,5,5,6,7]


[3, 3, 5, 5, 6, 7]



## 9) Pi√®ges d'entretien & points √† **recaser**

- **Pourquoi `insert/pop` milieu list = O(n)` ?** ‚Üí d√©placement des √©l√©ments contigus.
- **Pourquoi `dict`/`set` = O(1) amorti ?** ‚Üí table de hachage, d√©pend des collisions.
- **Quand `deque` > `list` ?** ‚Üí op√©rations extr√©mit√©s fr√©quentes (FIFO, rolling).
- **Pourquoi `heapq` ?** ‚Üí priorit√©, top‚Äëk, fusion k flux tri√©s **sans trier tout**.
- **Cl√© hashable** ‚Üí utiliser **tuple**, √©viter **list** mutable.



---
## üìå Fiche m√©mo (r√©vision express)

- `list`: acc√®s O(1), `append/pop` fin O(1), **milieu O(n)**  
- `tuple`: immutable, hashable si contenu hashable  
- `dict`/`set`: **O(1) amorti**, cl√©s hashables, attention aux collisions  
- `deque`: **O(1)** aux deux extr√©mit√©s, **O(n)** acc√®s index  
- `heapq`: `heappush`/`heappop` **O(log n)**, top‚Äëk, merges tri√©s  
- Choix structure = **pattern d'acc√®s** + **contraintes perf/m√©moire**
