
# Jour 3 â€” Algo Python pour Quant Dev

Ce notebook couvre les **algorithmes et structures de donnÃ©es** les plus demandÃ©s en entretien Quant Dev, avec pÃ©dagogie et exemples pratiques.  
AprÃ¨s ce notebook, tu sauras expliquer, coder, et adapterâ€¯:

- BFS/DFS (parcours graphe, shortest path)
- Structuresâ€¯: queue, deque, heapq, Counter
- Dictionnaire triÃ© (OrderedDict), set
- LRU cache (rappel rapide)
- Rolling statistics (calculs glissants en flux)
- Exos corrigÃ©s et quiz

---



## 1. BFS & DFS â€” Parcours de graphes

- **BFS (Breadth-First Search)**â€¯: explore couche par couche (niveau par niveau)
- **DFS (Depth-First Search)**â€¯: explore le plus loin possible avant de backtracker

**Applicationsâ€¯:**
- Trouver le plus court chemin (si non pondÃ©rÃ©)
- Explorer des connexions (order book, rÃ©seau, matching engineâ€¦)


In [None]:

from collections import deque

# Graphe sous forme d'adjacence
graph = {
    'A': ['B', 'C'],
    'B': ['A', 'D', 'E'],
    'C': ['A', 'F'],
    'D': ['B'],
    'E': ['B', 'F'],
    'F': ['C', 'E']
}

# BFS (chemin de A vers F)
def bfs(graph, start, goal):
    queue = deque()
    queue.append((start, [start]))  # (noeud, chemin)
    visited = set()
    while queue:
        node, path = queue.popleft()
        if node == goal:
            return path
        if node in visited:
            continue
        visited.add(node)
        for neighbor in graph[node]:
            if neighbor not in visited:
                queue.append((neighbor, path + [neighbor]))
    return None

print("BFS A->F:", bfs(graph, 'A', 'F'))

# DFS
def dfs(graph, start, goal, path=None, visited=None):
    if path is None: path = [start]
    if visited is None: visited = set()
    visited.add(start)
    if start == goal:
        return path
    for neighbor in graph[start]:
        if neighbor not in visited:
            res = dfs(graph, neighbor, goal, path + [neighbor], visited)
            if res:
                return res
    return None

print("DFS A->F:", dfs(graph, 'A', 'F'))



**Ã€ retenir (oral)**Â :  
- BFS trouve toujours le chemin le plus court (non pondÃ©rÃ©)
- DFS explore en profondeur, peut Ãªtre plus rapide sur arbre peu large
- Utiliser `deque` pour la queue (O(1) pop/append)
- Pour un graphe pondÃ©rÃ©â€¯: utiliser Dijkstra (avec `heapq`)

---



## 2. Structures de donnÃ©esÂ : queue, deque, heap, Counter

### **queue/dequeÂ :**
- `deque` : file double entrÃ©e, trÃ¨s efficace (O(1) aux deux bouts)
- `queue.Queue` : version thread-safe (rare en quant dev)


In [None]:

dq = deque([1,2,3])
dq.append(4)
dq.appendleft(0)
print("Deque :", dq)
dq.pop()
dq.popleft()
print("AprÃ¨s pop :", dq)



### **heapqÂ :**
- Min-heap natif en Python (heapq)
- UtilisÃ© pour extraire le plus petit (ou plus grand, si on stocke des -valeurs)


In [None]:

import heapq
arr = [7, 3, 2, 9, 5]
heapq.heapify(arr)
print("Min-heap :", arr)
print("Extract min :", heapq.heappop(arr))
heapq.heappush(arr, 1)
print("AprÃ¨s push(1) :", arr)



### **CounterÂ :**
- Compte les occurrences en O(n), trÃ¨s utile pour histogrammes, logs, parsing market data.


In [None]:

from collections import Counter
arr = ['a', 'b', 'b', 'c', 'a', 'a']
c = Counter(arr)
print("Counter :", c)
print("Top 2 :", c.most_common(2))



### **OrderedDict / dict triÃ©**

Depuis Python 3.7, dict natif est ordonnÃ©.  
`OrderedDict` reste utile pour LRU cache ou insertion/dÃ©placement contrÃ´lÃ©.


In [None]:

from collections import OrderedDict
od = OrderedDict()
od['A'] = 1
od['B'] = 2
od.move_to_end('A')
print("OrderedDict :", od)



## 3. LRU Cache (Least Recently Used)

- StructureÂ : OrderedDict (ou dict+deque), capacity limitÃ©e
- OpÃ©rations O(1) pour get/put

**Code d'exemple (expliquÃ© Ã  l'oral)Â :**


In [None]:

class LRUCache:
    def __init__(self, capacity: int):
        self.cache = OrderedDict()
        self.capacity = capacity

    def get(self, key):
        if key not in self.cache:
            return -1
        self.cache.move_to_end(key)
        return self.cache[key]

    def put(self, key, value):
        if key in self.cache:
            self.cache.move_to_end(key)
        self.cache[key] = value
        if len(self.cache) > self.capacity:
            self.cache.popitem(last=False)

lru = LRUCache(2)
lru.put(1, 10)
lru.put(2, 20)
print(lru.get(1))    # 10
lru.put(3, 30)       # Eviction de 2
print(lru.get(2))    # -1



**Ã€ l'oral**Â :  
> J'utilise OrderedDict pour garder l'ordre d'accÃ¨s et pop l'Ã©lÃ©ment le moins utilisÃ© en O(1). C'est un pattern classique pour du cache en trading (ex: market data tick, last prices).



## 4. Rolling statistics sur un flux de donnÃ©es

ExempleÂ : calcul de la moyenne glissante (rolling mean) d'un prix de marchÃ© (ex: mid price).

- En quant : utile pour signal, moving average crossover, volatility window, etc.



In [None]:

import numpy as np
data = np.random.normal(100, 2, 100)
window = 5

# Rolling mean "Ã  la main"
rolling_mean = [np.mean(data[i-window+1:i+1]) if i >= window-1 else np.nan for i in range(len(data))]
print("Derniers rolling mean :", rolling_mean[-5:])

# Avec pandas (pro)
import pandas as pd
df = pd.DataFrame({"price": data})
df["roll_mean"] = df["price"].rolling(window).mean()
print(df.tail(7))



**Ã€ retenir Ã  l'oralâ€¯:**
- Pour le streaming ou les calculs temps rÃ©el, une queue (deque) ou une formule rÃ©cursive permet d'Ã©viter de recalculer tout Ã  chaque tick.



## 5. Exos classiques entretien

**1. Plus court chemin dans un graphe pondÃ©rÃ© (Dijkstra)**  
(Ã€ connaÃ®tre, mais version heapq/adjacency dict seulement)

**2. Trouver le 1er Ã©lÃ©ment qui apparaÃ®t k fois dans un stream**

**3. Rolling max/min dans une fenÃªtre glissante**

**4. DÃ©tecter un cycle dans un graphe**

**Exemples pratiques en cellules Ã  complÃ©ter :**


In [None]:

import heapq
def dijkstra(graph, start):
    dist = {v: float('inf') for v in graph}
    dist[start] = 0
    heap = [(0, start)]
    while heap:
        d, node = heapq.heappop(heap)
        if d > dist[node]: continue
        for neighbor, weight in graph[node]:
            if dist[neighbor] > d + weight:
                dist[neighbor] = d + weight
                heapq.heappush(heap, (dist[neighbor], neighbor))
    return dist

# Graphe pondÃ©rÃ© (exemple)
g2 = {'A': [('B',2), ('C',4)], 'B':[('C',1), ('D',7)], 'C':[('D',3)], 'D':[]}
print("Dijkstra A->", dijkstra(g2, 'A'))


In [None]:

from collections import deque
def rolling_max(arr, k):
    q, res = deque(), []
    for i, x in enumerate(arr):
        while q and arr[q[-1]] < x:
            q.pop()
        q.append(i)
        if q[0] == i-k:
            q.popleft()
        if i >= k-1:
            res.append(arr[q[0]])
    return res

print("Rolling max sur [1,3,-1,-3,5,3,6,7], k=3 :", rolling_max([1,3,-1,-3,5,3,6,7], 3))



---
## ðŸ“‘ **Ã€ retenir pour l'entretienÂ :**

- **Savoir choisir la structure adaptÃ©e (dict, set, deque, heap, Counter)**
- **Savoir coder et expliquer BFS, DFS, Dijkstra (avec heapq)**
- **Rolling mean/max/min : idÃ©al pour signaux, backtest rapide**
- **LRU cache, pattern d'optimisation classique en algo quant**
- **Structurer proprement son code pour passer de l'algo "papier" Ã  un algo Python exploitable en prod**

---
