# Bloc 2 - Structure de donn√©es de base

## Partie 0 - Hashabilit√©

Le langage associe √† chaque objet qui peut l'√™tre un **hash**. Le hash est calcul√© √† base de la valeur de l'objet, en r√©sumant cette valeur pour gagner en vitesse dans certaines op√©rations.

Pour √™tre hashable, un type d'objet doit √™tre **immuable**, aka inchangeable (oppos√© de **mutable**), c-a-d qu'on ne puisse pas le modifier et qu'en fait le langage re-cr√©√© un nouvel objet √† chaque modification. Petit r√©cap sur qq types d'objets :

| Type                  | Mutable ?  | Changement = nouveau objet ? | Hashable ? | Utilisable comme cl√© ? |
| --------------------- | ---------- | ---------------------------- | ---------- | ---------------------- |
| `int`, `str`, `tuple` | ‚ùå Immuable | ‚úÖ Oui                        | ‚úÖ Oui      | ‚úÖ                      |
| `list`, `dict`, `set` | ‚úÖ Oui      | ‚ùå Non (modifi√©s en place)    | ‚ùå Non      | ‚ùå Non                  |


## üß† Partie A ‚Äì Les structures de base natives Python

### list

#### ‚úÖ D√©finition
Une `list` est une s√©quence **mutable** et **ordonn√©e** d‚Äôobjets. Chaque √©l√©ment est accessible par son **index**.

```python
fruits = ["pomme", "banane", "cerise"]
```

#### ‚öôÔ∏è M√©thodes principales

| Op√©ration              | Code                         | Complexit√©  |
| ---------------------- | ---------------------------- | ----------- |
| Acc√®s par index        | `x = fruits[1]`              | O(1)        |
| Modification           | `fruits[0] = "orange"`       | O(1)        |
| Ajout en fin           | `fruits.append("kiwi")`      | O(1) amorti |
| Insertion              | `fruits.insert(1, "mangue")` | O(n)        |
| Suppression par valeur | `fruits.remove("banane")`    | O(n)        |
| Suppression par index  | `del fruits[1]` ou `pop(1)`  | O(n)        |
| Parcours               | `for fruit in fruits:`       | O(n)        |
| Tri                    | `fruits.sort()`              | O(n log n)  |
| V√©rifier appartenance  | `"pomme" in fruits`          | O(n)        |

üß† Points √† retenir
- Une liste peut contenir n'importe quel type d'objet (m√©lange possible, mais √† √©viter pour la clart√©).
- Structure lin√©aire, doubl√©e en m√©moire (r√©allocation automatique ‚Üí append() rapide).
- Utilis√©e pour files, piles simples, tableaux 1D, 2D (liste de listes), buffers, etc.


### `tuple` (n-uplet Python)

#### ‚úÖ D√©finition
Un `tuple` est une s√©quence **immutable** et **ordonn√©e**. Une fois cr√©√©, on ne peut **ni modifier, ni ajouter, ni supprimer** ses √©l√©ments.

```python
coord = (3, 4)
```

Utilis√© pour :
- Des donn√©es fixes (ex. : coordonn√©es, paires cl√©-valeur temporaires, retours de fonctions)
- √ätre une cl√© de dictionnaire (car hashable contrairement √† une list)
- 
#### ‚öôÔ∏è M√©thodes principales
| Op√©ration              | Code               | Complexit√© |
| ---------------------- | ------------------ | ---------- |
| Acc√®s par index        | `x = coord[0]`     | O(1)       |
| Parcours               | `for x in coord:`  | O(n)       |
| Appartenance           | `3 in coord`       | O(n)       |
| Longueur               | `len(coord)`       | O(1)       |
| Index d‚Äôun √©l√©ment     | `coord.index(4)`   | O(n)       |
| Compter une valeur     | `coord.count(3)`   | O(n)       |
| Concat√©nation          | `coord + (5, 6)`   | O(n)       |
| Conversion depuis list | `tuple([1, 2, 3])` | O(n)       |

üß† Points √† retenir
- Immuable ‚Üí plus s√ªr, plus rapide, et utilisable comme cl√© de dict ou √©l√©ment de set.
- Moins de m√©moire que list.
- Tr√®s utilis√© dans les retours de fonctions et en d√©composition multiple :

### `dict` (dictionnaire Python)

#### ‚úÖ D√©finition
Un `dict` est une **table de hachage** qui associe des **cl√©s uniques** √† des **valeurs**. C‚Äôest une structure **non ordonn√©e jusqu‚Äô√† Python 3.6, ordonn√©e depuis 3.7+** (ordre d‚Äôinsertion conserv√©).

```python
capitales = {"France": "Paris", "Japon": "Tokyo"}
```

#### ‚öôÔ∏è M√©thodes principales
| Op√©ration                        | Code                                 | Complexit√© |
| -------------------------------- | ------------------------------------ | ---------- |
| Acc√®s / modif valeur             | `capitales["France"]`                | O(1)       |
| Ajout / modif                    | `capitales["Allemagne"] = "Berlin"`  | O(1)       |
| Suppression                      | `del capitales["Japon"]`             | O(1)       |
| V√©rifier existence d'une cl√©     | `"France" in capitales`              | O(1)       |
| Obtenir liste des cl√©s           | `capitales.keys()`                   | O(1)       |
| Obtenir liste des valeurs        | `capitales.values()`                 | O(1)       |
| Obtenir paires cl√©/valeur        | `capitales.items()`                  | O(1)       |
| Parcourir le dictionnaire        | `for k, v in capitales.items():`     | O(n)       |
| R√©cup√©rer avec valeur par d√©faut | `capitales.get("Italie", "Inconnu")` | O(1)       |
| R√©cup√©rer + supprimer            | `capitales.pop("Japon")`             | O(1)       |
| Vider le dict                    | `capitales.clear()`                  | O(n)       |

üß† Points √† retenir
- Cl√©s doivent √™tre immutables (ex: str, int, tuple) ‚Üí pas de list ou dict comme cl√©.
- Hyper rapide : bas√© sur une table de hachage, donc acc√®s direct par cl√© (O(1)).
- Tr√®s utile pour : indexer des donn√©es, compter, encoder, mapper, parser du JSON, etc.

### `set`

#### D√©finition
Un `set` est une collection **non ordonn√©e** d‚Äô√©l√©ments **uniques** et **hashables**.  
C‚Äôest l‚Äô√©quivalent d‚Äôun dictionnaire sans valeurs associ√©es, uniquement les cl√©s.

#### Propri√©t√©s cl√©s

- Contient des √©l√©ments **uniques** (pas de doublons)
- Les √©l√©ments doivent √™tre **hashables** (immutables)
- Non index√© : pas d‚Äôacc√®s par position (pas de `s[0]`)
- Op√©rations en temps moyen constant pour ajout, suppression et test d‚Äôappartenance (gr√¢ce au hash)

#### Cr√©ation

```python
s = {1, 2, 3}
s2 = set([4, 5, 6])
```

#### M√©thodes principales
| M√©thode             | Description                          | Complexit√© moyenne |
|---------------------|------------------------------------|-------------------|
| `add(x)`            | Ajoute l‚Äô√©l√©ment `x`                | O(1) amorti       |
| `remove(x)`         | Supprime `x` (erreur si absent)    | O(1) amorti       |
| `discard(x)`        | Supprime `x` sans erreur si absent | O(1) amorti       |
| `pop()`             | Retire un √©l√©ment arbitraire        | O(1) amorti       |
| `clear()`           | Vide le set                        | O(n)              |
| `copy()`            | Copie le set                      | O(n)              |
| `update(iterable)`  | Ajoute plusieurs √©l√©ments          | O(k) o√π k = taille iterable |

## Partie B - Structures d√©riv√©es ou sp√©cialis√©es

### Piles et files avec deque (collections)
#### D√©finition

Un `deque` (double-ended queue) est une structure de donn√©es similaire aux **list** mais optimis√©e pour l‚Äôajout et la suppression d‚Äô√©l√©ments **aux deux extr√©mit√©s** en temps constant (O(1) VS O(n) pour list pour pop(O) et insert (0, x))

C‚Äôest plus performant qu‚Äôune liste Python classique quand on travaille en file ou pile, car les op√©rations en t√™te de liste sont co√ªteuses avec une `list`.

---

#### Import et cr√©ation

```python
from collections import deque

d = deque()          # cr√©e un deque vide
d2 = deque([1, 2, 3])  # cr√©e un deque initialis√©
```

#### Principales op√©rations
| M√©thode                | Description                                        | Complexit√© |
| ---------------------- | -------------------------------------------------- | ---------- |
| `append(x)`            | Ajoute `x` √† la **fin**                            | O(1)       |
| `appendleft(x)`        | Ajoute `x` au **d√©but**                            | O(1)       |
| `pop()`                | Retire et renvoie l‚Äô√©l√©ment de la **fin**          | O(1)       |
| `popleft()`            | Retire et renvoie l‚Äô√©l√©ment du **d√©but**           | O(1)       |
| `extend(iterable)`     | Ajoute plusieurs √©l√©ments √† la fin                 | O(k)       |
| `extendleft(iterable)` | Ajoute plusieurs √©l√©ments au d√©but (ordre invers√©) | O(k)       |
| `clear()`              | Vide le deque                                      | O(n)       |

Utilisations classiques : 
- Pile (LIFO) : append() + pop()
- File (FIFO) : append() + popleft()

### Heaps (avec `heapq`)

### D√©finition

Un **tas** (heap) est une structure de donn√©es qui maintient un ordre partiel :  
- En Python, le module `heapq` impl√©mente un **min-heap**, c'est-√†-dire que le **plus petit √©l√©ment est toujours √† la racine** (index 0)
- Liste pas totalement tri√©e; lesautres √©l√©ments ne sont pas class√©s juste le 1er
- Pour faire un **max-heap**, utiliser `heapq`mais en sotckant l'inverse math√©matique des valeurs.

Un heap est souvent utilis√© pour :
- Obtenir rapidement le plus petit (ou plus grand) √©l√©ment
- Impl√©menter une file de priorit√© efficace

### Import et cr√©ation

```python
import heapq

heap = []
heapq.heappush(heap, 3)
heapq.heappush(heap, 1)
heapq.heappush(heap, 5)
print(heap)  # [1, 3, 5]
```

### M√©thodes principales : 
| Fonction                 | Description                                | Complexit√© |
| ------------------------ | ------------------------------------------ | ---------- |
| `heappush(heap, x)`      | Ajoute `x` dans le heap                    | O(log n)   |
| `heappop(heap)`          | Retire et retourne le plus petit √©l√©ment   | O(log n)   |
| `heappushpop(heap, x)`   | Push + Pop en une seule op√©ration efficace | O(log n)   |
| `heapify(lst)`           | Transforme une liste en min-heap           | O(n)       |
| `heapreplace(heap, x)`   | Pop puis push (moins efficace si x < top)  | O(log n)   |
| `nlargest(n, iterable)`  | n plus grands √©l√©ments                     | O(n log k) |
| `nsmallest(n, iterable)` | n plus petits √©l√©ments                     | O(n log k) |

Pour info, list.sort() est en O(nlog(n))

### Multi-set (ensemble avec comptage)

#### D√©finition

Un **multi-set** (ou "bag") est comme un `set`, **mais qui compte les occurrences** de chaque √©l√©ment.  
Exemple :  
`["a", "b", "a", "c", "b", "a"]` ‚Üí `"a"` appara√Æt 3 fois, `"b"` 2 fois, `"c"` 1 fois.

---

#### Cr√©ation standard : `collections.Counter`

```python
from collections import Counter

data = ["a", "b", "a", "c", "b", "a"]
counter = Counter(data)
print(counter)  # Counter({'a': 3, 'b': 2, 'c': 1})
```
C‚Äôest un **dict** sp√©cial o√π les valeurs sont des **comptages d‚Äôoccurrence**.

#### Op√©rations utiles : 
| M√©thode / Op√©ration          | Description                               | Complexit√©                               |      |
| ---------------------------- | ----------------------------------------- | ---------------------------------------- | ---- |
| `counter[key]`               | Acc√®s au nombre d‚Äôoccurrences             | O(1)                                     |      |
| `counter.update(iterable)`   | Ajoute les comptages d‚Äôun autre iterable  | O(n)                                     |      |
| `counter.subtract(iterable)` | Soustrait les comptages                   | O(n)                                     |      |
| `+` / `-` / `&` / \`         | \`                                        | Op√©rations entre `Counter` (union, etc.) | O(n) |
| `most_common(k)`             | Renvoie les k √©l√©ments les plus fr√©quents | O(n log k)                               |      |
| `elements()`                 | It√®re sur tous les √©l√©ments               | O(n)                                     |      |

### Tableaux 2D et Matrices

#### D√©finition

Une **matrice** en Python est g√©n√©ralement repr√©sent√©e par une **liste de listes** :  
Chaque ligne est une liste, et la matrice est une liste de ces lignes.

```python
matrice = [
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
]
```

Liens utiles pour matrices num√©riques
- `numpy` pour Matrices num√©riques, op√©rations rapides
- `pandas` pour Donn√©es tabulaires (DataFrames), c-a-d donn√©es organis√©es en lignes et colonnes, comme dans Excel ou une BDD.

### Numpy, fonctions utiles :
| Fonction                   | Description                                   | Complexit√© approx. |
|---------------------------|-----------------------------------------------|--------------------|
| `A.T`                     | Transpos√©e                                    | O(n √ó m)           |
| `np.dot(A, B)` ou `A @ B` | Produit matriciel                             | O(n √ó m √ó p)       |
| `np.linalg.inv(A)`        | Inverse d‚Äôune matrice                         | O(n¬≥)              |
| `np.linalg.det(A)`        | D√©terminant                                   | O(n¬≥)              |
| `np.diag(A)`              | Extrait la diagonale                          | O(n)               |
| `np.diag(v)`              | Cr√©e matrice diagonale depuis vecteur         | O(n¬≤)              |
| `np.linalg.eig(A)`        | Diagonalisation (valeurs & vecteurs propres)  | O(n¬≥)              |
| `np.trace(A)`             | Somme des √©l√©ments diagonaux                  | O(n)               |
| `np.linalg.norm(A)`       | Norme (euclidienne par d√©faut)                | O(n √ó m)           |
| `np.linalg.solve(A, B)`   | R√©sout AX = B                                 | O(n¬≥)              |
| `np.linalg.svd(A)`        | D√©composition SVD                             | O(n¬≤ √ó m)          |

### Pandas, fonctions utiles : 
| Fonction                       | Description                                    | Complexit√© approx. |
|-------------------------------|------------------------------------------------|--------------------|
| `df["col"]`                   | Acc√®s √† une colonne                           | O(1)               |
| `df.loc[i]` / `df.iloc[i]`    | Acc√®s √† une ligne                             | O(1)               |
| `df.sort_values("col")`       | Tri d‚Äôapr√®s une colonne                       | O(n log n)         |
| `df.drop(...)`                | Supprimer lignes / colonnes                   | O(n)               |
| `df.fillna(...)`              | Remplir les NaN (valeurs manquantes)          | O(n)               |
| `df.isna()`                   | D√©tection de NaN                              | O(n)               |
| `df.groupby("col")`           | Regroupement + aggr√©gation                    | O(n)               |
| `df.merge(...)`               | Jointure entre 2 DataFrames                   | O(n log n)         |
| `df.apply(func)`              | Appliquer fonction ligne / colonne            | O(n) ou +          |
| `df.describe()`               | Statistiques de base                          | O(n)               |
| `df.to_csv(...)`              | Export CSV                                    | O(n)               |
| `pd.read_csv(...)`            | Lecture CSV                                   | O(n)               |