# Bloc 2 - Structure de données de base

## Partie 0 - Hashabilité

Le langage associe à chaque objet qui peut l'être un **hash**. Le hash est calculé à base de la valeur de l'objet, en résumant cette valeur pour gagner en vitesse dans certaines opérations.

Pour être hashable, un type d'objet doit être **immuable**, aka inchangeable (opposé de **mutable**), c-a-d qu'on ne puisse pas le modifier et qu'en fait le langage re-créé un nouvel objet à chaque modification. Petit récap sur qq types d'objets :

| Type                  | Mutable ?  | Changement = nouveau objet ? | Hashable ? | Utilisable comme clé ? |
| --------------------- | ---------- | ---------------------------- | ---------- | ---------------------- |
| `int`, `str`, `tuple` | ❌ Immuable | ✅ Oui                        | ✅ Oui      | ✅                      |
| `list`, `dict`, `set` | ✅ Oui      | ❌ Non (modifiés en place)    | ❌ Non      | ❌ Non                  |


## 🧠 Partie A – Les structures de base natives Python

### list

#### ✅ Définition
Une `list` est une séquence **mutable** et **ordonnée** d’objets. Chaque élément est accessible par son **index**.

```python
fruits = ["pomme", "banane", "cerise"]
```

#### ⚙️ Méthodes principales

| Opération              | Code                         | Complexité  |
| ---------------------- | ---------------------------- | ----------- |
| Accès par index        | `x = fruits[1]`              | O(1)        |
| Modification           | `fruits[0] = "orange"`       | O(1)        |
| Ajout en fin           | `fruits.append("kiwi")`      | O(1) amorti |
| Insertion              | `fruits.insert(1, "mangue")` | O(n)        |
| Suppression par valeur | `fruits.remove("banane")`    | O(n)        |
| Suppression par index  | `del fruits[1]` ou `pop(1)`  | O(n)        |
| Parcours               | `for fruit in fruits:`       | O(n)        |
| Tri                    | `fruits.sort()`              | O(n log n)  |
| Vérifier appartenance  | `"pomme" in fruits`          | O(n)        |

🧠 Points à retenir
- Une liste peut contenir n'importe quel type d'objet (mélange possible, mais à éviter pour la clarté).
- Structure linéaire, doublée en mémoire (réallocation automatique → append() rapide).
- Utilisée pour files, piles simples, tableaux 1D, 2D (liste de listes), buffers, etc.


### `tuple` (n-uplet Python)

#### ✅ Définition
Un `tuple` est une séquence **immutable** et **ordonnée**. Une fois créé, on ne peut **ni modifier, ni ajouter, ni supprimer** ses éléments.

```python
coord = (3, 4)
```

Utilisé pour :
- Des données fixes (ex. : coordonnées, paires clé-valeur temporaires, retours de fonctions)
- Être une clé de dictionnaire (car hashable contrairement à une list)
- 
#### ⚙️ Méthodes principales
| Opération              | Code               | Complexité |
| ---------------------- | ------------------ | ---------- |
| Accès par index        | `x = coord[0]`     | O(1)       |
| Parcours               | `for x in coord:`  | O(n)       |
| Appartenance           | `3 in coord`       | O(n)       |
| Longueur               | `len(coord)`       | O(1)       |
| Index d’un élément     | `coord.index(4)`   | O(n)       |
| Compter une valeur     | `coord.count(3)`   | O(n)       |
| Concaténation          | `coord + (5, 6)`   | O(n)       |
| Conversion depuis list | `tuple([1, 2, 3])` | O(n)       |

🧠 Points à retenir
- Immuable → plus sûr, plus rapide, et utilisable comme clé de dict ou élément de set.
- Moins de mémoire que list.
- Très utilisé dans les retours de fonctions et en décomposition multiple :

### `dict` (dictionnaire Python)

#### ✅ Définition
Un `dict` est une **table de hachage** qui associe des **clés uniques** à des **valeurs**. C’est une structure **non ordonnée jusqu’à Python 3.6, ordonnée depuis 3.7+** (ordre d’insertion conservé).

```python
capitales = {"France": "Paris", "Japon": "Tokyo"}
```

#### ⚙️ Méthodes principales
| Opération                        | Code                                 | Complexité |
| -------------------------------- | ------------------------------------ | ---------- |
| Accès / modif valeur             | `capitales["France"]`                | O(1)       |
| Ajout / modif                    | `capitales["Allemagne"] = "Berlin"`  | O(1)       |
| Suppression                      | `del capitales["Japon"]`             | O(1)       |
| Vérifier existence d'une clé     | `"France" in capitales`              | O(1)       |
| Obtenir liste des clés           | `capitales.keys()`                   | O(1)       |
| Obtenir liste des valeurs        | `capitales.values()`                 | O(1)       |
| Obtenir paires clé/valeur        | `capitales.items()`                  | O(1)       |
| Parcourir le dictionnaire        | `for k, v in capitales.items():`     | O(n)       |
| Récupérer avec valeur par défaut | `capitales.get("Italie", "Inconnu")` | O(1)       |
| Récupérer + supprimer            | `capitales.pop("Japon")`             | O(1)       |
| Vider le dict                    | `capitales.clear()`                  | O(n)       |

🧠 Points à retenir
- Clés doivent être immutables (ex: str, int, tuple) → pas de list ou dict comme clé.
- Hyper rapide : basé sur une table de hachage, donc accès direct par clé (O(1)).
- Très utile pour : indexer des données, compter, encoder, mapper, parser du JSON, etc.

### `set`

#### Définition
Un `set` est une collection **non ordonnée** d’éléments **uniques** et **hashables**.  
C’est l’équivalent d’un dictionnaire sans valeurs associées, uniquement les clés.

#### Propriétés clés

- Contient des éléments **uniques** (pas de doublons)
- Les éléments doivent être **hashables** (immutables)
- Non indexé : pas d’accès par position (pas de `s[0]`)
- Opérations en temps moyen constant pour ajout, suppression et test d’appartenance (grâce au hash)

#### Création

```python
s = {1, 2, 3}
s2 = set([4, 5, 6])
```

#### Méthodes principales
| Méthode             | Description                          | Complexité moyenne |
|---------------------|------------------------------------|-------------------|
| `add(x)`            | Ajoute l’élément `x`                | O(1) amorti       |
| `remove(x)`         | Supprime `x` (erreur si absent)    | O(1) amorti       |
| `discard(x)`        | Supprime `x` sans erreur si absent | O(1) amorti       |
| `pop()`             | Retire un élément arbitraire        | O(1) amorti       |
| `clear()`           | Vide le set                        | O(n)              |
| `copy()`            | Copie le set                      | O(n)              |
| `update(iterable)`  | Ajoute plusieurs éléments          | O(k) où k = taille iterable |

## Partie B - Structures dérivées ou spécialisées

### Piles et files avec deque (collections)
#### Définition

Un `deque` (double-ended queue) est une structure de données similaire aux **list** mais optimisée pour l’ajout et la suppression d’éléments **aux deux extrémités** en temps constant (O(1) VS O(n) pour list pour pop(O) et insert (0, x))

C’est plus performant qu’une liste Python classique quand on travaille en file ou pile, car les opérations en tête de liste sont coûteuses avec une `list`.

---

#### Import et création

```python
from collections import deque

d = deque()          # crée un deque vide
d2 = deque([1, 2, 3])  # crée un deque initialisé
```

#### Principales opérations
| Méthode                | Description                                        | Complexité |
| ---------------------- | -------------------------------------------------- | ---------- |
| `append(x)`            | Ajoute `x` à la **fin**                            | O(1)       |
| `appendleft(x)`        | Ajoute `x` au **début**                            | O(1)       |
| `pop()`                | Retire et renvoie l’élément de la **fin**          | O(1)       |
| `popleft()`            | Retire et renvoie l’élément du **début**           | O(1)       |
| `extend(iterable)`     | Ajoute plusieurs éléments à la fin                 | O(k)       |
| `extendleft(iterable)` | Ajoute plusieurs éléments au début (ordre inversé) | O(k)       |
| `clear()`              | Vide le deque                                      | O(n)       |

Utilisations classiques : 
- Pile (LIFO) : append() + pop()
- File (FIFO) : append() + popleft()

### Heaps (avec `heapq`)

### Définition

Un **tas** (heap) est une structure de données qui maintient un ordre partiel :  
- En Python, le module `heapq` implémente un **min-heap**, c'est-à-dire que le **plus petit élément est toujours à la racine** (index 0)
- Liste pas totalement triée; lesautres éléments ne sont pas classés juste le 1er
- Pour faire un **max-heap**, utiliser `heapq`mais en sotckant l'inverse mathématique des valeurs.

Un heap est souvent utilisé pour :
- Obtenir rapidement le plus petit (ou plus grand) élément
- Implémenter une file de priorité efficace

### Import et création

```python
import heapq

heap = []
heapq.heappush(heap, 3)
heapq.heappush(heap, 1)
heapq.heappush(heap, 5)
print(heap)  # [1, 3, 5]
```

### Méthodes principales : 
| Fonction                 | Description                                | Complexité |
| ------------------------ | ------------------------------------------ | ---------- |
| `heappush(heap, x)`      | Ajoute `x` dans le heap                    | O(log n)   |
| `heappop(heap)`          | Retire et retourne le plus petit élément   | O(log n)   |
| `heappushpop(heap, x)`   | Push + Pop en une seule opération efficace | O(log n)   |
| `heapify(lst)`           | Transforme une liste en min-heap           | O(n)       |
| `heapreplace(heap, x)`   | Pop puis push (moins efficace si x < top)  | O(log n)   |
| `nlargest(n, iterable)`  | n plus grands éléments                     | O(n log k) |
| `nsmallest(n, iterable)` | n plus petits éléments                     | O(n log k) |

Pour info, list.sort() est en O(nlog(n))

### Multi-set (ensemble avec comptage)

#### Définition

Un **multi-set** (ou "bag") est comme un `set`, **mais qui compte les occurrences** de chaque élément.  
Exemple :  
`["a", "b", "a", "c", "b", "a"]` → `"a"` apparaît 3 fois, `"b"` 2 fois, `"c"` 1 fois.

---

#### Création standard : `collections.Counter`

```python
from collections import Counter

data = ["a", "b", "a", "c", "b", "a"]
counter = Counter(data)
print(counter)  # Counter({'a': 3, 'b': 2, 'c': 1})
```
C’est un **dict** spécial où les valeurs sont des **comptages d’occurrence**.

#### Opérations utiles : 
| Méthode / Opération          | Description                               | Complexité                               |      |
| ---------------------------- | ----------------------------------------- | ---------------------------------------- | ---- |
| `counter[key]`               | Accès au nombre d’occurrences             | O(1)                                     |      |
| `counter.update(iterable)`   | Ajoute les comptages d’un autre iterable  | O(n)                                     |      |
| `counter.subtract(iterable)` | Soustrait les comptages                   | O(n)                                     |      |
| `+` / `-` / `&` / \`         | \`                                        | Opérations entre `Counter` (union, etc.) | O(n) |
| `most_common(k)`             | Renvoie les k éléments les plus fréquents | O(n log k)                               |      |
| `elements()`                 | Itère sur tous les éléments               | O(n)                                     |      |

### Tableaux 2D et Matrices

#### Définition

Une **matrice** en Python est généralement représentée par une **liste de listes** :  
Chaque ligne est une liste, et la matrice est une liste de ces lignes.

```python
matrice = [
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
]
```

Liens utiles pour matrices numériques
- `numpy` pour Matrices numériques, opérations rapides
- `pandas` pour Données tabulaires (DataFrames), c-a-d données organisées en lignes et colonnes, comme dans Excel ou une BDD.

### Numpy, fonctions utiles :
| Fonction                   | Description                                   | Complexité approx. |
|---------------------------|-----------------------------------------------|--------------------|
| `A.T`                     | Transposée                                    | O(n × m)           |
| `np.dot(A, B)` ou `A @ B` | Produit matriciel                             | O(n × m × p)       |
| `np.linalg.inv(A)`        | Inverse d’une matrice                         | O(n³)              |
| `np.linalg.det(A)`        | Déterminant                                   | O(n³)              |
| `np.diag(A)`              | Extrait la diagonale                          | O(n)               |
| `np.diag(v)`              | Crée matrice diagonale depuis vecteur         | O(n²)              |
| `np.linalg.eig(A)`        | Diagonalisation (valeurs & vecteurs propres)  | O(n³)              |
| `np.trace(A)`             | Somme des éléments diagonaux                  | O(n)               |
| `np.linalg.norm(A)`       | Norme (euclidienne par défaut)                | O(n × m)           |
| `np.linalg.solve(A, B)`   | Résout AX = B                                 | O(n³)              |
| `np.linalg.svd(A)`        | Décomposition SVD                             | O(n² × m)          |

### Pandas, fonctions utiles : 
| Fonction                       | Description                                    | Complexité approx. |
|-------------------------------|------------------------------------------------|--------------------|
| `df["col"]`                   | Accès à une colonne                           | O(1)               |
| `df.loc[i]` / `df.iloc[i]`    | Accès à une ligne                             | O(1)               |
| `df.sort_values("col")`       | Tri d’après une colonne                       | O(n log n)         |
| `df.drop(...)`                | Supprimer lignes / colonnes                   | O(n)               |
| `df.fillna(...)`              | Remplir les NaN (valeurs manquantes)          | O(n)               |
| `df.isna()`                   | Détection de NaN                              | O(n)               |
| `df.groupby("col")`           | Regroupement + aggrégation                    | O(n)               |
| `df.merge(...)`               | Jointure entre 2 DataFrames                   | O(n log n)         |
| `df.apply(func)`              | Appliquer fonction ligne / colonne            | O(n) ou +          |
| `df.describe()`               | Statistiques de base                          | O(n)               |
| `df.to_csv(...)`              | Export CSV                                    | O(n)               |
| `pd.read_csv(...)`            | Lecture CSV                                   | O(n)               |