# Séminaire 3 : Bases de Python II — Structures de données
**Algorithmique & Structures de données — Université de Genève**

---

## Objectifs d'apprentissage

À la fin de ce séminaire vous serez capable de :

- Utiliser les structures de données intégrées de Python : listes, tuples, dictionnaires, ensembles
- Définir et appeler des fonctions avec des paramètres positionnels, par défaut, `*args` et `**kwargs`
- Définir des classes avec `__init__`, attributs et méthodes
- Choisir la bonne structure de données pour un problème donné
- Comprendre les concepts de base de la POO : encapsulation et abstraction

---

## Partie 1 : Théorie

## 3.1 Listes

Une **liste** en Python est un conteneur qui stocke plusieurs valeurs.

```python
numbers = [1, 2, 3, 4]
```

Les listes sont :
- **Ordonnées** → Conservent l'ordre d'insertion  
- **Mutables** → Peuvent être modifiées  
- **Flexibles** → Peuvent contenir des types mixtes  
- **Redimensionnables** → Peuvent grandir et se réduire dynamiquement  

```python
lst = [1, "hello", 3.14]
```

Imaginez une liste comme des cases indexées :

```
[ 10 | 20 | 30 | 40 ]
   0    1    2    3
```

Vous pouvez accéder directement aux positions, ajouter à la fin est rapide, insérer au milieu est plus lent (les éléments se décalent).

**Opérations courantes :**

```python
lst[i]          # access (fast)
lst.append(x)   # add at end (fast)
lst.insert(i,x) # insert at position (slower)
lst.remove(x)   # remove by value
lst.pop()       # remove last
lst.pop(i)      # remove at index
x in lst        # search
lst.sort()      # sort
lst[a:b]        # slice
```

In [None]:
# --- List creation ---
empty_list = []
numbers = [4, 2, 7, 1, 9, 3, 6]
mixed = [1, "hello", 3.14, True, None]   # heterogeneous (avoid in practice)
from_range = range(1, 8)

print(f"numbers: {numbers}")
print(f"from_range: {from_range}")

# --- Indexing ---
print(f"\nnumbers[0]  = {numbers[0]}"    )  # first element
print(f"numbers[-1] = {numbers[-1]}")     # last element  (negative indexing)
print(f"numbers[-2] = {numbers[-2]}")     # second-to-last

# --- Slicing: lst[start:stop:step] ---
print(f"\nnumbers[2:5]   = {numbers[2:5]}"   )  # indices 2,3,4
print(f"numbers[:3]    = {numbers[:3]}"    )  # first 3
print(f"numbers[4:]    = {numbers[4:]}"    )  # from index 4 to end
print(f"numbers[::2]   = {numbers[::2]}"   )  # every 2nd element
print(f"numbers[::-1]  = {numbers[::-1]}"  )  # reversed!

# --- Mutating methods ---
lst = [3, 1, 4, 1, 5, 9, 2, 6]
print(f"\nOriginal: {lst}")

lst.append(7)         # add to end
print(f"After append(7):       {lst}")

lst.insert(0, 0)      # insert 0 at index 0
print(f"After insert(0, 0):    {lst}")

removed = lst.pop()   # removes and returns the last element
print(f"After pop():           {lst}  (removed: {removed})")

lst.remove(1)         # removes first occurrence of 1
print(f"After remove(1):       {lst}")

lst.sort()            # in-place sort (modifies lst)
print(f"After sort():          {lst}")

sorted_copy = sorted(numbers)  # sorted() returns a NEW list
print(f"sorted(numbers):       {sorted_copy}   (original unchanged: {numbers})")

lst.reverse()         # in-place reverse
print(f"After reverse():       {lst}")

# --- Useful functions ---
print(f"\nlen(numbers) = {len(numbers)}")
print(f"sum(numbers) = {sum(numbers)}")
print(f"min(numbers) = {min(numbers)}")
print(f"max(numbers) = {max(numbers)}")
print(f"9 in numbers: {9 in numbers}")
print(f"numbers.index(9): {numbers.index(9)}")  # first index of value 9
print(f"numbers.count(9): {numbers.count(9)}")   # how many times 9 appears

## 3.2 Tuples — Séquences immuables

Un **tuple** est comme une liste, mais **immuable** — une fois créé, ses éléments ne peuvent pas être modifiés. Utilisez des tuples lorsque vous voulez :
- Garantir que les données ne seront pas modifiées accidentellement
- Utiliser une collection comme **clé de dictionnaire** (les listes ne sont pas hachables, les tuples le sont)
- Retourner plusieurs valeurs depuis une fonction
- Représenter un enregistrement fixe (par ex. `(lat, lon)`, `(name, age)`)

### Emballage et déballage

```python
point = (3, 7)         # packing
x, y = point           # unpacking
```

L'affectation multiple de Python utilise l'empaquetage/dépaquetage de tuples en interne :
```python
a, b = b, a            # swap without a temp variable!
```

In [None]:
# --- Tuple creation ---
empty_tuple = ()          # or: tuple()
single = (42,)            # ONE-element tuple needs a trailing comma!
point_2d = (3.0, 7.5)
rgb = (255, 128, 0)       # orange colour
record = ("Alice", 21, "CS")  # student record

print(f"point_2d: {point_2d}")
print(f"rgb:      {rgb}")
print(f"record:   {record}")

# Single element gotcha:
not_a_tuple = (42)     # This is just the integer 42 in parentheses
is_a_tuple  = (42,)    # This is a tuple with one element
print(f"\n(42)  → type: {type(not_a_tuple)}")
print(f"(42,) → type: {type(is_a_tuple)}")

# --- Indexing (same as lists) ---
print(f"\npoint_2d[0] = {point_2d[0]}")
print(f"point_2d[1] = {point_2d[1]}")
print(f"record[-1]  = {record[-1]}")  # last element

# --- Immutability ---
try:
    point_2d[0] = 99   # TypeError!
except TypeError as e:
    print(f"\nTypeError: {e}")

# --- Unpacking ---
x, y = point_2d
print(f"\nUnpacked point: x={x}, y={y}")

name, age, major = record
print(f"Unpacked record: name={name}, age={age}, major={major}")

# Extended unpacking with *
first, *rest = [1, 2, 3, 4, 5]
print(f"\nfirst={first}, rest={rest}")

*beginning, last = [1, 2, 3, 4, 5]
print(f"beginning={beginning}, last={last}")

# --- Pythonic swap ---
a, b = 10, 20
print(f"\nBefore swap: a={a}, b={b}")
a, b = b, a   # tuple packing/unpacking under the hood
print(f"After swap:  a={a}, b={b}")

# --- Functions returning multiple values (tuples) ---
def min_and_max(lst):
    """Return (minimum, maximum) of a list."""
    return min(lst), max(lst)   # returns a tuple


data = [4, 2, 9, 1, 7]
lo, hi = min_and_max(data)    # unpack the returned tuple
print(f"\nData: {data}")
print(f"min={lo}, max={hi}")

## 3.3 Dictionnaires — Stockage clé-valeur

Un **dictionnaire** (`dict`) associe des **clés** à des **valeurs**. Depuis Python 3.7 il est aussi **ordonné** selon l'ordre d'insertion.

- Les clés doivent être **hachables** (immutables) : les chaînes, nombres, tuples conviennent ; les listes non
- Les valeurs peuvent être n'importe quoi — y compris d'autres dictionnaires, listes, ou même des fonctions
- La recherche par clé est **O(1)** en moyenne (implémentation en table de hachage)

### Cas d'utilisation courants

- Compter des fréquences (`word → count`)
- Mise en cache / mémoïsation (`input → result`)
- Enregistrements structurés (`field → value`)
- Listes d'adjacence de graphe (`node → [neighbours]`)

In [None]:
from collections import Counter

# --- Creating dicts ---
empty_dict = {}
student = {"name": "Alice", "age": 21, "major": "CS", "gpa": 3.8}
from_pairs = dict([("a", 1), ("b", 2), ("c", 3)])  # from list of tuples
using_dict = dict(x=10, y=20)  # keyword arguments

print(f"student:     {student}")
print(f"from_pairs:  {from_pairs}")

# --- Access ---
print(f"\nstudent['name'] = {student['name']}")

# .get() is safer: returns None (or a default) if key doesn't exist
print(f"student.get('gpa')        = {student.get('gpa')}")
print(f"student.get('phone')      = {student.get('phone')}")
print(f"student.get('phone', 'N/A') = {student.get('phone', 'N/A')}")

# --- Modify / add / delete ---
student["age"] = 22           # modify existing key
student["email"] = "a@unige.ch" # add new key
del student["major"]          # delete a key
print(f"\nModified student: {student}")

popped = student.pop("email")  # remove and return a value
print(f"Popped email: {popped}")

# --- Iteration ---
print("\nIterating:")
for key in student.keys():         # or just: for key in student
    print(f"  key: {key}")

for value in student.values():
    print(f"  value: {value}")

for key, value in student.items():  # most common — unpack both
    print(f"  {key}: {value}")

# --- Nested dicts ---
course_db = {
    "CS101": {"name": "Algorithmics", "students": 45, "instructor": "Prof. Smith"},
    "CS201": {"name": "Databases",    "students": 38, "instructor": "Prof. Jones"},
}
print(f"\nCS101 instructor: {course_db['CS101']['instructor']}")

# --- dict comprehension ---
word_lengths = {word: len(word) for word in ["hello", "world", "python"]}
print(f"Word lengths: {word_lengths}")

# --- Frequency counter (important pattern!) ---
sentence = "the quick brown fox jumps over the lazy dog"
word_freq = {}
for word in sentence.split():
    word_freq[word] = word_freq.get(word, 0) + 1

print(f"\nWord frequencies: {word_freq}")

# Tip: Python's collections.Counter does this automatically:
counter = Counter(sentence.split())
print(f"Most common 3: {counter.most_common(3)}")

## 3.4 Ensembles — Collections d'éléments uniques

Un **ensemble** est une collection non ordonnée d'éléments **uniques**. Il est implémenté comme une table de hachage, donc :
- **O(1)** test d'appartenance moyen (`x in s`)
- **O(1)** ajout/suppression moyen
- **Pas d'éléments dupliqués** — ajouter un élément existant n'a pas d'effet
- **Pas d'indexation** — les ensembles ne sont pas ordonnés

### Opérations sur les ensembles (mathématiques)

| Operation | Syntax | Symbol |
|-----------|--------|-------|
| Union | `a | b` or `a.union(b)` | A ∪ B |
| Intersection | `a & b` or `a.intersection(b)` | A ∩ B |
| Difference | `a - b` or `a.difference(b)` | A \ B |
| Symmetric diff | `a ^ b` or `a.symmetric_difference(b)` | A △ B |
| Subset | `a <= b` or `a.issubset(b)` | A ⊆ B |

In [None]:
# --- Creating sets ---
from_list = set([1, 2, 2, 3, 3, 3])   # duplicates removed!
print(f"from_list: {from_list}  (duplicates removed)")

# --- Uniqueness ---
words = ["apple", "banana", "apple", "cherry", "banana", "date"]
unique_words = set(words)
print(f"\nOriginal list: {words}")
print(f"Unique set:    {unique_words}")

# --- Add / remove ---
s = {1, 2, 3}
s.add(4)        # add one element
s.add(2)        # adding an existing element is a no-op
s.discard(10)   # discard: no error if element not present
print(f"\nAfter add(4) and add(2): {s}")

# --- Set operations ---
a = {1, 2, 3, 4, 5}
b = {4, 5, 6, 7, 8}

print(f"\na = {a}")
print(f"b = {b}")
print(f"a | b  (union):              {a | b}")
print(f"a & b  (intersection):       {a & b}")
print(f"a - b  (difference A\\B):     {a - b}")
print(f"b - a  (difference B\\A):     {b - a}")
print(f"a ^ b  (symmetric diff):     {a ^ b}")

# --- Subset / superset ---
small = {2, 3}
large = {1, 2, 3, 4}
print(f"\n{small} is subset of {large}: {small <= large}")
print(f"{large} is superset of {small}: {large >= small}")

# --- Membership test: O(1) vs list O(n) ---

big_list = list(range(100_000))
big_set = set(big_list)

list_time = timeit.timeit("99_999 in big_list", globals=globals(), number=10_000)
set_time  = timeit.timeit("99_999 in big_set",  globals=globals(), number=10_000)

print(f"\nMembership test (100k elements, 10k repetitions):")
print(f"  list: {list_time:.4f}s")
print(f"  set:  {set_time:.6f}s")
print(f"  Speedup: {list_time / set_time:.0f}x")

## 3.5 Fonctions

Une **fonction** est un bloc réutilisable de code qui :
- Prend zéro ou plusieurs **paramètres** (entrées)
- Exécute une logique
- Retourne éventuellement une valeur (sans `return`, une fonction renvoie `None`)

### Types de paramètres

```python
def example(positional, default=10, *args, **kwargs):
    pass
```

| Type | Syntax | Description |
|------|--------|-------------|
| Positionnel | `def f(a, b)` | Requis, passé par position |
| Par défaut | `def f(a, b=10)` | Optionnel, a une valeur de secours |
| `*args` | `def f(*args)` | Capture les arguments positionnels supplémentaires sous forme de tuple |
| `**kwargs` | `def f(**kwargs)` | Capture les arguments nommés supplémentaires sous forme de dict |
| Keyword-only | `def f(a, *, kw)` | Doit être passé par nom (après `*`) |

### Docstrings

Documentez toujours vos fonctions. Utilisez le format entre triples guillemets :

```python
def my_function(x):
    """One-line summary.

    Longer description if needed.

    Parameters
    ----------
    x : int
        Description of x.

    Returns
    -------
    int
        Description of return value.
    """
```

In [None]:
# --- Basic function ---
def greet(name, greeting="Hello"):
    """Return a greeting string."""
    return f"{greeting}, {name}!"


print(greet("Alice"))                # uses default greeting
print(greet("Bob", "Good morning"))  # overrides default
print(greet(greeting="Hi", name="Carol"))  # keyword arguments (order doesn't matter)

print()

# --- *args: variable number of positional arguments ---
def my_sum(*args):
    """Sum any number of arguments."""
    total = 0
    for num in args:   # args is a tuple
        total += num
    return total


print(f"my_sum(1, 2):          {my_sum(1, 2)}")
print(f"my_sum(1, 2, 3, 4, 5): {my_sum(1, 2, 3, 4, 5)}")
print(f"my_sum():              {my_sum()}")

print()

# --- **kwargs: variable number of keyword arguments ---
def print_info(**kwargs):
    """Print key-value pairs from keyword arguments."""
    for key, value in kwargs.items():   # kwargs is a dict
        print(f"  {key}: {value}")


print("Student info:")
print_info(name="Alice", age=21, gpa=3.8, major="CS")

print()

# --- Combining all parameter types ---
def full_example(required, default=42, *args, keyword_only="kw", **kwargs):
    """Demonstrate all parameter types."""
    print(f"  required:     {required}")
    print(f"  default:      {default}")
    print(f"  *args:        {args}")
    print(f"  keyword_only: {keyword_only}")
    print(f"  **kwargs:     {kwargs}")


print("full_example call:")
full_example("hello", 99, "extra1", "extra2", keyword_only="custom", x=1, y=2)

print()

# --- Type hints (Python 3.5+) ---
def add(a: int, b: int) -> int:
    """Add two integers and return the result."""
    return a + b


# Type hints are NOT enforced at runtime, but help IDEs and static analysers
print(f"add(3, 4) = {add(3, 4)}")

# --- Lambda functions (anonymous one-liners) ---
square = lambda x: x ** 2
print(f"square(7) = {square(7)}")

# Most common use: as a sort key
students = [("Alice", 3.8), ("Bob", 3.5), ("Carol", 3.9)]
students.sort(key=lambda s: s[1], reverse=True)  # sort by GPA descending
print(f"Sorted by GPA: {students}")

## 3.6 Classes et Programmation Orientée Objet

Une **classe** est un plan pour créer des objets. Un **objet** (ou **instance**) est une réalisation concrète de ce plan.

### Concepts clés de la POO

| Concept | Signification |
|---------|---------------|
| **Encapsulation** | Regrouper les données (attributs) et le comportement (méthodes) |
| **Abstraction** | Masquer les détails d'implémentation ; n'exposer qu'une interface propre |
| **Héritage** | Une classe hérite des attributs/méthodes d'une classe parente |
| **Polymorphisme** | Différentes classes implémentant la même interface différemment |

### Anatomie d'une classe

```python
class MyClass:
    class_attribute = 0     # shared by all instances

    def __init__(self, value):  # constructor — called when object is created
        self.value = value      # instance attribute — unique to each object

    def my_method(self):        # 'self' always refers to the current instance
        return self.value

    def __str__(self):          # human-readable string (used by print())
        return str(self.value)
```

In [None]:
# --- A complete class example: BankAccount ---

class BankAccount:
    """A simple bank account with deposit, withdraw, and balance query."""

    bank_name = "University Bank"   # class attribute — shared by all instances
    MIN_BALANCE = 0.0               # class-level constant

    def __init__(self, owner: str, initial_balance: float = 0.0):
        """Initialise the account."""
        if initial_balance < self.MIN_BALANCE:
            raise ValueError("Initial balance cannot be negative")
        self.owner = owner               # instance attribute
        self._balance = initial_balance  # _underscore = convention for 'private'
        self._transactions = []          # transaction history

    def deposit(self, amount: float) -> None:
        """Deposit a positive amount."""
        if amount <= 0:
            raise ValueError("Deposit amount must be positive")
        self._balance += amount
        self._transactions.append(("deposit", amount))

    def withdraw(self, amount: float) -> None:
        """Withdraw an amount (cannot overdraw)."""
        if amount <= 0:
            raise ValueError("Withdrawal amount must be positive")
        if amount > self._balance:
            raise ValueError(f"Insufficient funds (balance: {self._balance:.2f})")
        self._balance -= amount
        self._transactions.append(("withdrawal", -amount))

    @property
    def balance(self) -> float:
        """Read-only property — access balance without direct attribute access."""
        return self._balance

    def get_history(self) -> list:
        """Return a copy of transaction history."""
        return list(self._transactions)  # return a copy to protect internal state

    def __str__(self) -> str:
        return f"[{self.bank_name}] {self.owner}'s account — Balance: CHF {self._balance:,.2f}"


# --- Using the class ---
account = BankAccount("Alice", initial_balance=1000.0)
print(account)       # calls __str__
print(repr(account)) # calls __repr__

print()
account.deposit(500.0)
account.withdraw(200.0)
account.deposit(75.50)

print(f"Balance after transactions: CHF {account.balance:,.2f}")
print(f"Transaction history:")
for txn_type, amount in account.get_history():
    sign = "+" if amount > 0 else ""
    print(f"  {txn_type:<12}: {sign}CHF {amount:,.2f}")

# --- Error handling ---
print()
try:
    account.withdraw(10_000)   # more than balance
except ValueError as e:
    print(f"Caught ValueError: {e}")

# --- Multiple instances are independent ---
bob_account = BankAccount("Bob", initial_balance=500.0)
print(f"\n{account}")
print(f"{bob_account}")
print(f"Same bank: {BankAccount.bank_name}")

---

## Partie 2 : Exercices

---

### Exercice 1 : Mise en train sur les compréhensions

En utilisant les **compréhensions** (introduites dans le Séminaire 2), résolvez chaque tâche en une **seule expression** :

1. Étant donné `numbers = [3, 1, 4, 1, 5, 9, 2, 6, 5, 3]`, produisez une **liste triée de valeurs uniques**.  
   *Indice : quelle structure de données supprime automatiquement les doublons ?*

2. Étant donné `words = ["hi", "hello", "hey", "algorithmics", "data", "structures", "AI"]`, produisez un **dictionnaire** mappant chaque mot à sa longueur, mais **seulement pour les mots de plus de 2 caractères**.

3. Étant donné `sentence = "the quick brown fox jumps over the lazy fox"`, produisez un **ensemble** de mots qui apparaissent **plus d'une fois**.

In [None]:
# Exercise 1 — Comprehension warm-up

### Exercice 2 : Compteur de fréquence de caractères

Écrivez une fonction `char_frequency(text)` qui renvoie un **dictionnaire** mappant chaque caractère au nombre de fois où il apparaît dans `text`.

- Ignorer la casse (traiter `'A'` et `'a'` comme identiques)
- Ignorer les espaces
- Retourner le résultat trié par fréquence (le plus fréquent en premier)

In [None]:
# Exercise 2 — Character frequency counter


### Exercice 3 : Supprimer les doublons sans `set()`

Écrivez une fonction `remove_duplicates(lst)` qui renvoie une nouvelle liste sans doublons, **en préservant l'ordre d'origine**, **sans utiliser `set()`**.

Indice : utilisez un dict ou une liste "seen".

In [None]:
# Exercise 3 — Remove duplicates without set()


### Exercice 4 : Fusionner deux dictionnaires

Écrivez une fonction `merge_dicts(d1, d2)` qui fusionne deux dictionnaires. Si une clé existe dans les deux, la valeur de `d2` doit primer.

Implémentez-la **de trois façons** : avec une boucle, avec `.update()`, et avec l'opérateur de dépaquetage `**` (Python 3.9+ : aussi avec `|`).

In [None]:
# Exercise 4 — Merge two dictionaries


### Exercice 5 : Classe Student

Implémentez une `Student` class avec :
- **Attributs :** `name` (str), `student_id` (str), `grades` (dict mappant matière à note 0–100)
- **Méthode** `average_grade()` → float : retourne la moyenne des notes
- **Méthode** `is_passing(threshold=50)` → bool : True si la moyenne >= threshold
- **Méthode** `add_grade(subject, score)` : ajoute une nouvelle note (valider 0–100)
- **Méthode** `best_subject()` → tuple : retourne `(subject, score)` de la meilleure note
- **Méthode** `report()` : affiche un rapport formaté
- **`__str__`** et **`__repr__`**

In [None]:
# Exercise 5 — Student class


---

## Résumé

### Choisir la bonne structure de données

| Besoin | Utiliser |
|--------|----------|
| Séquence ordonnée et mutable | `list` |
| Séquence ordonnée et immuable | `tuple` |
| Mapping clé-valeur, recherche rapide | `dict` |
| Éléments uniques, opérations d'ensemble | `set` |
| Comportement réutilisable | `function` |
| Données et comportement réunis | `class` |

### Récapitulatif des complexités

| Opération | `list` | `dict` | `set` |
|-----------|--------|--------|-------|
| Accès par clé/index | O(1) | O(1) | — |
| Recherche | O(n) | O(1) | O(1) |
| Insertion | O(1) fin, O(n) milieu | O(1) | O(1) |
| Suppression | O(1) fin, O(n) milieu | O(1) | O(1) |

**Prochain séminaire :** Atelier de transfert avec lancement du projet.

---
*Université de Genève — Algorithmique & Structures de données*