
# 🧠 Introduction à Python pour la Data Science
_Master IA‑GI — Notebook 1_

> **But du notebook** : poser des bases solides de Python (langage + environnement) pour aborder NumPy, Matplotlib, SciPy puis Pandas.

**Objectifs d’apprentissage**
- Installer/utiliser Colab efficacement
- Maîtriser les bases Python (variables, types, contrôles, fonctions)
- Manipuler les collections natives et les compréhensions
- Comprendre l’intérêt minimal de la POO pour la data
- Savoir installer un package et structurer un mini-script

**Pré‑requis** : aucun (bases informatiques)  
**Durée estimée** : 2h–3h

---

<details>
<summary><strong>Conseil d’utilisation (à lire une fois)</strong></summary>

- Exécute les cellules dans l’ordre (Shift+Entrée).  
- Lis les encadrés “<em>Hint</em>” et “<em>Solution</em>” seulement après avoir essayé.  
- Les blocs <code>%timeit</code> mesurent les performances — très utiles en Data Science.  
- Une barre latérale “Table of contents” est disponible dans Colab (Menu ➜ View ➜ Table of contents).
</details>



## 2) 🚀 Préparer l’environnement (Colab)
- Vérifier la version de Python
- Installer un package utile (affichages plus lisibles)
- (Option) Monter Google Drive si nécessaire


In [None]:

import sys, platform
print("Python:", sys.version)
print("Platform:", platform.platform())


In [None]:

# Installation légère pour un affichage plus agréable
!pip -q install rich
from rich import print as rprint
rprint("[bold green]✅ Environnement prêt ![/]")


In [None]:

# (Option) Monter Google Drive si vous utilisez des fichiers depuis votre Drive
# from google.colab import drive
# drive.mount('/content/drive')



## 3) ⚡ Rappels ultra‑rapides sur Python
- `print`, commentaires, indentation
- Variables = noms + valeurs (typage dynamique)
- Aide intégrée : `help(obj)` et `dir(obj)`


In [None]:

# Commentaire : ceci n'est pas exécuté
print("Hello IA‑GI 👋")

x = 3
y = 2.5
s = "data"
print(type(x), type(y), type(s))

# Aide : décommentez pour voir la doc
# help(len)
dir_len = [name for name in dir(str) if "upper" in name or "lower" in name]
dir_len[:5], len(dir_len)



## 4) 🔤 Variables, types et conversions
- `int`, `float`, `bool`, `str`
- Casting : `int()`, `float()`, `str()`, `bool()`
- F‑strings pour afficher proprement


In [None]:

a, b = 7, 2
print(f"a/b = {a/b} (float)")
print(f"a//b = {a//b} (division entière)")

val = "42"
print(int(val), float(val), str(3.14), bool(0), bool("0"))



**Exercice 4.1** — *Entrée / Sortie*  
Demande à l’utilisateur une note sur 20 (input) et affiche :
- La note
- Le pourcentage (/100)
- Mention **"Validé"** si ≥10, sinon **"Non validé"**.

<details>
<summary>💡 Hint</summary>
Utilise <code>float(input(...))</code>, une condition ternaire, et un f‑string.
</details>
<details>
<summary>✅ Solution</summary>

```python
try:
    note = float(input("Entrez une note /20 : "))
    pct = 5 * note  # /20 → /100
    statut = "Validé" if note >= 10 else "Non validé"
    print(f"Note: {note}/20 | {pct:.1f}% | {statut}")
except ValueError:
    print("Entrée invalide.")
```
</details>



## 5) ➗ Opérateurs et expressions
- Arithmétiques `+ - * / // % **`
- Comparaison `== != < <= > >=`
- Logiques `and or not`
- Appartenance `in`, `not in`


In [None]:

nums = [1, 2, 3]
print("2 in nums?", 2 in nums, "| 4 in nums?", 4 in nums)
print("(3 > 2) and (2 > 5) =", (3 > 2) and (2 > 5))



## 6) 🧭 Structures de contrôle (if / for / while)
- `if / elif / else`
- `for` (itération sur séquences), `range`
- `while` (boucle conditionnelle)
- `break`, `continue`, `enumerate`


In [None]:

x = 13
if x % 2 == 0:
    print("pair")
else:
    print("impair")

for i, v in enumerate(["A", "B", "C"], start=1):
    print(i, v)

n = 5
while n > 0:
    if n == 3:
        n -= 1
        continue  # saute l'affichage de 3
    print("n =", n)
    n -= 1



**Checkpoint 🔎**  
Écris une boucle qui calcule la somme des entiers de 1 à 100 inclus.

<details>
<summary>✅ Solution</summary>

```python
total = 0
for i in range(1, 101):
    total += i
total
```
</details>



## 7) 🧩 Fonctions (définir, typer, docstrings)
- Définir une fonction : `def`
- Paramètres avec valeurs par défaut
- Annotations de type (facultatif)
- Docstrings et `help()`


In [None]:

def normalize_minmax(x: float, xmin: float = 0.0, xmax: float = 1.0) -> float:
    """Retourne la normalisation min-max de x dans [xmin, xmax]."""
    if xmax == xmin:
        raise ValueError("xmax et xmin ne doivent pas être égaux")
    return (x - xmin) / (xmax - xmin)

print(normalize_minmax(5, 0, 10))
# help(normalize_minmax)



**Exercice 7.1** — *Exceptions*  
Écris une fonction `safe_div(a, b)` qui :
- renvoie `a/b` si `b != 0`
- renvoie `None` et affiche un message sinon.

<details>
<summary>✅ Solution</summary>

```python
def safe_div(a, b):
    if b == 0:
        print("Division par zéro interdite.")
        return None
    return a / b

safe_div(10, 2), safe_div(10, 0)
```
</details>



## 8) 📦 Collections natives (list, tuple, dict, set)
- `list` (mutable, ordonnée)
- `tuple` (immutable)
- `dict` (clé → valeur)
- `set` (ensemble, unique)


In [None]:

cities = ["Fès", "Meknès", "Khouribga"]
coords = (34.0, -5.0)
student = {"name": "Sara", "age": 23, "grade": 16.0}
tags = {"ai", "python", "ai"}  # doublon supprimé

cities.append("Casablanca")
student["age"] += 1

print(cities)
print(coords)
print(student)
print(tags)



**Exercice 8.1** — *Dictionnaire*  
Ajoute une clé `"passed"` au dict `student` valant `True` si grade ≥ 10.

<details>
<summary>✅ Solution</summary>

```python
student["passed"] = student["grade"] >= 10
student
```
</details>



## 9) ⚙️ Compréhensions & itérateurs (orienté data)
- List/dict/set comprehensions
- `zip`, `map`, `filter`, `sorted`, `any/all`
- Cas pratiques data (pré‑Pandas)


In [None]:

grades = [14, 9, 12, 16, 7]
passed = [g for g in grades if g >= 10]
status_by_student = {i: ("OK" if g>=10 else "KO") for i, g in enumerate(grades, 1)}

pairs = list(zip(["Ali","Sara","Yasmin"], grades))
top2 = sorted(pairs, key=lambda x: x[1], reverse=True)[:2]

print("passed:", passed)
print("status_by_student:", status_by_student)
print("top2:", top2)



## 10) 📦 Modules, paquets et gestion d’environnement (pip)
- Import de modules standards (`math`, `statistics`)
- Installation d’un package (`pip`) et import
- Lire/écrire un petit fichier (préparer l’arrivée de Pandas)


In [None]:

import math, statistics as stats
data = [2, 4, 6, 8, 10]
print("sqrt(49) =", math.sqrt(49))
print("mean =", stats.mean(data), "| pstdev =", stats.pstdev(data))


In [None]:

# Créons un petit CSV jouet
with open("students.csv", "w", encoding="utf-8") as f:
    f.write("name,age,grade\nAli,21,14.5\nSara,23,16.0\nYoussouf,20,12.0\n")

# Lecture EXPRESS (sans Pandas)
rows = []
with open("students.csv", encoding="utf-8") as f:
    header = f.readline().strip().split(",")
    for line in f:
        rows.append(line.strip().split(","))

print("header:", header)
print("rows:", rows)



## 11) 🧱 POO minimaliste pour la data
- Quand la POO est utile : regrouper des données + méthodes
- `class`, constructeur `__init__`, méthode d’instance


In [None]:

class Student:
    def __init__(self, name: str, age: int, grade: float):
        self.name = name
        self.age = age
        self.grade = grade
    
    def passed(self) -> bool:
        return self.grade >= 10
    
    def __repr__(self):
        return f"Student({self.name}, {self.age}, {self.grade})"

group = [Student("Ali",21,14.5), Student("Sara",23,16.0), Student("Youssouf",20,12.0)]
[x for x in group if x.passed()]



## 12) ✅ Bonnes pratiques (style, tests, profiling)
- Style PEP 8 (noms, indentation, lignes courtes)
- Assertions & tests rapides
- Mesurer le temps d’exécution (`%timeit`)


In [None]:

def slow_sum(n):
    s = 0
    for i in range(n+1):
        s += i
    return s

def fast_sum(n):
    return n*(n+1)//2

# Test minimal
assert slow_sum(100) == fast_sum(100)

# Profilage micro (résultats variables selon l'exécution)
%timeit slow_sum(100000)
%timeit fast_sum(100000)



## 13) 📝 Quiz éclair (auto‑évaluation)
1. Quelle est la différence entre `//` et `/` ?  
2. Donne un exemple de *dict comprehension*.  
3. Que renvoie `any([0,"",False,1])` ?  
4. À quoi sert `__init__` dans une classe ?  
5. Quelle commande utilises‑tu dans Colab pour installer un package ?

<details>
<summary>✅ Corrigé</summary>

1) `/` = division flottante ; `//` = division entière (quotient).  
2) Exemple : `{i: i*i for i in range(5)}`  
3) `True` (car au moins un élément est "truthy").  
4) C’est le constructeur : initialise l’état de l’instance.  
5) `!pip install <package>`
</details>



## 14) 🎯 Mini‑projet : "Analyse express des étudiants (sans Pandas)"
**Tâches**
1. Charger `students.csv` (déjà créé) et convertir les colonnes `age` et `grade` en numériques.  
2. Calculer : moyenne des notes, meilleur élève, nombre de validés.  
3. Afficher un petit rapport formaté.  
4. *(Bonus)* Enregistrer un `report.txt` avec les résultats.

> Objectif : réinvestir variables, conversions, boucles, fonctions, dicts/compréhensions.


In [None]:

def load_csv(path: str):
    """Retourne header (list[str]) et rows (list[dict])."""
    with open(path, encoding="utf-8") as f:
        header = f.readline().strip().split(",")
        rows = []
        for line in f:
            name, age, grade = line.strip().split(",")
            rows.append({"name": name, "age": int(age), "grade": float(grade)})
    return header, rows

def compute_stats(rows):
    grades = [r["grade"] for r in rows]
    mean_grade = sum(grades)/len(grades)
    best = max(rows, key=lambda r: r["grade"])
    passed = sum(1 for r in rows if r["grade"] >= 10)
    return {"mean": mean_grade, "best": best, "passed": passed, "total": len(rows)}

def format_report(st):
    best = st["best"]
    return (
        f"Étudiants : {st['total']}\n"
        f"Moyenne des notes : {st['mean']:.2f}\n"
        f"Validés (>=10) : {st['passed']}\n"
        f"Top étudiant : {best['name']} ({best['grade']})"
    )

header, rows = load_csv("students.csv")
stats = compute_stats(rows)
report = format_report(stats)
print(report)

# (Bonus) Sauvegarder
with open("report.txt", "w", encoding="utf-8") as f:
    f.write(report + "\n")
report



## 15) 📚 Ressources & suite
- Docs Python : https://docs.python.org/3/
- Tutoriels officiels : https://docs.python.org/3/tutorial/
- Prochain notebook : **NumPy — Calcul scientifique et tableaux**

---

> _Dernier conseil_ : gardez ce notebook comme “référence rapide” — il vous servira encore avec NumPy/Pandas.
