<a href="https://colab.research.google.com/github/salma601/gestion_evenments/blob/main/Notebooks/00_Intro_Python_Data_Science.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>


# Séance 01 : Introduction à Python pour la Data Science
_Master IA‑GI — Notebook 1_

> **But du notebook** : Rappel complet : Introduction à Python (2025)
> **Module : Python pour les Sciences de Données**
> <br>Basé sur [le support de cours](https://fr.slideshare.net/slideshow/programmation-orientee-objets-python-concepts-pratiques-et-applications/283926543) de **Youssouf EL ALLIOUI** – FPK USMS

- Ce notebook constitue le support officiel de la première séance de rappel.  
- Il suit fidèlement la progression du cours (chapitres 1 à 6 + notions utiles du chapitre 4) tout en orientant les exemples vers la manipulation de données (listes, dictionnaires, fichiers CSV/JSON, etc.).

- Exécutez les cellules dans l’ordre.  
- Tout est testé et fonctionnel en novembre 2025.

## Chapitre 1 – Premiers pas avec Python

In [None]:
# Votre premier programme Python (comme dans le cours page 8)
print("Hello, World!")
print("Bienvenue dans le module Python pour les Sciences de Données 2025-2026 !")

# Vérification de la version (toujours utile)
import sys
print("Version de Python :", sys.version)

## Chapitre 2 – Bases de la programmation
### 2.1 Variables et types de base

In [None]:
# Types de base (pages 13-19 du cours)
entier = 42
reel = 3.14
texte = "Python pour la Data Science"
booleen = True

print(type(entier))
print(type(reel))
print(type(texte))
print(type(booleen))

# Conversion de types (très utile en Data)
float(42), int(3.14), str(100), bool(0), bool(1)

In [None]:
# Opérateurs arithmétiques et logiques
a, b = 10, 3
print("Addition :", a + b)
print("Division entière :", a // b)
print("Modulo :", a % b)
print("Puissance :", a ** b)
print("a > 5 and b < 5 :", a > 5 and b < 5)

### 2.2 Structures conditionnelles et boucles

In [None]:
# If / elif / else
note = 16
if note >= 16:
    print("Excellent !")
elif note >= 14:
    print("Très bien")
elif note >= 12:
    print("Bien")
else:
    print("Peut mieux faire")

In [None]:
# Boucle for (très utilisée en Data Science)
for i in range(5):
    print(f"Iteration {i}")

# Boucle while
compteur = 0
while compteur < 5:
    print(compteur)
    compteur += 1

### 2.3 Fonctions (pages 25-31)

In [None]:
# Fonction simple
def carre(x):
    return x ** 2

# Fonction avec valeurs par défaut et type hints (recommandé en 2025)
def moyenne(liste: list[float]) -> float:
    return sum(liste) / len(liste)

notes = [15, 17, 13, 18, 19]
print("Moyenne =", moyenne(notes))

# Fonction lambda (indispensable en Data Science avec pandas)
carre_lambda = lambda x: x**2
print(carre_lambda(7))

### 2.4 f-strings (formatage – page 32-34)

In [None]:
nom = "Amina"
note = 17.5
print(f"{nom} a obtenu {note:.1f}/20 en Python")
# Sortie → Amina a obtenu 17.5/20 en Python

## Chapitre 3 – Structures de données (LE PLUS IMPORTANT POUR LA DATA !)

In [None]:
# Listes (mutables, ordonnées)
maliste = [10, 20, 30, "texte", 3.14]
maliste.append(100)
maliste.insert(0, "premier")
print(maliste)

# Slicing (très puissant)
print(maliste[1:4], maliste[-2:], maliste[::2])

In [None]:
# Compréhension de liste (vous allez l'utiliser TOUS LES JOURS en Data Science)
carres = [x**2 for x in range(10)]
pairs = [x for x in range(20) if x % 2 == 0]
print("Carrés :", carres)
print("Pairs :", pairs)

In [None]:
# Tuples (immutables – souvent utilisés pour retourner plusieurs valeurs)
point = (10, 20)
x, y = point  # unpacking
print(x, y)

# Dictionnaires (clé → valeur, cœur de pandas plus tard)
etudiant = {
    "nom": "Said",
    "prenom": "Mohammed",
    "notes": [16, 18, 14, 19],
    "moyenne": 16.75
}
print(etudiant["nom"])
print(etudiant.get("age", "Non renseigné"))  # évite KeyError

In [None]:
# Sets (ensembles – très utiles pour supprimer les doublons)
notes_brutes = [15, 17, 15, 19, 17, 18]
notes_uniques = set(notes_brutes)
print(notes_uniques)

## Chapitre 4 – Programmation Orientée Objet (bases indispensables)

In [None]:
# Classe simple (pages 55-60 du cours)
class Etudiant:
    def __init__(self, nom, prenom):
        self.nom = nom
        self.prenom = prenom
        self.notes = []

    def ajouter_note(self, note):
        self.notes.append(note)

    def moyenne(self):
        return sum(self.notes) / len(self.notes) if self.notes else 0

    def __str__(self):
        return f"{self.prenom} {self.nom} – Moyenne : {self.moyenne():.2f}"

# Utilisation
e1 = Etudiant("El Khattabi", "Yasmine")
e1.ajouter_note(18)
e1.ajouter_note(17.5)
print(e1)

In [None]:
# Héritage (page 58-60)
class EtudiantMaster(Etudiant):
    def __init__(self, nom, prenom, stage):
        super().__init__(nom, prenom)
        self.stage = stage

    def __str__(self):
        return super().__str__() + f" – Stage : {self.stage}"

em = EtudiantMaster("Rahali", "Oussama", "Google")
print(em)

## Chapitre 6 – Manipulation de fichiers (TXT, CSV, JSON)

In [None]:
# Écriture / lecture fichier texte
with open("exemple.txt", "w") as f:
    f.write("Ligne 1\nLigne 2\nLigne 3")

with open("exemple.txt", "r") as f:
    contenu = f.read()
print(contenu)

In [None]:
# CSV avec le module csv (standard en Data Science avant pandas)
import csv

data = [
    ["nom", "note1", "note2", "note3"],
    ["Ali", 15, 17, 18],
    ["Fatima", 19, 18, 20],
    ["Karim", 12, 14, 13]
]

with open("notes.csv", "w", newline="") as f:
    writer = csv.writer(f)
    writer.writerows(data)

# Lecture
with open("notes.csv", "r") as f:
    reader = csv.reader(f)
    for ligne in reader:
        print(ligne)

In [None]:
# JSON (format le plus utilisé en Data Science aujourd'hui)
import json

etudiants = [
    {"nom": "Said", "notes": [16, 18, 15], "moyenne": 16.33},
    {"nom": "Amina", "notes": [19, 20, 18], "moyenne": 19}
]

with open("etudiants.json", "w") as f:
    json.dump(etudiants, f, indent=2)

with open("etudiants.json") as f:
    data = json.load(f)
print(data)
print("Moyenne d'Amina =", data[1]["moyenne"])

### Gestion d’exceptions (try/except – page 91-93)

In [None]:
try:
    note = float(input("Entrez une note : "))
    print("Note =", note)
except ValueError:
    print("Erreur : vous devez entrer un nombre !")

## Exercice d'application (à faire en live)
Objectif : créer une petite base de données d’étudiants en mémoire (liste de dictionnaires ou liste d’objets Etudiant), sauvegarder en JSON + CSV, puis recharger et calculer des statistiques.

In [1]:
import json
import csv

#Base d'étudiants en mémoire
etudiants = [
    {"id": 1, "nom": "Ali", "notes": [15, 17, 14]},
    {"id": 2, "nom": "Sara", "notes": [18, 19, 17]},
    {"id": 3, "nom": "Khalid", "notes": [12, 13, 11]},
    {"id": 4, "nom": "Leila", "notes": [16, 15, 17]}
]
#Sauvegarde JSON
with open("etudiants.json", "w") as f:
    json.dump(etudiants, f, indent=4)
#Recharger JSON
with open("etudiants.json", "r") as f:
    etudiants_json = json.load(f)
#Sauvegarde CSV
with open("etudiants.csv", "w", newline="") as f:
    writer = csv.writer(f)
    writer.writerow(["id", "nom", "notes"])
    for e in etudiants:
        writer.writerow([e["id"], e["nom"], ",".join(map(str, e["notes"]))])
#Recharger CSV
etudiants_csv = []
with open("etudiants.csv") as f:
    reader = csv.DictReader(f)
    for row in reader:
        notes = list(map(int, row["notes"].split(",")))
        etudiants_csv.append({
            "id": int(row["id"]),
            "nom": row["nom"],
            "notes": notes
        })
#Statistiques
for e in etudiants:
    e["moyenne"] = sum(e["notes"]) / len(e["notes"])

meilleur = max(etudiants, key=lambda x: x["moyenne"])
moyenne_classe = sum(e["moyenne"] for e in etudiants) / len(etudiants)
print("Meilleur étudiant :", meilleur["nom"], meilleur["moyenne"])
print("Moyenne générale de la classe :", moyenne_classe)

Meilleur étudiant : Sara 18.0
Moyenne générale de la classe : 15.333333333333334


## EXERCICE 1: Manipulation de listes
Créez une liste de nombres de 1 à 20.
Ensuite:
1. Extrayez tous les nombres pairs
2. Calculez la somme des nombres impairs
3. Créez une nouvelle liste avec les carrés des multiples de 3

In [2]:
nombres = list(range(1, 21))
pairs = [x for x in nombres if x % 2 == 0]
somme_impairs = sum(x for x in nombres if x % 2 != 0)
carres_multiples_3 = [x**2 for x in nombres if x % 3 == 0]
print("Pairs :", pairs)
print("Somme impairs :", somme_impairs)
print("Carrés des multiples de 3 :", carres_multiples_3)


Pairs : [2, 4, 6, 8, 10, 12, 14, 16, 18, 20]
Somme impairs : 100
Carrés des multiples de 3 : [9, 36, 81, 144, 225, 324]


## EXERCICE 2: Dictionnaires et statistiques
Vous avez une liste d'étudiants avec leurs notes:

```python
étudiants = [
    {"nom": "Ali", "notes": [15, 16, 14]},
    {"nom": "Sara", "notes": [18, 17, 19]},
    {"nom": "Khalid", "notes": [12, 13, 11]},
    {"nom": "Leila", "notes": [16, 15, 17]}
]
```

**Tâches:**
1. Calculez la moyenne de chaque étudiant
2. Trouvez l'étudiant avec la meilleure moyenne
3. Calculez la moyenne générale de la classe
4. Listez les étudiants ayant une moyenne >= 15

In [3]:
étudiants = [
    {"nom": "Ali", "notes": [15, 16, 14]},
    {"nom": "Sara", "notes": [18, 17, 19]},
    {"nom": "Khalid", "notes": [12, 13, 11]},
    {"nom": "Leila", "notes": [16, 15, 17]}
]
for e in étudiants:
    e["moyenne"] = sum(e["notes"]) / len(e["notes"])
meilleur = max(étudiants, key=lambda x: x["moyenne"])
moyenne_classe = sum(e["moyenne"] for e in étudiants) / len(étudiants)
bons = [e["nom"] for e in étudiants if e["moyenne"] >= 15]
print("Moyennes :", [(e["nom"], e["moyenne"]) for e in étudiants])
print("Meilleur :", meilleur["nom"])
print("Moyenne classe :", moyenne_classe)
print(">= 15 :", bons)

Moyennes : [('Ali', 15.0), ('Sara', 18.0), ('Khalid', 12.0), ('Leila', 16.0)]
Meilleur : Sara
Moyenne classe : 15.25
>= 15 : ['Ali', 'Sara', 'Leila']


##EXERCICE 3: Classe pour analyse de données

Créez une classe AnalyseurDonnees qui:
1. Prend une liste de nombres dans son constructeur
2. A une méthode moyenne() qui retourne la moyenne
3. A une méthode mediane() qui retourne la médiane
4. A une méthode ecart_type() qui retourne l'écart-type
5. A une méthode statistiques() qui retourne un dict avec tout

> **Formule écart-type :**
`python
sqrt(sum((x - moyenne)²) / n)
`



In [4]:
import math
class AnalyseurDonnees:
    def __init__(self, liste):
        self.liste = liste
    def moyenne(self):
        return sum(self.liste) / len(self.liste)
    def mediane(self):
        tri = sorted(self.liste)
        n = len(tri)
        milieu = n // 2
        if n % 2 == 0:
            return (tri[milieu - 1] + tri[milieu]) / 2
        else:
            return tri[milieu]
    def ecart_type(self):
        m = self.moyenne()
        variance = sum((x - m)**2 for x in self.liste) / len(self.liste)
        return math.sqrt(variance)

    def statistiques(self):
        return {
            "moyenne": self.moyenne(),
            "mediane": self.mediane(),
            "ecart_type": self.ecart_type()
        }
a = AnalyseurDonnees([1, 2, 3, 4, 5])
print(a.statistiques())

{'moyenne': 3.0, 'mediane': 3, 'ecart_type': 1.4142135623730951}


## EXERCICE 4: Manipulation de fichiers CSV

1. Créez un fichier CSV "ventes.csv" avec les colonnes:
   Produit, Quantité, Prix_unitaire
   
2. Ajoutez au moins 5 produits avec leurs données

3. Lisez le fichier et calculez:
   - Le chiffre d'affaires total (Quantité × Prix)
   - Le produit le plus vendu (quantité)
   - Le produit générant le plus de CA

In [5]:
import csv
with open("ventes.csv", "w", newline="") as f:
    writer = csv.writer(f)
    writer.writerow(["Produit", "Quantite", "Prix_unitaire"])
    writer.writerow(["PC", 5, 7000])
    writer.writerow(["Clavier", 20, 150])
    writer.writerow(["Souris", 25, 100])
    writer.writerow(["Ecran", 7, 1200])
    writer.writerow(["USB", 30, 50])
ca_total = 0
produit_plus_vendu = None
max_qte = 0
produit_max_ca = None
max_ca = 0
with open("ventes.csv") as f:
    reader = csv.DictReader(f)
    for row in reader:
        qte = int(row["Quantite"])
        prix = float(row["Prix_unitaire"])
        ca = qte * prix
        ca_total += ca
        if qte > max_qte:
            max_qte = qte
            produit_plus_vendu = row["Produit"]

        if ca > max_ca:
            max_ca = ca
            produit_max_ca = row["Produit"]
print("CA total :", ca_total)
print("Produit le plus vendu :", produit_plus_vendu)
print("Produit max CA :", produit_max_ca)

CA total : 50400.0
Produit le plus vendu : USB
Produit max CA : PC


## EXERCICE 5: Nettoyage de données
Vous avez des données "sales" avec des problèmes:
- Valeurs manquantes (None)
- Doublons
- Valeurs aberrantes
- Formats incohérents

Tâches:
1. Nettoyez les données
2. Remplacez les valeurs manquantes par la moyenne
3. Supprimez les doublons
4. Identifiez et gérez les valeurs aberrantes (> 3× écart-type)
5. Exportez les données nettoyées en JSON

In [6]:
import json
import statistics
donnees = [10, 12, None, 13, 12, 200, 10, 12, None, 11, 300]
# Supprimer doublons
donnees = list(dict.fromkeys(donnees))
# Remplacer None par la moyenne
valeurs_valides = [x for x in donnees if x is not None]
moyenne = sum(valeurs_valides) / len(valeurs_valides)
donnees = [moyenne if x is None else x for x in donnees]

# Détection valeurs aberrantes
ecart = statistics.pstdev(donnees)
seuil = 3 * ecart
moy = statistics.mean(donnees)
donnees_nettoyees = [x for x in donnees if abs(x - moy) <= seuil]
# Export JSON
with open("donnees_nettoyees.json", "w") as f:
    json.dump(donnees_nettoyees, f, indent=4)
print("Données nettoyées :", donnees_nettoyees)

Données nettoyées : [10, 12, 91.0, 13, 200, 11, 300]


## EXERCICE 6: Analyse de texte
Analysez le texte suivant:
1. Comptez le nombre de mots
2. Trouvez les 5 mots les plus fréquents
3. Calculez la longueur moyenne des mots
4. Identifiez les mots de plus de 8 caractères

```python
texte = """Python est un langage de programmation interprété, multiparadigme et multiplateformes.
Il favorise la programmation impérative structurée, fonctionnelle et orientée objet.
Python est très utilisé dans le domaine de la science des données et de l'intelligence artificielle en raison de sa simplicité et de ses nombreuses bibliothèques spécialisées.
"""
```

In [7]:
import re
from collections import Counter
texte = """Python est un langage de programmation interprété, multiparadigme et multiplateformes.
Il favorise la programmation impérative structurée, fonctionnelle et orientée objet.
Python est très utilisé dans le domaine de la science des données et de l'intelligence artificielle en raison de sa simplicité et de ses nombreuses bibliothèques spécialisées.
"""
# Nettoyage simple
mots = re.findall(r"\w+", texte.lower())
# 1. Nombre de mots
nb_mots = len(mots)
# 2. 5 mots les plus fréquents
top5 = Counter(mots).most_common(5)
# 3. Longueur moyenne
longueur_moyenne = sum(len(m) for m in mots) / len(mots)
# 4. Mots > 8 caractères
longs = [m for m in mots if len(m) > 8]
print("Nb mots :", nb_mots)
print("Top 5 :", top5)
print("Longueur moyenne :", longueur_moyenne)
print("Mots > 8 char :", longs)

Nb mots : 48
Top 5 : [('de', 5), ('et', 4), ('python', 2), ('est', 2), ('programmation', 2)]
Longueur moyenne : 6.145833333333333
Mots > 8 char : ['programmation', 'interprété', 'multiparadigme', 'multiplateformes', 'programmation', 'impérative', 'structurée', 'fonctionnelle', 'intelligence', 'artificielle', 'simplicité', 'nombreuses', 'bibliothèques', 'spécialisées']


## EXERCICE 7: Mini-projet - Système de gestion d'étudiants
Créez un système complet de gestion d'étudiants:

1. Classe Etudiant avec:
   - Attributs: id, nom, prenom, notes[]
   - Méthodes: ajouter_note(), moyenne(), mention()

2. Classe GestionEtudiants avec:
   - Liste d'étudiants
   - Méthodes: ajouter(), supprimer(), rechercher()
   - Méthode exporter_csv() pour sauvegarder
   - Méthode importer_csv() pour charger
   - Méthode statistiques_classe()

3. Menu interactif (optionnel pour démo)

In [8]:
import csv

class Etudiant:
    def __init__(self, id, nom, prenom):
        self.id = id
        self.nom = nom
        self.prenom = prenom
        self.notes = []

    def ajouter_note(self, note):
        self.notes.append(note)

    def moyenne(self):
        return sum(self.notes) / len(self.notes) if self.notes else 0

    def mention(self):
        m = self.moyenne()
        if m >= 16:
            return "Très bien"
        elif m >= 14:
            return "Bien"
        elif m >= 12:
            return "Assez bien"
        else:
            return "Passable"


class GestionEtudiants:
    def __init__(self):
        self.etudiants = []

    def ajouter(self, e):
        self.etudiants.append(e)

    def supprimer(self, id):
        self.etudiants = [e for e in self.etudiants if e.id != id]

    def rechercher(self, nom):
        return [e for e in self.etudiants if e.nom.lower() == nom.lower()]

    def exporter_csv(self, fichier):
        with open(fichier, "w", newline="") as f:
            writer = csv.writer(f)
            writer.writerow(["ID", "Nom", "Prenom", "Notes"])
            for e in self.etudiants:
                writer.writerow([e.id, e.nom, e.prenom, e.notes])

    def importer_csv(self, fichier):
        with open(fichier) as f:
            reader = csv.DictReader(f)
            for row in reader:
                e = Etudiant(row["ID"], row["Nom"], row["Prenom"])
                notes = eval(row["Notes"])
                for n in notes:
                    e.ajouter_note(n)
                self.ajouter(e)

    def statistiques_classe(self):
        if not self.etudiants:
            return None
        moyennes = [e.moyenne() for e in self.etudiants]
        return {
            "moyenne_classe": sum(moyennes) / len(moyennes),
            "max": max(moyennes),
            "min": min(moyennes)
        }
g = GestionEtudiants()
e1 = Etudiant(1, "Ali", "Karim")
e1.ajouter_note(15)
e1.ajouter_note(17)
g.ajouter(e1)
print(g.statistiques_classe())

{'moyenne_classe': 16.0, 'max': 16.0, 'min': 16.0}


> **Prochaine séance :**
> - NumPy pour le calcul numérique

Bon courage à tous, et surtout : codez, cassez, réparez, recommencez.  

C’est comme ça qu’on devient bon en **Data Science**.

À la semaine prochaine inchae ALLAH !

<br>
<hr>
<div style="font-size:14px; line-height:1.5;">
<strong style="font-size:16px;">Y. EL ALLIOUI</strong><br>
<span style="color:#555;">FPK – USMS</span><br>
<a href="mailto:y.elallioui@usms.ma" style="color:#2c3e50; text-decoration:none;">
y.elallioui@usms.ma
</a>
</div>