<div align="center">
  <img src="images/Logo Nantes Universit√© ECAP small.png" alt="Logo Nantes Universit√©" />
</div>


# S1 ‚Äî Bases Python & environnement

Ce notebook rep√©sente l'essentiel de la **S√©ance 1 (4h)** avec une partie *mini‚ÄëEDA (analyse exploratoire des donn√©es* r√©alis√©e **uniquement avec la biblioth√®que standard** (`csv`, `statistics`, `math`, `itertools`, etc.).

**Objectifs**
- Ex√©cuter du code dans Jupyter et manipuler types/contr√¥les de flux/fonctions.
- Charger et parser un **CSV** avec `csv.DictReader`.
- Nettoyer des valeurs ¬´ sales ¬ª (pourcentages, euros, s√©parateurs) avec des **fonctions utilitaires**.
- Calculer des **statistiques descriptives** et des agr√©gations **par groupe** (r√©gion/ann√©e) √† l‚Äôaide de dictionnaires.
- Exporter des r√©sultats en **CSV** via `csv.writer`.

Le fichier de travail est `data/donnees_economiques_exemple.csv`.


## 0) V√©rifications rapides de l'environnement

In [2]:
import sys, platform, csv
print(f"Python: {sys.version.split()[0]} | Platform: {platform.platform()}")

Python: 3.13.7 | Platform: Windows-11-10.0.22631-SP0


## 1) Types et op√©rations de base
- `int`, `float`, `bool`, `str`
- conversions (`int()`, `float()`, `str()`), arrondis `round()`
- f-strings pour formater (`f"{valeur:.2f}"`)


In [1]:
# Exemples
x = 7
y = 2.5
z = True
nom = "ECAP"

print(type(x), type(y), type(z), type(nom))
print(f"Addition {x}+{y} = {x+y}")
print(f"Arrondi de {y}: {round(y)}")
print(f"Cha√Æne format√©e: Bonjour {nom}, 2/7 ‚âà {2/7:.3f}")

<class 'int'> <class 'float'> <class 'bool'> <class 'str'>
Addition 7+2.5 = 9.5
Arrondi de 2.5: 2
Cha√Æne format√©e: Bonjour ECAP, 2/7 ‚âà 0.286


### Exercice E1 ‚Äî Variables & types
1. Cr√©ez 3 variables: `qte = 12`, `prix = 19.9`, `tva = 0.2`  
2. Calculez le **montant HT**, la **TVA** et le **TTC** et affichez‚Äëles avec 2 d√©cimales.  
3. Convertissez `TTC` en cha√Æne `"xx,xx ‚Ç¨"` (utilisez la virgule comme s√©parateur d√©cimal).


In [4]:
# Votre code ici
N = 30
# Premi√®re m√©thode: boucle for
s_for = 0
for i in range(1, N+1):
    if (i % 3 == 0) or (i % 5 == 0):
        s_for += i

# Deuxi√®me m√©thode: compr√©hension de liste
s_comp = sum(i for i in range(1, N+1) if (i % 3 == 0) or (i % 5 == 0)) # compr√©hension de liste et sum additionne les √©l√©ments de la liste obtenue
print(s_for, s_comp)


225 225


### Pour aller plus loin : D√©fis compl√©mentaires (E1)

Si vous avez termin√© l'exercice E1 rapidement, voici quelques id√©es de d√©fis pour approfondir sur le m√™me th√®me :

- **Calculer le montant TTC pour plusieurs articles** : Cr√©ez une liste de prix et quantit√©s, puis calculez le montant TTC total pour tous les articles.
- **G√©rer diff√©rents taux de TVA** : Ajoutez une logique pour appliquer un taux de TVA diff√©rent selon le type de produit (ex : 5.5%, 10%, 20%).
- **Formatage avanc√©** : Affichez les montants en format mon√©taire fran√ßais (avec espaces pour les milliers, virgule pour les d√©cimales).
- **Simulation de remise** : Ajoutez une remise (en %) sur le montant TTC et affichez le montant final.
- **Conversion de devises** : Proposez une fonction pour convertir le montant TTC en dollars ou une autre devise avec un taux de change donn√©.
- **Tableau r√©capitulatif** : Affichez un tableau synth√©tique (type facture) avec toutes les informations calcul√©es pour chaque article.

Ces d√©fis permettent de manipuler les types, les boucles, les fonctions et le formatage de cha√Ænes tout en restant dans le contexte de la gestion de factures et montants.

#### üîì Correction E1

In [5]:
qte = 12; prix = 19.9; tva = 0.2
montant_ht = qte * prix
montant_tva = montant_ht * tva
montant_ttc = montant_ht + montant_tva
print(f"HT = {montant_ht:.2f} | TVA = {montant_tva:.2f} | TTC = {montant_ttc:.2f}")
print("TTC (format ‚Ç¨):", f"{montant_ttc:.2f} ‚Ç¨".replace(".", ",")) 
# Remplace le point par une virgule pour le format mon√©taire fran√ßais et le f-string g√®re l'arrondi √† deux d√©cimales


HT = 238.80 | TVA = 47.76 | TTC = 286.56
TTC (format ‚Ç¨): 286,56 ‚Ç¨


## 2) Contr√¥le de flux : `if/elif/else`, boucles `for`/`while`

In [2]:
# Exemple: classer une note
note = 13.5
if note >= 16:
    mention = "TB"
elif note >= 14:
    mention = "Bien"
elif note >= 12:
    mention = "Assez bien"
else:
    mention = "Passable"
mention

'Assez bien'

In [7]:
# Boucles: somme des carr√©s pour 1..N
N = 10
s = 0
for i in range(1, N+1):
    s += i*i
s

385

### Exercice E2 ‚Äî Somme des multiples (boucle + compr√©hension)
Calculez la somme de tous les entiers **‚â§ N** multiples de **3 ou 5** avec une boucle for puis avec une compr√©hension de liste.


In [8]:
N = 30
# Premi√®re m√©thode: boucle for
s_for = 0
for i in range(1, N+1):
    if (i % 3 == 0) or (i % 5 == 0):
        s_for += i

# Deuxi√®me m√©thode: compr√©hension de liste
s_comp = sum(i for i in range(1, N+1) if (i % 3 == 0) or (i % 5 == 0)) # compr√©hension de liste et sum additionne les √©l√©ments de la liste obtenue
print(s_for, s_comp)

225 225


### Pour aller plus loin : D√©fis compl√©mentaires (E2)

Si vous avez termin√© l'exercice E2 rapidement, voici quelques id√©es de d√©fis pour approfondir sur le m√™me th√®me :

- **Somme des multiples d'un autre nombre** : Modifiez le code pour calculer la somme des multiples de 7 ou d'un nombre choisi par l'utilisateur.
- **Liste des multiples** : Affichez la liste compl√®te des entiers ‚â§ N qui sont multiples de 3 ou 5.
- **Comptage des multiples** : Comptez combien d'entiers ‚â§ N sont multiples de 3 ou 5.
- **Exclusion des doubles multiples** : Calculez la somme des entiers multiples de 3 ou 5 mais pas des deux √† la fois.
- **Visualisation** : Repr√©sentez graphiquement (sans matplotlib avec un simple print) la r√©partition des multiples dans la plage 1..N.
- **G√©n√©ralisation** : Proposez une fonction qui prend une liste de diviseurs et calcule la somme des entiers ‚â§ N multiples de l'un quelconque de ces diviseurs.

Ces d√©fis permettent de manipuler les boucles, les conditions, les listes et d'aller plus loin dans la logique algorithmique autour des multiples.

#### üîì Correction E2

In [3]:
N = 30
# Premi√®re m√©thode: boucle for
s_for = 0
for i in range(1, N+1):
    if (i % 3 == 0) or (i % 5 == 0):
        s_for += i

# Deuxi√®me m√©thode: compr√©hension de liste
s_comp = sum(i for i in range(1, N+1) if (i % 3 == 0) or (i % 5 == 0)) # compr√©hension de liste et sum additionne les √©l√©ments de la liste obtenue
print(s_for, s_comp)

225 225


## 3) Fonctions, docstrings & port√©e

- D√©finir une fonction avec param√®tres/retour  
- Docstring (`"""..."""`)  
- Port√©e des variables (locale vs globale)


In [4]:
def stats_liste(valeurs):
    """Retourne (moyenne, ecart_type) pour une liste de nombres (population)."""
    n = len(valeurs)
    m = sum(valeurs)/n # moyenne
    var = sum((v - m)**2 for v in valeurs)/n # variance population calcul√©e √† nouveau avec compr√©hension de liste
    return m, var**0.5

stats_liste([1,2,3,4,5])

(3.0, 1.4142135623730951)

### Exercice E3 ‚Äî Nettoyage d'une valeur mon√©taire (cha√Æne ‚Üí float | None)
√âcrire `parse_monnaie(s)` qui :
- supprime espaces (y compris ins√©cables), symbole `‚Ç¨`, tirets ;
- remplace la virgule par un point ; renvoie `None` si vide ou non num√©rique.


In [11]:
def parse_monnaie(s):
    """
    Nettoie et convertit une cha√Æne repr√©sentant une valeur mon√©taire en float.
    - Supprime espaces (y compris ins√©cables), symbole ‚Ç¨, tirets.
    - Remplace la virgule par un point.
    - Renvoie None si la valeur est vide ou non num√©rique.
    Exemples : "1‚ÄØ234,56 ‚Ç¨" ‚Üí 1234.56 ; "-" ou "n/a" ‚Üí None
    """
    if s is None:
        return None
    s = str(s).strip()
    s = s.replace("‚Ç¨", "").replace("-", "")
    s = s.replace("\u202f", " ")
    s = s.replace(" ", "")
    s = s.replace(",", ".")
    if s == "" or s.lower() in {"na", "n/a", "none"}:
        return None
    try: # gestion des erreurs de conversion
        return float(s)
    except ValueError:
        return None

for t in ["1\u202f234,56 ‚Ç¨", "2 345,0", "-", "n/a", " 99,9‚Ç¨ "]: # \u202f est le code Unicode pour l'espace ins√©cable
    print(t, "->", parse_monnaie(t))

1‚ÄØ234,56 ‚Ç¨ -> 1234.56
2 345,0 -> 2345.0
- -> None
n/a -> None
 99,9‚Ç¨  -> 99.9


### Pour aller plus loin : D√©fis compl√©mentaires (E3)

Si vous avez termin√© l'exercice E3 rapidement, voici quelques id√©es de d√©fis pour approfondir sur le m√™me th√®me :

- **G√©rer d'autres symboles mon√©taires** : Adaptez la fonction pour reconna√Ætre et nettoyer des valeurs en dollars ($), livres (¬£), etc.
- **D√©tection d'erreurs** : Ajoutez une logique pour signaler les entr√©es non reconnues ou suspectes (ex : trop de caract√®res, symboles inattendus).
- **Conversion automatique** : Proposez une fonction qui convertit automatiquement les montants en euros selon un taux de change fourni.
- **Nettoyage de listes** : Appliquez la fonction √† une liste de valeurs mon√©taires et affichez le r√©sultat sous forme de liste propre.
- **Formatage inverse** : Cr√©ez une fonction qui prend un float et le formate en cha√Æne mon√©taire fran√ßaise (ex : 1234.56 ‚Üí "1‚ÄØ234,56 ‚Ç¨").
- **Statistiques sur les montants** : Calculez la somme, la moyenne et le nombre de valeurs valides dans une liste de montants bruts.

Ces d√©fis permettent de renforcer la robustesse des fonctions de parsing et d'explorer des cas concrets de nettoyage et de traitement de donn√©es mon√©taires.

#### üîì Correction E3

In [1]:
def parse_monnaie(s):
    """
    Nettoie et convertit une cha√Æne repr√©sentant une valeur mon√©taire en float.
    - Supprime espaces (y compris ins√©cables), symbole ‚Ç¨, tirets.
    - Remplace la virgule par un point.
    - Renvoie None si la valeur est vide ou non num√©rique.
    Exemples : "1‚ÄØ234,56 ‚Ç¨" ‚Üí 1234.56 ; "-" ou "n/a" ‚Üí None
    """
    if s is None:
        return None
    s = str(s).strip()
    s = s.replace("‚Ç¨", "").replace("-", "")
    s = s.replace("\u202f", " ")
    s = s.replace(" ", "")
    s = s.replace(",", ".")
    if s == "" or s.lower() in {"na", "n/a", "none"}:
        return None
    try: # gestion des erreurs de conversion
        return float(s)
    except ValueError:
        return None

for t in ["1\u202f234,56 ‚Ç¨", "2 345,0", "-", "n/a", " 99,9‚Ç¨ "]: # \u202f est le code Unicode pour l'espace ins√©cable
    print(t, "->", parse_monnaie(t))


1‚ÄØ234,56 ‚Ç¨ -> 1234.56
2 345,0 -> 2345.0
- -> None
n/a -> None
 99,9‚Ç¨  -> 99.9


---
## 4) Mini‚ÄëEDA **sans pandas** : lire/traiter un CSV avec `csv`

Nous allons:
1. Charger `data/donnees_economiques_exemple.csv` avec `csv.DictReader` ;
2. Parser les colonnes num√©riques ¬´ sales ¬ª (%, ‚Ç¨, s√©parateurs, tirets) ;
3. Calculer des agr√©gations **par (r√©gion, ann√©e)** ;
4. Exporter `outputs/resume_statistiques_sans_pandas.csv` via `csv.writer`.


In [24]:
chemin = "data/donnees_economiques_exemple.csv"

def parse_pourcent(s):
    """
    Nettoie et convertit une cha√Æne repr√©sentant un pourcentage en float.
    - Supprime espaces (y compris ins√©cables), symbole %, virgule (remplac√©e par un point).
    - Renvoie None si la valeur est vide ou non num√©rique.
    Exemples : "12,5 %" ‚Üí 12.5 ; "n/a" ‚Üí None
    """
    if s is None:
        return None
    s = str(s).strip().lower()
    s = s.replace("%", "").replace("\u202f", " ").replace(" ", "").replace(",", ".")
    if s in {"", "na", "n/a", "‚Äî"}:
        return None
    try:
        return float(s)
    except ValueError:
        return None

def parse_nombre_entier_approx(s):
    """
    Nettoie et convertit une cha√Æne repr√©sentant un nombre entier (souvent avec s√©parateurs ou suffixes) en float.
    - Supprime espaces (y compris ins√©cables), supprime le suffixe "M‚Ç¨".
    - Renvoie None si la valeur est vide ou non num√©rique.
    Exemples : "25 000" ‚Üí 25000 ; "25 000 M‚Ç¨" ‚Üí 25000 ; "-" ‚Üí None
    """
    if s is None: return None
    s = str(s).strip().replace("\u202f", " ").replace(" ", "")
    s = s.replace("M‚Ç¨", "")
    if s in {"", "-", "‚Äî", "?"}:
        return None
    try:
        return float(s)
    except ValueError:
        return None

def parse_float_approx(s):
    """
    Nettoie et convertit une cha√Æne repr√©sentant une valeur d√©cimale (souvent mon√©taire ou indicateur) en float.
    - Supprime espaces (y compris ins√©cables), symbole ‚Ç¨, remplace la virgule par un point.
    - Renvoie None si la valeur est vide ou non num√©rique.
    Exemples : "1‚ÄØ234,56 ‚Ç¨" ‚Üí 1234.56 ; "-" ‚Üí None
    """
    if s is None: return None
    s = str(s).strip().replace("\u202f", " ").replace(" ", "").replace(",", ".").replace("‚Ç¨", "")
    if s in {"", "-", "‚Äî", "?"}:
        return None
    try:
        return float(s)
    except ValueError:
        return None

rows = []
with open(chemin, newline="", encoding="utf-8") as f:
    reader = csv.DictReader(f)
    for r in reader:
        rows.append(r)

len(rows), rows[0]


FileNotFoundError: [Errno 2] No such file or directory: 'data/donnees_economiques_exemple.csv'

In [None]:
# Cr√©ons des lignes "nettoy√©es" num√©ris√©es
clean_rows = []
for r in rows:
    cr = dict(r)  # copie
    cr["annee"] = int(r["annee"])
    cr["pib_millions"] = parse_nombre_entier_approx(r["pib_millions"])
    cr["population"]  = parse_nombre_entier_approx(r["population"])
    cr["revenu_median"] = parse_float_approx(r["revenu_median"])
    cr["chomage_pourcent"] = parse_pourcent(r["chomage_pourcent"])
    cr["indice_prix"] = parse_float_approx(r["indice_prix"])
    cr["ventes_k‚Ç¨"] = parse_float_approx(r["ventes_k‚Ç¨"])
    cr["taux_inflation"] = parse_pourcent(r["taux_inflation"])
    clean_rows.append(cr)

sum(1 for c in clean_rows if c["revenu_median"] is None), clean_rows[0] # Afficher le nombre de lignes avec revenu_median manquant et un exemple de ligne nettoy√©e

IndexError: list index out of range

### Agr√©gations par (r√©gion, ann√©e)
Nous allons calculer :
- Moyennes : `pib_millions`, `population`, `revenu_median`, `chomage_pourcent`, `indice_prix`, `taux_inflation`
- Somme : `ventes_k‚Ç¨`


In [None]:
from collections import defaultdict # pour avoir des dictionnaires avec valeur par d√©faut
import math # pour math.isnan

def safe_add(d, key, val):
    """
    Ajoute une valeur num√©rique √† la cl√© d'un dictionnaire, en ignorant les valeurs None ou NaN.
    - Si la valeur est None ou NaN, la fonction ne modifie pas le dictionnaire.
    - Sinon, elle ajoute la valeur √† la cl√© (initialis√©e √† 0.0 si absente).
    """
    if val is None or (isinstance(val, float) and math.isnan(val)):
        return
    d[key] = d.get(key, 0.0) + float(val)

def safe_count(d, key, val):
    """
    Incr√©mente le compteur associ√© √† une cl√© dans un dictionnaire si la valeur n'est ni None ni NaN.
    - Ignore les valeurs None ou NaN.
    - Sinon, incr√©mente la cl√© (initialis√©e √† 0 si absente).
    """
    if val is None or (isinstance(val, float) and math.isnan(val)):
        return
    d[key] = d.get(key, 0) + 1

agg = {}  # (region, annee) -> dict de sommes/comptes
for r in clean_rows:
    k = (r["region"], r["annee"])
    if k not in agg:
        agg[k] = {
            "sum_pib":0.0, "n_pib":0,
            "sum_pop":0.0, "n_pop":0,
            "sum_rev":0.0, "n_rev":0,
            "sum_chom":0.0, "n_chom":0,
            "sum_ipch":0.0, "n_ipch":0,
            "sum_ventes":0.0,              # somme directe
            "sum_infl":0.0, "n_infl":0
        }
    a = agg[k]
    safe_add(a, "sum_pib", r["pib_millions"]);  safe_count(a, "n_pib", r["pib_millions"])
    safe_add(a, "sum_pop", r["population"]);     safe_count(a, "n_pop", r["population"])
    safe_add(a, "sum_rev", r["revenu_median"]);  safe_count(a, "n_rev", r["revenu_median"])
    safe_add(a, "sum_chom", r["chomage_pourcent"]); safe_count(a, "n_chom", r["chomage_pourcent"])
    safe_add(a, "sum_ipch", r["indice_prix"]);   safe_count(a, "n_ipch", r["indice_prix"])
    safe_add(a, "sum_ventes", r["ventes_k‚Ç¨"])
    safe_add(a, "sum_infl", r["taux_inflation"]); safe_count(a, "n_infl", r["taux_inflation"])

# Construire les lignes de sortie
resume = []
for (region, annee), a in sorted(agg.items()):
    out = {
        "region": region,
        "annee": annee,
        "pib_millions_moyen": (a["sum_pib"]/a["n_pib"]) if a["n_pib"] else None,
        "population_moyenne": (a["sum_pop"]/a["n_pop"]) if a["n_pop"] else None,
        "revenu_median_moyen": (a["sum_rev"]/a["n_rev"]) if a["n_rev"] else None,
        "chomage_pourcent_moyen": (a["sum_chom"]/a["n_chom"]) if a["n_chom"] else None,
        "indice_prix_moyen": (a["sum_ipch"]/a["n_ipch"]) if a["n_ipch"] else None,
        "ventes_k‚Ç¨_total": a["sum_ventes"],
        "taux_inflation_moyen": (a["sum_infl"]/a["n_infl"]) if a["n_infl"] else None,
    }
    resume.append(out) # ajouter la ligne au r√©sum√©

len(resume), resume[:3] # Afficher le nombre de lignes du r√©sum√© et les 3 premi√®res lignes


(30,
 [{'region': 'Auvergne-Rh√¥ne-Alpes',
   'annee': 2019,
   'pib_millions_moyen': 27224.333333333332,
   'population_moyenne': None,
   'revenu_median_moyen': None,
   'chomage_pourcent_moyen': 10.0,
   'indice_prix_moyen': 2051429.3333333333,
   'ventes_k‚Ç¨_total': 342.0,
   'taux_inflation_moyen': 4.666666666666667},
  {'region': 'Auvergne-Rh√¥ne-Alpes',
   'annee': 2020,
   'pib_millions_moyen': 31347.666666666668,
   'population_moyenne': None,
   'revenu_median_moyen': None,
   'chomage_pourcent_moyen': 8.666666666666666,
   'indice_prix_moyen': 2203983.0,
   'ventes_k‚Ç¨_total': 314.0,
   'taux_inflation_moyen': 4.0},
  {'region': 'Auvergne-Rh√¥ne-Alpes',
   'annee': 2021,
   'pib_millions_moyen': 27871.0,
   'population_moyenne': None,
   'revenu_median_moyen': None,
   'chomage_pourcent_moyen': 6.666666666666667,
   'indice_prix_moyen': 2003945.3333333333,
   'ventes_k‚Ç¨_total': 218.0,
   'taux_inflation_moyen': 249.33333333333334}])

### Export CSV des r√©sultats

In [None]:
import csv, os
os.makedirs("outputs", exist_ok=True)
out_path = os.path.join("outputs", "resume_statistiques_sans_pandas.csv")
with open(out_path, "w", newline="", encoding="utf-8") as f:
    writer = csv.DictWriter(f, fieldnames=list(resume[0].keys()))
    writer.writeheader()
    for row in resume:
        writer.writerow(row)
out_path

NameError: name 'resume' is not defined

### Exercice E4 ‚Äî Groupes suppl√©mentaires & Top‚Äë3
1. Calculez pour chaque **secteur** et **ann√©e** la valeur moyenne de `revenu_median` et le taux de ch√¥mage moyen.  
2. Identifiez le **top‚Äë3** des r√©gions par `ventes_k‚Ç¨` **cumul√©es** sur toute la p√©riode.  
3. Exportez vos r√©sultats en CSV dans `outputs/`.


In [20]:
from collections import defaultdict
import os, csv

# 1) Agr√©gations (secteur, annee)
agg_sa = {}
for r in clean_rows:
    k = (r["secteur"], r["annee"])
    if k not in agg_sa:
        agg_sa[k] = {"sum_rev":0.0, "n_rev":0, "sum_chom":0.0, "n_chom":0}
    a = agg_sa[k]
    if r["revenu_median"] is not None:
        a["sum_rev"] += r["revenu_median"]; a["n_rev"] += 1
    if r["chomage_pourcent"] is not None:
        a["sum_chom"] += r["chomage_pourcent"]; a["n_chom"] += 1

indicateurs = []
for (secteur, annee), a in sorted(agg_sa.items()):
    indicateurs.append({
        "secteur": secteur,
        "annee": annee,
        "revenu_median_moyen": (a["sum_rev"]/a["n_rev"]) if a["n_rev"] else None,
        "chomage_moyen": (a["sum_chom"]/a["n_chom"]) if a["n_chom"] else None
    })

# 2) Top-3 r√©gions par ventes cumul√©es
ventes_region = defaultdict(float)
for r in clean_rows:
    if r["ventes_k‚Ç¨"] is not None:
        ventes_region[r["region"]] += r["ventes_k‚Ç¨"]
classement = sorted(ventes_region.items(), key=lambda x: x[1], reverse=True)
top3 = classement[:3]

# 3) Exports
os.makedirs("outputs", exist_ok=True)
with open("outputs/indicateurs_secteurs_sans_pandas.csv", "w", newline="", encoding="utf-8") as f:
    writer = csv.DictWriter(f, fieldnames=["secteur","annee","revenu_median_moyen","chomage_moyen"])
    writer.writeheader()
    for row in indicateurs:
        writer.writerow(row)

with open("outputs/top3_regions_ventes_sans_pandas.csv", "w", newline="", encoding="utf-8") as f:
    w = csv.writer(f)
    w.writerow(["region","ventes_k‚Ç¨_total"])
    for reg, tot in top3:
        w.writerow([reg, tot])

("outputs/indicateurs_secteurs_sans_pandas.csv", "outputs/top3_regions_ventes_sans_pandas.csv")

('outputs/indicateurs_secteurs_sans_pandas.csv',
 'outputs/top3_regions_ventes_sans_pandas.csv')

#### üîì Correction E4 (exemple de solution)

In [19]:
from collections import defaultdict
import os, csv

# 1) Agr√©gations (secteur, annee)
agg_sa = {}
for r in clean_rows:
    k = (r["secteur"], r["annee"])
    if k not in agg_sa:
        agg_sa[k] = {"sum_rev":0.0, "n_rev":0, "sum_chom":0.0, "n_chom":0}
    a = agg_sa[k]
    if r["revenu_median"] is not None:
        a["sum_rev"] += r["revenu_median"]; a["n_rev"] += 1
    if r["chomage_pourcent"] is not None:
        a["sum_chom"] += r["chomage_pourcent"]; a["n_chom"] += 1

indicateurs = []
for (secteur, annee), a in sorted(agg_sa.items()):
    indicateurs.append({
        "secteur": secteur,
        "annee": annee,
        "revenu_median_moyen": (a["sum_rev"]/a["n_rev"]) if a["n_rev"] else None,
        "chomage_moyen": (a["sum_chom"]/a["n_chom"]) if a["n_chom"] else None
    })

# 2) Top-3 r√©gions par ventes cumul√©es
ventes_region = defaultdict(float)
for r in clean_rows:
    if r["ventes_k‚Ç¨"] is not None:
        ventes_region[r["region"]] += r["ventes_k‚Ç¨"]
classement = sorted(ventes_region.items(), key=lambda x: x[1], reverse=True)
top3 = classement[:3]

# 3) Exports
os.makedirs("outputs", exist_ok=True)
with open("outputs/indicateurs_secteurs_sans_pandas.csv", "w", newline="", encoding="utf-8") as f:
    writer = csv.DictWriter(f, fieldnames=["secteur","annee","revenu_median_moyen","chomage_moyen"])
    writer.writeheader()
    for row in indicateurs:
        writer.writerow(row)

with open("outputs/top3_regions_ventes_sans_pandas.csv", "w", newline="", encoding="utf-8") as f:
    w = csv.writer(f)
    w.writerow(["region","ventes_k‚Ç¨_total"])
    for reg, tot in top3:
        w.writerow([reg, tot])

("outputs/indicateurs_secteurs_sans_pandas.csv", "outputs/top3_regions_ventes_sans_pandas.csv")

('outputs/indicateurs_secteurs_sans_pandas.csv',
 'outputs/top3_regions_ventes_sans_pandas.csv')

---
## 5) √Ä rendre (fin de S1)
- Ce notebook **ex√©cut√©** et propre ;
- `outputs/resume_statistiques_sans_pandas.csv` g√©n√©r√© ;
- Vos fichiers d'exercices dans `outputs/`.

**Checklist**
- [ ] Chemins relatifs (`data/...`, `outputs/...`) ;
- [ ] Fonctions de parsing robustes (g√®rent `%`, `‚Ç¨`, virgules, tirets) ;
- [ ] Agr√©gations correctes et CSV export√©s.


## Pourquoi exporter en CSV ?

L'export des r√©sultats en fichiers **CSV** pr√©sente plusieurs avantages :

- **Interop√©rabilit√©** : Le format CSV est universel et peut √™tre ouvert dans Excel, LibreOffice, ou import√© dans des outils de data visualisation comme **Power BI** ou **Tableau**.
- **Automatisation** : Les exports facilitent la r√©utilisation des donn√©es nettoy√©es et agr√©g√©es dans d'autres analyses ou rapports.
- **Rapports dynamiques** : Dans Power BI, par exemple, il est possible de charger ces fichiers CSV pour cr√©er des tableaux de bord interactifs, des graphiques, et des analyses avanc√©es sans avoir √† retraiter les donn√©es manuellement.
- **Tra√ßabilit√©** : Garder une trace des √©tapes de nettoyage et d'agr√©gation permet de documenter le workflow et d'assurer la reproductibilit√© des analyses.

En r√©sum√©, exporter vos r√©sultats en CSV est une bonne pratique pour partager, visualiser et valoriser vos analyses dans des outils professionnels comme Power BI.

## Int√©r√™t concret des exports pour l'analyse

Avec ces donn√©es export√©es en CSV, vous pouvez :

- **Explorer les tendances r√©gionales et temporelles** : Visualiser l'√©volution du PIB, du revenu m√©dian ou du ch√¥mage par r√©gion et par ann√©e.
- **Identifier des secteurs performants ou en difficult√©** : Comparer les indicateurs √©conomiques entre secteurs pour cibler des opportunit√©s ou des risques.
- **Cr√©er des tableaux de bord interactifs** : Utiliser Power BI pour filtrer, croiser et repr√©senter graphiquement les indicateurs, facilitant la prise de d√©cision.
- **Communiquer efficacement** : G√©n√©rer des rapports clairs et visuels pour des pr√©sentations, des r√©unions ou des publications.
- **Automatiser le suivi** : Mettre √† jour r√©guli√®rement les analyses en rechargeant les nouveaux exports CSV, sans devoir tout retraiter √† la main.

En r√©sum√©, ces exports permettent de transformer des donn√©es brutes en informations exploitables, directement utilisables pour piloter des projets, orienter des politiques ou appuyer des recommandations strat√©giques.

## Lien avec l'√©conom√©trie

Les exports CSV issus de ce notebook sont particuli√®rement utiles en √©conom√©trie :

- **Pr√©paration des donn√©es** : Les donn√©es nettoy√©es et agr√©g√©es sont pr√™tes √† √™tre utilis√©es dans des logiciels √©conom√©triques (R, Stata, Python, etc.) pour des analyses statistiques avanc√©es.
- **Mod√©lisation** : Vous pouvez importer ces fichiers pour r√©aliser des r√©gressions, des analyses de corr√©lation ou des mod√®les pr√©dictifs sur les indicateurs √©conomiques.
- **Validation des hypoth√®ses** : Les exports facilitent la v√©rification empirique d'hypoth√®ses √©conomiques (ex : lien entre ch√¥mage et revenu m√©dian, impact de l'inflation sur les ventes, etc.).
- **Comparaison temporelle et spatiale** : Les agr√©gations par r√©gion et ann√©e permettent d'√©tudier les dynamiques √©conomiques dans le temps et l'espace.
- **Documentation et reproductibilit√©** : Un workflow bien document√© et des exports clairs assurent la transparence et la reproductibilit√© des analyses √©conom√©triques.

Ainsi, ce travail de pr√©paration et d'export des donn√©es constitue une √©tape essentielle avant toute √©tude √©conom√©trique rigoureuse.