# Avancée dans les structures itératives

Dans ce *notebook*, nous allons compléter les données compilées du fichier CSV avec des moyennes actualisées pour chaque discpline ainsi qu’une moyenne générale tout aussi actualisée.

Par exemple, l’élève que nous suivons obtient sa première note de l’année, un 13, en français, le 26 septembre. Ses moyennes générale et dans la discipline sont donc toutes deux de 13 en date du 26 septembre. Le 2 octobre il reçoit un 12 en Histoire-Géographie puis le lendemain un 8 en français. Nous pouvons en déduire que :
- en date du 2 octobre : sa moyenne générale est passée de 13 à 12,5.
- en date du 3 octobre : sa moyenne générale est passée de 12,5 à 11 et sa moyenne en français a chuté de 13 à 10,5

En termes pythonesques, pour chaque nouvel enregistrement, nous allons calculer automatiquement les moyennes générale et dans la discipline afin de rajouter l’information dans la structure de données. Si l’état de notre structure est la suivante :

```py
{
    'Français': [
        ('2020-09-26', '13'),
        ('2020-12-13', '7'),
        ('2020-12-25', '6')
    ],
    'Anglais': [
        ('2020-09-03', '6'),
        ('2020-09-29', '9'),
        ('2020-10-14', '9')
    ]
}
```

L’objectif est de l’enrechir de cette manière :

```py
{
    'Français': [
        ('2020-09-26', '13', 13),
        ('2020-12-13', '7', 10),
        ('2020-12-25', '6', 8.66)
    ],
    'Anglais': [
        ('2020-09-03', '6', 6),
        ('2020-09-29', '9', 7.5),
        ('2020-10-14', '9', 8)
    ],
    'Générale': {
        '2020-09-03': 6,
        '2020-09-26': 9.5,
        '2020-09-29': 9.33,
        '2020-10-14': 9.25,
        '2020-12-13': 8.8,
        '2020-12-25': 8.33
    }
}
```

Commençons par récupérer le dictionnaire de nos données :

In [None]:
# Importation des modules
import csv
from collections import defaultdict

# Chargement de la ressource dans une variable 'fichier'
with open('notes.csv') as fichier:

    # Création d'un lecteur de fichier
    lecteur = csv.DictReader(fichier, delimiter='\t')

    # Sauvegarde des lignes du fichier
    data = [ ligne for ligne in lecteur ]

# Une liste de tuples par discipline
data_dict = defaultdict(list)

for d in data:
    data_dict[d['discipline']].append(
        ( d['date'], d['note'] )
    )

# Tri en place des dates par discpline
for discipline, dates in data_dict.items():
    dates.sort()

## Focus sur les boucles

Les structures du type `for … in … :` sont appelées *structures itératives*, ou *boucles*. Elles mobilisent un itérateur afin d’interroger successivement et de manière systématique chaque élément de la structure.

Le langage Python mobilise un mécanisme interne qui consiste à initialiser un compteur à 0 qui s’incrémentera à chaque passage jusqu’à atteindre le nombre total d’éléments dans la structure, moins une unité.

Pour illustrer le mécanisme, imaginons la liste des ingrédients d’une pizza :

In [None]:
pizza = ['tomate', 'poivrons', 'mozzarella', 'thon']

Cette pizza dispose de quatre ingrédients au total. Python attribue un indice à chacun de ces ingrédients, en commençant à 0 :
- indice 0 : tomate
- indice 1 : poivrons
- indice 2 : mozzarella
- indice 3 : thon

Pour te convaincre, il suffit d’accéder de manière atomique à chaque élément de la liste :

In [None]:
print(pizza[0])
print(pizza[1])
print(pizza[2])
print(pizza[3])

Revenons à notre boucle `for … in … :`.

Au premier passage dans la boucle, un compteur est initialisé à 0. Python traite la donnée enregistrée à l’indice de la valeur du compteur, à savoir 0, qui contient la tomate. À la fin du traitement, le compteur est incrémenté, ce qui signifie que Python lui ajoute 1.

Au second passage dans la boucle, le compteur vaut 1, aussi Python traite l’information à l’indice 1, à savoir les poivrons, et ainsi de suite jusqu’au moment où le dernier ingrédient, à l’indice 3 aura été traité. À ce moment, le compteur interne passe à 4, qui est au-dessus de l’indice maximal de la liste des ingrédients de notre pizza (3). Python sort alors de la boucle.

Pour révéler le compteur, Python met à disposition une fonction `enumerate()` :

In [None]:
for compteur, ingredient in enumerate(pizza):
    print(compteur, ingredient)

Un exemple un peu plus complexe, qui se rapproche de notre projet, est celui d’une liste de courses avec, pour chaque élément, une quantité :

In [None]:
courses = [
    ('lait', 6),
    ('riz', 2),
    ('eau', 6),
    ('pois cassés', 1)
]

Avec une boucle simple, nous pouvons lister les tuples :

In [None]:
for produit in courses:
    print(produit)

Pour accéder indépendamment à chaque composant d’un élément (le nom du produit et la quantité à acheter), nous devons déplier le tuple. Comme chaque tuple est composé de deux composants, on utilise deux variables :

In [None]:
for produit, quantite in courses:
    print(quantite, produit)

Si maintenant on veut en plus révéler l’itérateur interne de l’objet avec la fonction `enumerate()`, on doit procéder de manière plus subtile :

In [None]:
for i, (produit, quantite) in enumerate(courses):
    print(i, quantite, produit)

La raison est assez simple à comprendre : la fonction `enumerate()` renvoie une structure composée de deux éléments (l’itérateur et l’objet, peu importe sa complexité). Dans le cas d’un objet complexe, ici un tuple, on a besoin de révéler sa structure dans l’expression de la boucle.

## Calculer la moyenne actualisée d’une discipline

Avant d’opérer sur le fichier complet, concentrons-nous sur une discipline, les mathématiques :

In [None]:
# Sélection des notes en maths
maths = data_dict["Mathématiques"]

# Pour chaque date et note…
for date, note in maths:
    # … afficher la date : note
    print(f"{date} : {note}")

En t’aidant de la fonction `enumerate()` et de ce que nous avons expliqué à la section précédente, tu devrais être en mesure de révéler l’itérateur de la variable `maths` tout en accédent de manière individuelle à ses composants :

In [None]:
# Pour chaque élément de "maths"

    # Imprimer l'état du compteur, la date de la note et la note


Attardons-nous sur les deux premières lignes :

```
0 2020-09-04 10
1 2020-09-05 10
```

En date du 4 septembre, notre élève a obtenu sa première note en mathématique, un 10. Sa moyenne vaut donc 10. Sachant que le calcul d’une moyenne arithmétique s’obtient en faisant la somme des notes que l’on divise ensuite par le nombre de notes, pour obtenir une moyenne de 10, nous avons effectué l’opération suivante : 

$10 \div 1 = 10$

Au tour suivant de la boucle, lorsque le compteur vaudra 1, le calcul deviendra :

$(10 + 10) \div 2 = 10$

On remarque une règle linéaire entre le compteur et le nombre de tours dans la boucle, que l’on peut traduire dans un tableau :

|Compteur|Nb de tours|
|-|-|
|0|1|
|1|2|
|2|3|
|…|…|
|$c$|$c+1$|

Maintenant, essaie d’afficher côte-à-côte le compteur et le nombre de tours dans la boucle :

In [None]:
# Pour chaque élément de "maths"

    # Imprimer l'état du compteur et le nombre de tours


À ce stade, nous avons le nombre de notes obtenues à une date précise (égal au nombre de tours dans la boucle) et la note du jour. Il nous manque un calcul : la somme des notes obtenues jusque-là.

Le plus simple est de créer une variable, en dehors de la boucle, qui vaut 0 au départ et à laquelle on additionne chaque valeur analysée. Un exemple simple avec une liste de notes :

In [None]:
# Une liste de notes
notes = [8, 12, 15, 9]

# Total initialisé à 0
total = 0

# Pour chaque…
for i, note in enumerate(notes):

    # On ajoute au total la note actuelle
    # Syntaxe abrégée : total += note
    total = total + note

    # Affichage du total à chaque étape
    print(i, total)

À toi d’inclure cette astuce dans ton algorithme pour calculer à chaque étape le total et pour le diviser par le nombre de tours pour obtenir la moyenne. On voudrait obtenir un affichage tel que :

```
2020-09-04 10 10
2020-09-05 10 10
2020-09-30 8 9.33
2020-10-09 10 9.5
…
```

**Attention !** Souviens-toi de la fonction `int()` qui permet d’effectuer une conversion de type d’une chaîne de caractères vers un entier numérique.

**Attention !** Si tu obtiens une erreur résultat d’une division par zéro, rappelle-toi aussi qu’elle est réputée indéfinie en mathématiques. Pour contourner le problème, mets en application la règle PEMDAS que tu as dû voir en cours, relative à la priorité des opérations.

In [None]:
# Total initialisé à 0


# Pour chaque élément de "maths"

    # Ajouter la note, convertie en entier numérique, au total

    # Imprimer la date, la note et la moyenne


Il ne reste plus qu’à modifier la structure de données pour intégrer le calcul de la moyenne. Faisons cette opération ensemble :

In [None]:
# Total initialisé à 0
total = 0

# Pour chaque tour dans la boucle
for i, (date, note) in enumerate(maths):
    
    # Calcul du total
    total += int(note)
    
    # Moyenne
    moyenne = total / (i + 1)

    # La ligne courante (date, note), devient (date, note, moyenne)
    maths[i] = (date, note, moyenne)

## Une moyenne générale

L’idée maintenant est de calculer la moyenne générale. La seule difficulté réside dans le fait qu'il est possible d’avoir plusieurs notes le même jour ! Utilisons une structure minimale pour observer les étapes à accomplir :

In [None]:
d = {
    'Français': [
        ('2020-09-26', '13', 13),
        ('2020-12-13', '7', 10),
        ('2020-12-25', '6', 8.66)
    ],
    'Anglais': [
        ('2020-09-03', '6', 6),
        ('2020-09-29', '9', 7.5),
        ('2020-10-14', '9', 8),
        ('2020-12-13', '12', 9)
    ]
}

Si l’on a calculé une moyenne pour chaque date dans une même discipline, il est naturel de poursuivre la logique à la moyenne générale. Mettons au point les grandes lignes de notre algorithme :

1. Ajouter une clé `Générale` au dictionnaire, qui décrira un sous-dictionnaire avec autant de clés que de dates ;
2. initialiser un compteur et une variable pour le total ;
3. pour chaque date :
    - trouver les notes à date dans les disciplines ;
    - incrémenter le compteur ;
    - calculer la moyenne ;
    - ajouter un enregistrement dans la moyenne générale.

### 1e étape : compléter le dictionnaire

Le dictionnaire sur lequel nous travaillons pour cet exercice est constitué de deux clés : `Français` et `Anglais`. Nous pouvons en rajouter une troisième, nommée `Générale`, chargée d'enregistrer un dictionnaire de `dates: moyennes` :

In [None]:
# Insertion d'une clé "Générale"
d['Générale'] = dict()

Il s’agit maintenant de la remplir avec les dates trouvées dans le reste du dictionnaire et, pour chacune, une valeur nulle. Essayons avec ce que nous connaissons :

In [None]:
# Pour chaque résultat dans le dictionnaire
for resultat in d.values():
    # Pour chaque triplet de date, note et moyenne
    for date, note, moyenne in resultat:
        # Ajouter la date à la liste de dates
        d['Générale'][date] = float()

Python lève une exception `ValueError` pour la simple et bonne raison qu’il s’attend, pour chaque clé, à trouver un triplet de données. Or, rappelle-toi que nous venons juste d’insérer une nouvelle clé `Générale` qui, elle, est vierge !

On a besoin d’ajouter une nouvelle instruction, qui vérifie que la discipline que l’on est en train de parcourir ne correspond à la clé `Générale`. Note bien au passage la méthode `items()` sur le dictionnaire qui permet de récupérer aussi les clés :

In [None]:
# Pour chaque résultat dans le dictionnaire
for discipline, resultat in d.items():
    # Si la discipline est différente de "Générale"
    if discipline != 'Générale':
        # Pour chaque triplet de date, note et moyenne
        for date, note, moyenne in resultat:
            # Ajouter une clé date avec pour valeur une structure float vide
            d['Générale'][date] = float()

Pourquoi une structure `float()` ? La structure `int()` que nous avons utilisé jusqu’ici permet de décrire des entiers numériques. Un `float()` peut quant à lui enregistrer des nombres décimaux, ce qui est la caractéristique d’une moyenne.

### 2e étape : initialiser les variables compteur et total

Il n’y a pas plus simple, à toi d’initialiser les variables à 0 !

In [None]:
# Compteur et total initialisés à 0
compteur, total = 

### 3e étape : calculer la moyenne générale

Pour cette étape, opérons ensemble. Attention au piège qui survient dès le début : un dictionnaire ne conserve pas l’ordre d’insertion de ses éléments. Il y a une raison à cela, bien entendu, mais ne nous éparpillons pas. On doit par conséquent bien penser à trier les dates pour la clé `Générale` :

In [None]:
# Pour chaque date unique
for date_unique in sorted(d['Générale']):

    # Parcourir le dictionnaire
    for discipline, resultat in d.items():

        # Seulement si la discipline n'est pas "Générale"
        if discipline != 'Générale':

            # On déplie le triplet
            for date, note, moyenne in resultat:

                # On vérifie que la date du résultat correspond à la date analysée
                if date == date_unique:

                    # Incrémentation du nombre de notes
                    compteur += 1

                    # Addition au total
                    total += int(note)

                    # Modification de la moyenne pour le jour
                    d['Générale'][date] = total / compteur

Il ne nous reste plus qu’à vérifier si le résultat est cohérent. Un calcul à la main nous permet de trouver une moyenne de :

$(13+7+6+6+9+9+12) \div 7 = 8.857142857142858$

Quand l’enregistrement `'2020-12-25'` correspondant à la dernière date de la clé `Générale` vaut :

In [None]:
print(d['Générale']['2020-12-25'])

## Application

À présent, essaie de répéter les étapes pour calculer la moyenne générale de l‘élève que nous suivons !

In [None]:
# Ton code ici !