# Des mesures de position

Ce chapitre traite de quelques mesures de position en statistiques : la minimale, la maximale, le mode et la moyenne arithmétique.

|Mesure|Définition|
|:-|:-|
|**Minimale**|Valeur la plus faible dans une série|
|**Maximale**|Valeur la plus forte dans une série|
|**Mode**|Valeur la plus fréquente dans une série|
|**Moyenne arithmétique**|Division de la somme des valeurs par le nombre d’enregistrements|

Reprenons tout d’abord l’état de notre structure de données :

In [None]:
# Importation des modules
import csv
from collections import defaultdict

# Chargement de la ressource dans une variable 'fichier'
with open('notes.csv') as fichier:

    # Création d'un lecteur de fichier
    lecteur = csv.DictReader(fichier, delimiter='\t')

    # Sauvegarde des lignes du fichier
    data = [ ligne for ligne in lecteur ]

# Une liste de tuples par discipline
data_dict = defaultdict(list)

for d in data:
    data_dict[d['discipline']].append(
        ( d['date'], d['note'] )
    )

# Tri en place des dates par discpline
for discipline, dates in data_dict.items():
    dates.sort()

Pour mémoire, il s’agit d’un dictionnaire dont la clé d’accès est une discipline :

In [None]:
data_dict['Mathématiques']

Et, pour chaque discipline, on retrouve une liste de tuples comprenant la date d’attribution d’une note et la note elle-même :

In [None]:
for discipline, dates in data_dict.items():
    print(discipline)
    for date, note in dates:
        print(f"\t{date} : {note}")

## La minimale et la maximale

Les valeurs minimale et maximale d’une série permettent de définir les limites supérieures et inférieures d’une série mathématique. Il existe des fonctions natives Python (`min()` et `max()`) qui permettent de les identifier facilement :

In [None]:
# Sélection des résultats en maths
mathematiques = data_dict["Mathématiques"]

# Sélection des notes obtenues en maths
notes = [ note for date, note in mathematiques ]

# Affichage des valeurs minimale et maximale
print(min(notes))
print(max(notes))

**Comment ?!** La valeur minimale est 10 quand la maximale est 9 ?

Ce résultat aberrant s’explique en fait très bien. Si l’on interroge le type de chaque note, on remarque que les notes sont analysées comme des chaînes de caractère et non des entiers numériques !

In [None]:
for note in notes:
    print(type(note))

La solution consiste à effectuer une conversion de type de `str` vers `int` :

In [None]:
# Sélection des notes obtenues en maths, au format numérique
notes = [ int(note) for date, note in mathematiques ]

In [None]:
# Cette fois-ci, le résultat est cohérent
print(f"La note minimale est { min(notes) } et la note maximale est { max(notes) }")

## Le mode

Le mode représente la valeur la plus fréquente dans une série ou, autrement dit, le motif qui apparaît le plus souvent dans une liste.

Par exemple, dans le mot *bazinga*, la lettre *a* est celle qui apparaît le plus souvent avec ses deux occurrences. On peut compter le nombre d’occurrences grâce à la méthode `count()` :

In [None]:
mot = 'bazinga'
mot.count('a')

Cette méthode, toutefois, ne permet pas de dire en un seul coup d’œil quelle lettre est la plus fréquente. Il faudrait créer un algorithme compliqué pour calculer le nombre d’occurrences de chaque lettre puis comparer leurs fréquences pour révéler la valeur maximale :

In [None]:
# Un ensemble de tuples (lettre, nb occurrences)
frequences = set()

# Pour chaque lettre dans le mot
for lettre in mot:
    # On ajoute dans l'ensemble la lettre et
    # le nombre de ses occurrences
    frequences.add(
        (lettre, mot.count(lettre))
    )

# Lettre la plus fréquente
maxi = tuple(['', 0])

# Pour chaque lettre et sa fréquence dans l'ensemble
for lettre, frequence in frequences:
    # Si la fréquence est supérieure à celle déjà enregistrée…
    if frequence > maxi[1]:
        # … on la remplace !
        maxi = (lettre, frequence)

Une technique bien plus simple consiste à utiliser un objet de type `Counter` du module `collections` :

In [None]:
# Import classe Counter
from collections import Counter

# Liste des occurrences de chaque lettre du mot
lettres = Counter(mot)

# Affichage de la lettre la plus fréquente
lettre, nb = lettres.most_common(1)[0]
print(f'La lettre la plus fréquente dans le mot "{mot}" est le "{lettre}", qui apparaît {nb} fois en tout.')

Grâce à cette technique, essaie de repérer la note la plus fréquente en maths !

In [None]:
# Import classe Counter


# Liste des occurrences de chaque note en maths


# Affichage de la note la plus fréquente

print(f"Le mode des résultats en maths est le {note} avec {nb} apparitions.")

## La moyenne arithmétique

La moyenne arithmétique s’obtient par le calcul suivant : $\bar{x} = \dfrac{x_{(1)} + x_{(2)} + \ldots + x_{(n)}}{n}$

Très simplement, il s’agit de diviser une somme par le nombre de ses éléments :

In [None]:
# Une liste de valeurs
liste = [12, 8, 9, 16, 3]

# Somme des valeurs
somme = sum(liste)

# Nombre de valeurs
nb = len(liste)

# Moyenne
moyenne = somme/nb

# Affichage de la moyenne
print(moyenne)

Juste avec ces éléments, tu devrais être en mesure de calculer la moyenne arithmétique des notes en maths !

In [None]:
# Somme des notes


# Nombre de notes


# Moyenne
