# De hautes espérances

Un exercice au long cours qui vous permettra de revoir, en plus des bonnes pratiques générales déjà acquises, certaines des structures fondamentales du langage Python.

L’objectif est d’afficher un diagramme permettant de comparer les distances de plusieurs randonnées, calculées d’après la pente moyenne et la dénivelée positive depuis leur point de départ.

## Première étape : ébauche du programme

Préparez dans un premier temps le squelette de votre programme : *shebang*, fonction `main()`, procédure principale… N’hésitez pas à lui attribuer les droits en exécution et testez son bon fonctionnement.

Prenez ensuite un peu de temps pour penser à toutes les fonctions qu’il est censé réaliser et aux ressources que vous devrez mobiliser.

Nous avons listé pour vous trois bibliothèques logicielles à importer :

In [None]:
import csv
import math
import matplotlib.pyplot as plt

## Seconde étape : lire depuis un fichier

Dans le répertoire *data* vous trouverez un fichier intitulé [mountain_passes.tsv](../data/mountain_passes.tsv). Bien que portant une extension *.tsv*, il est au format CSV. Quelle est la différence ?

**CSV :** *Comma-Separated Values*  
**TSV :** *Tabulation-Separated Values*

CSV est la dénomination officielle pour tous les fichiers plats qui permettent de représenter un tableau de données en respectant la structure :

- un enregistrement par ligne ;
- chaque donnée séparée de la précédente par un caractère.

N’importe quel caractère peut être utilisé comme séparateur : le point-virgule, le tiret cadratin ou même une lettre ! La tabulation n’est qu’une possibilité parmi d’autres, mais une possibilité que l’on rencontre très fréquemment. Pour cette raison, elle dispose de sa propre extension *.tsv*, loin d’être officielle vu que l’on pourrait dénommer les fichiers avec l’extension *.csv* sans aucune perte de performance. Mieux encore, l’extension *.txt* est parfaitement convenable : les fichiers CSV ne sont au final que de très banals fichiers textes.

En résumé, le format CSV présente de nombreux avantages, parmi lesquels :

- un format plat, c’est-à-dire sans instruction de mise en forme (un caractère fait office de
séparateur entre les champs de données) ;
- une structure en lignes et en colonnes ;
- une interopérabilité maximale avec des logiciels spécialisés (*LibreOffice Calc*, *Numbers*, *Excel*…) comme des éditeurs de textes simples.

Même si Python parvient très bien à lire les fichiers CSV avec ses fonctions natives, il est préférable de faire appel à une bibliothèque logicielle spécialisée, opportunément nommée *csv*.

Consultez [la documentation de la bibliothèque](https://docs.python.org/3.11/library/csv.html#csv.DictReader) et utilisez la méthode `.DictReader()` pour lire les données et les ajouter à une variable `data` en respectant les recommandations suivantes :

- la variable `data` sera de type `list` ;
- elle recueillera des objets de type `tuple`, composés de trois éléments :
    - une chaîne de caractères pour le nom du col ;
    - un entier de type `int` pour la dénivelée ;
    - et un dernier de type `float` pour la pente en pourcentage.

Vous terminerez en englobant le tout dans une fonction `read_data()` qui prend en argument un chemin de fichier.

In [None]:
# your code here

def read_data(f):
    """Reads mountain passes data from a TSV file and returns a list of tuples."""
    with open(f, newline='') as csvfile:
        reader = csv.DictReader(csvfile, delimiter='\t')
        data = [
            (line['pass'], int(line['drop']), float(line['slope']))
            for line in reader
        ]
        return data

## Troisième étape : un peu de trigonométrie

Définissez une fonction `distance()` qui accepte deux paramètres `alt` et `gradient` afin de calculer une distance. Il s’agit de l’application de fonctions de trigonométrie. Une façon de procéder consiste à :

1. obtenir la mesure en radians de l’angle stocké dans la variable `gradient` ;
2. calculer l’arc tangente de l’angle ;
3. déduire l’hypoténuse de la définition du sinus dans un triangle rectangle.

### Rappel sur les rapports dans un triangle rectangle

Un triangle est une figure géométrique formée de trois sommets reliés par des segments de droites. Au point de jonction entre deux côtés d’un triangle rectangle, le sommet, on trouve un angle qui peut être décrit par trois rapports trigonométriques : le **sinus**, le **cosinus** et la **tangente**.

Le sinus d’un angle est le rapport entre le côté qui lui est opposé et l’hypoténuse ; pour le cosinus, ce sera entre le côté qui lui est adjacent et l’hypoténuse et, pour la tangente, on effectue le rapport entre les côtés opposé et adjacent.

Une formule mnémotechnique permet de se rappeler facilement des formules : **SOH CAH TOA**.

$$\sin(\alpha) = \frac{\text{O}}{\text{H}}$$
$$\cos(\alpha) = \frac{\text{A}}{\text{H}}$$
$$\tan(\alpha) = \frac{\text{O}}{\text{A}}$$

### Résolution du calcul

Avant de proposer une formule, nous allons considérer les données à disposition :

- l’élévation totale (champ `drop`) ;
- le pourcentage de pente entre le point A et le point B (champ `slope`).

Dire qu’une pente est à 5,31 % en moyenne revient à dire que tous les 100 mètres on s’élève à peu près de 5,31 mètres. Par rapport au point de départ, le sommet où se trouve l’angle $\theta$, l’avancée sur 100 m constitue son côté adjacent alors que l’élévation de 5,31 m est à l’opposé de lui. Or, notre objectif est de déterminer la longueur de l’hypoténuse. Les relations dans le triangle rectangle nous amènent à retenir deux fonctions trigonométriques pour le calcul : le sinus ou le cosinus. Prenons le premier :

$$\sin(\alpha) = \frac{\text{O}}{\text{H}}$$

Par substitution :

$$\text{H} = \frac{\text{O}}{\sin(\alpha)}$$

Or, pour calculer le sinus de $\alpha$, nous avons besoin soit de l’opposé et de l’hypoténuse, soit de $\alpha$ lui-même, $\alpha$ étant un angle exprimé en **radians**.

Que pouvons-nous faire avec les côtés adjacent et opposé ? Calculer la tangente :

$$\tan(\alpha) = \frac{5.31}{100}$$

Comme le nombre obtenu est **sans unité**, il ne permet pas d’exprimer une mesure d’angle. Pour le faire, nous devons le convertir en **radians** grâce à l’arc tangente :

$$\theta = \tan^{-1}(\alpha)$$

La valeur obtenue, cette fois-ci en radians, peut être placée dans la fonction sinus pour obtenir l’hypoténuse :

$$\text{H} = \frac{\text{O}}{\sin(\theta)}$$

### Écriture de la fonction

Concevez une fonction pour calculer l’hypoténuse grâce aux éléments de trigonométrie vues plus haut :

In [None]:
# your code here

def distance(alt, gradient):
    """Calculates a distance based on the
    elevation and the gradient.

    Positional arguments:
    alt -- the elevation
    gradient -- the gradient in percentage
    """
    # converting angle in percentage into radians
    alpha = gradient / 100

    # arc tangent of the angle
    theta = math.atan(alpha)
    
    # sin(a) = o/h (soh cah toa)
    hypo = alt / math.sin(theta)

    return hypo

## Quatrième étape : des fonctions utilitaires

Maintenant que vous avez un bon aperçu du programme, vous pouvez penser à quelques fonctions qui serviront à faciliter ou finaliser certaines étapes.

### Encore plus de conversions

Dans le fichier, les mesures sont exprimées en mètres. Afin de rendre les résultats plus compréhensibles, concevez une fonction pour convertir les mètres en kilomètres :

In [None]:
# your code here

def mToKm(m):
    """Conversion: meters to kilometers
    
    m -- int: meters
    """
    return round(m / 1000, 2)

### Une fonction pour l’affichage

Vous trouverez ci-dessous une fonction pour gérer l’affichage d’un diagramme très simple avec *Matplotlib*. N’hésitez pas à en modifier les paramètres comme bon vous semble :

In [None]:
def plot_data(names, distances):
    """Plots the mountain passes names against the distances."""
    plt.bar(names, distances)
    plt.ylabel('Distance de la rando (en km)')
    plt.xticks(rotation=70, ha="right")
    plt.tight_layout()
    plt.show()

## Cinquième étape : la fonction principale

Il est temps de terminer par la fonction principale. Complétez le squelette ci-dessous afin d’obtenir une procédure prête à être appelée :

In [None]:
# your code here

def main(path):
    """Main function to process data and plot the graph."""
    # get data
    data = read_data(path)

    # initialize axis
    names, distances = [], []

    # for each row in data
    for name, height, slope in data:
        # get distance in km
        meters = distance(height, slope)
        kilometers = mToKm(meters)
        # append the name of the pass
        # and the distance to the axis
        names.append(name)
        distances.append(kilometers)

    # plot
    plot_data(names, distances)

## Dernière étape : la procédure principale

Partie la plus simple de tout programme : lancer la fonction principale. À vous de jouer !

In [None]:
# your code here

if __name__ == "__main__":

    # path
    file = '../data/mountain_passes.tsv'

    # execute
    main(file)