# **SAE15 - Traitement de données**

---



## **Objectifs et cahiers des charges**



### Objectifs
> **Compétences professionnelles**

En tant que futur professionnel R&T, vous serez régulièrement amené à traiter des données provenant d'un système d’information, pour les présenter de façon pertinente et synthétique à votre hiérarchie ou à vos collaborateurs. Ces traitements pouvant être récurrents (dans le temps), ils gagnent à être automatisés par des programmes/scripts informatiques pour les gérer de façon efficace.

La SAE15 vous projette dans cette situation professionnelle. Elle vous propose d’exploiter les données qui portent sur les vélos en libre service de la société *Vélib' Métropole*, de les traiter et de les présenter pour vos collaborateurs (services techniques, direction,…).

> **Contexte de réalisation**

La SAE15 se déroulera selon le principe suivant :

* Vous êtes en charge, à titre individuel, d’un projet de développement informatique.
* Ce projet vous est confié par votre hiérarchie (l’enseignant mandataire en charge de votre groupe de TD).
* Votre hiérarchie impose un cahier des charges fonctionnel et technique (décrits par la suite), qui devra être respecté avec des livrables fournis dans les temps.

> **Organisation du temps de travail**

Le projet devra être réalisé dans des plages de travail réservées, obligatoires et inscrites dans votre emploi du temps :
* une partie des séances de travail seront encadrées (TD/TP) par des collaborateurs techniques (enseignants) que vous pourrez solliciter en cas de questions ;
* une autre partie des séances seront à faire en autonomie (Projet) pour avancer votre travail et à l’issue desquelles un certain nombre de fonctionnalités devront être livrées (cf. échéancier du projet).

> **Ressources en appui**

La réalisation de cette SAE s’appuie sur les connaissances acquises dans différentes ressources :

1. Parmi les ressources transverses :
 * R110 - Anglais : la documentation (des codes informatiques) du projet doit être écrite en anglais ;
 * R111 - Expr-Comm : les échanges avec le mandataire hiérarchique doivent être professionnels ;
 * R115 - Gestion de Projet : l’organisation de votre travail doit être adaptée à la tenue des délais.

2. Parmi les ressources techniques :
 * R106 - Archi Info : où est traitée la représentation des données en mémoire ;
 * R107 - Programmation : dans laquelle ont été présentées les techniques de programmation ;
 * R108 - Shell et vos connaissances sur la gestion des fichiers : l’exécution de programmes en ligne de commandes sur un système d’exploitation Linux ou Windows ;
 * R109 - Techno Web : dans lequel est abordée la mise en page de documents que vous appliquez par un balisage de 1er niveau en utilisant le langage HTML/CSS.

### Cahier des charges

Les objectifs, la finalité et les éléments de mise en oeuvre du projet, qui vous est confié (cahier des charges) sont donnés ci-dessous.

> **Cadre et objectif général**

Le projet a pour objectif d’exploiter les données extraites de l'Open Data mis à votre disposition sur Internet. Les étapes principales consistent :

1. à **lire les données** des stations Vélib' Métropole. Ces dernières sont composées d'informations sur la localisation des stations à vélos et sur l'état de ces stations.

2. à **interpréter les données** pour en extraire les éléments pertinents en lien avec votre projet (par exemple, connaitre la géolocalisation des stations, le nombre stations, celui des vélos disponibles, etc.)

3. à **traiter les données** pour répondre à l’objectif de votre projet (par exemple, calculer le taux de disponibilité des vélos, ou le nombre moyen de vélos disponibles)

4. à **construire une représentation textuelle** (en utilisant la mise en forme HTML/CSS) des données calculées (par exemple, un tableau présentant les résultats)

5. à **créer une représentation graphique** des données calculées, puis de l’exporter en `.png` pour une utilisation au sein d'une page Web.

⚠ Attention : le projet doit être documenté (commentaires pertinents dans le code) en rédigeant cette documentation en anglais.

> **Dépôt sur Eprel**

Le projet est rattaché à un dépôt sur le serveur EPREL de l'UPEC, dédié à la livraison de vos codes informatiques.

**⚠** La livraison étant tracée et datée, elle servira de preuves pour le travail à réaliser pendant les heures d’autonomie.

Un dépôt distant vierge, spécialement dédié à cette SAE15, a donc déjà été créé - par les enseignants - sur le serveur EPREL. Retrouvez ses éléments en vous loggant sur l'interface Web d'EPREL (avec vos identifiants étudiants) et en accédant au projet SAE15.

> **Langages de programmation**

Le projet doit utiliser :

* le `langage de programmation Python` pour les codes informatiques gérant la lecture, l’analyse, le traitement des données et la publication de leur analyse. Vous utiliserez la version fournie par Google Colab (la même qu’à l’IUT pour la ressource R107-Programmation)

* le `langage HTML/CSS` pour les pages web permettant la publication des résultats.

> **Environnement de développement**

Les **codes informatiques** du projet doivent être développés : 
* en utilisant l’IDE `Google Colab` en ligne

Les **pages Web** du projet doivent être développées : 
* soit en utilisant l’éditeur de texte `Notepad++` (logiciel libre),
* soit en utilisant tout éditeur de texte de votre choix.

Votre travail doit être créé dans un répertoire nommé `SAE15` situé :
* sur votre `drive Google` personnel dans le dossier `Colab Notebooks`.

> **Arborescence du projet**

Votre projet doit :

* être exécuté par le biais d’un script dans un notebook intitulé `projetSAE15.ipynb` présent dans votre répertoire SAE15. Ce script reprendra la structure classique des programmes vu en R107-Programmation.

* respecter l’arborescence suivante (SAE15 désignant le répertoire auquel est rattaché votre projet et constituant la base du dépôt sur Eprel) :

<pre>
Votre drive/
└── Colab Notebooks/
    └── SAE15/
        ├── web/
        │   ├── projetSAE15.html
        │   ├── css/
        │   │   └── projetSAE15.css
        │   └── data/   
        │       └── ...
        ├── tools/
        │   ├── sae15_tools.py
        │   └── sae15_spec.py
        ├── tests/
        │   ├── data/
        │   │   └── ...
        │   └── tu_Activité1.ipynb
        │   └── tu_Activité2.ipynb
        │   └── tu_Activité3.ipynb
        │   └── tu_Activité4.ipynb
        ├── sae15-Activités.ipynb
        ├── sae15-Présentation.ipynb
        ├── sae15-Publication Web.ipynb
        ├── sae15-Spécifications.ipynb
        └── projetSAE15.ipynb
</pre>

avec :

* **`web/`** le répertoire dédié à stocker les différents éléments pour la publication sur le web - page HTML, feuille de style CSS et données diverses - nécessaires au projet.

* **`tools/`** le répertoire contenant le script **`sae15_tools.py`** de fonctions supports "faits maison" utiles pour la réalisation du projet et vos fonctions spécifiques dans le script **`sae15_spec.py`**.

* **`tests/`** le répertoire dédié aux tests unitaires  `tu_ActivitéX.ipynb` associés aux différentes activités, ainsi que des données utiles (dans `tests/data/`).

* **`projetSAE15.ipynb`** le programme python principal contenant les codes que vous allez écrire pour votre projet et dont la structure (découpage en fonctions) est décrite dans le fichier lui même.

* **`sae15-Activités.ipynb`** fichier contenant les consignes pour chaque activité.

* **`sae15-Présentation.ipynb`** fichier contenant la présentation générale du projet (ce Notebook).

* **`sae15-Publication Web.ipynb`** fichier contenant un tutoriel pour vous aider à mettre en forme la page Web pour la publication des résultats.

* **`sae15-Spécifications.ipynb`** fichier contenant la description fonctionnelle du projet ainsi que la description des fonctions supports et spécifiques.

> **Données OpenData manipulées**

<img src="https://www.velib-metropole.fr/uploads/media/904x561/02/322-velib-velo-electrique.jpg?v=1-0" width=300 align="right"/>

Les données des vélos en libre service de la ville de Lyon - auxquelles se limitent ce projet - seront collectées par vous depuis l'[**API Vélib' Métropole**](https://www.velib-metropole.fr/donnees-open-data-gbfs-du-service-velib-metropole) et sont disponibles sous deux modalités :

* Les **données statiques** fournissent des informations peu changeantes sur les stations, comme leur adresse, leur position GPS, etc.
* Les **données dynamiques** indiquent l'état d’une station, le nombre de vélos disponibles, le nombre d'emplacements libre, etc.

Les données statiques et dynamiques sont accessibles directement par simple téléchargement de fichier au travers de l’API. Les données dynamiques sont rafraichies toutes les minutes.

Ces données vous sont fournies au format JSON respectant un standard créé pour l’échange de données structurées (cf. [**Standard JSON**](https://www.json.org/json-fr.html), ou sur [**Wikipedia**](https://fr.wikipedia.org/wiki/JavaScript_Object_Notation)).

---
*Remarque : API est l'acronyme d'Application Programming Interface (interface de programmation d'application), une solution logicielle qui permet à deux applications de communiquer entre elles. Chaque fois que vous utilisez une application comme Facebook, que vous envoyez un message instantané ou que vous consultez la météo sur votre téléphone, vous utilisez une API.*

---



> **Test unitaires**

Une série de tests unitaires vous seront fournis. Ils serviront à vérifier la justesse de votre travail et votre activité lors des séances de TP ou de Projet. Ces tests reposent sur les activités présentées dans le Notebook `SAE15-Activités.ipynb`.

Les tests unitaires nommés `tu_ActivitéX.ipynb` (ou `X` représente le n° de l'activité) seront à réaliser et à rendre sur Eprel en chaque fin d'activité.

Vous pourrez également créer vos propres scripts de tests au cours du projet. Ils devront être stockés dans le répertoire `SAE15/tests` Ces tests sont à utiliser pour finaliser le code de vos fonctions. Dans la pratique, il est préférable d'utiliser ces scripts avant de les insérer dans votre projet pour :

* déclarer des données que vous testez,

* appeler vos fonctions avec ces données,

* vérifier avec des affichages console (print) le bon déroulement et le résultat de votre fonction.

Vous pourrez trouver des données pour vos propres tests, soit dans les différentes activités en lien avec le projet, soit dans le répertoire `tests/data/`.

### Evaluation de la SAE15
La SAE15 compte pour l’UE3 relative à la compétence RT3-Programmer et sera évaluée sur plusieurs critères :

1. Note de gestion de projet (coeff. 1) qui traduit la **régularité de votre travail** :
 * avancement du travail pendant les plages réservées dans l’emploi du temps (TP/Projet en autonomie),
 * rendus des fonctions attendues aux dates/échéances fixées dans le calendrier ci-dessous.

2. Note de projet (coeff. 2) qui traduit la **qualité de votre travail** en mesurant :
 * le nombre de fonctionnalités mises en place au regard des attentes du projet : tests unitaires réussis partant des codes dans le dépôt sur Eprel,
 * la qualité de la documentation du code : respect de l’anglais, pertinence des commentaires, orthographe
 * la qualité du code : structuration du code en fonctions, lisibilité y compris dans le choix des noms de variables, optimisation du code,
 * l’authenticité du code : code produit par vous-même et non copié sans le maîtriser sur Internet ou emprunté à un collègue,

3. Note d'acquisition de la compétence Programmer (coeff. 1) qui mesure votre **appréhension du langage Python et du projet** en évaluant :
 * votre capacité à écrire le code que vous avez réalisé,
 * et/ou à en produire une variante pertinente.

### Spécifications, fonctions supports et spécifiques

Les spécifications du projet ainsi que la description des fonctions supports et des fonctions spécifiques se trouvent dans le Notebook `SAE15-Spécifications.ipynb`.

* **Spécifications** : elles définissent la structure du code et la finalité de votre projet de programmation. Vous trouverez toutes les consignes concernant les spécificatios dans le Notebook `SAE15-Spécifications.ipynb`.
* **Fonctions supports**: un ensemble de fonctions "faites maison" présentent dans le module `sae15_tools.py`.
* **Fonctions spécifiques** : les fonctions que vous devrez coder. Elles sont présentes dans le module `sae15_spec.py`.

### ⏳ Calendrier de travail et échéancier

> **📆 Semaine 48 : Introduction**

<table width="80%"><tr height="60px"><td width="60px" align="center"><b>TP (3h)</b></td><td><ul><li>Présentation du projet et de ses attentes</li><li>Activité 1 : Mise en place de l’environnement de développement</li></ul></td></tr></table>

> **📆 Semaine 49 : Accès à l'OpenData et traitements**

<table width="80%">
<tr height="60px"><td width="60px" align="center"><b>TP (3h)</b></td><td><ul><li>Activité 2 : Sources de données en OpenData</li></ul></td></tr>
<tr height="60px"><td width="60px" align="center"><b>Projet en<br/>autonomie<br/>(4h)</b></td><td><ul><li>Avancer le parsing des JSON</li><li>Démarrer le traitement des stations</li></ul></td></tr>
<tr height="60px"><td width="60px" align="center"><b>Portfolio</b></td><td><ul><li>Mettre à jour le portfolio</li></ul></td></tr>
</table><br/>

---

**🎯 Echéance 1 : 📆 le samedi 11/12/2021 à 18h :**

Livrer (sur votre dépôt Eprel) les fonctions :
`sae15_spec.availableDocksRate()`, `sae15_spec.availableBikesRate()`

---

> **📆 Semaine 50 : Finalisation du parsing des stations**

<table width="80%">
<tr height="60px"><td width="60px" align="center"><b>Projet en<br/>autonomie<br/>(4h)</b></td><td><ul><li>Finir le parsing et le traitement des stations</li></ul></td></tr>
<tr height="60px"><td width="60px" align="center"><b>Portfolio</b></td><td><ul><li>Mettre à jour le portfolio</li></ul></td></tr>
</table><br/>

---

**🎯 Echéance 2 : 📆 le samedi 18/12/2021 à 18h :**

Livrer (sur votre dépôt Eprel) les fonctions :
`sae15_spec.getLatestDate()`, `sae15_spec.stationStatistics()`

---

> **📆 Semaine 01 : Publication des résultats du traitement**

<table width="80%">
<tr height="60px"><td width="60px" align="center"><b>Projet en<br/>autonomie<br/>(4h)</b></td><td><ul><li>Activité 3 - Analyse et publication Web</li><li>Débuter la mise en forme textuelle des données</li><li>Débuter la mise en page (HTML+CSS)</li></ul></td></tr>
<tr height="60px"><td width="60px" align="center"><b>Portfolio</b></td><td><ul><li>Mettre à jour le portfolio</li></ul></td></tr>
</table><br/>

---

**🎯 Echéance 3 : 📆  le samedi 08/01/2022 à 18h :**

Livrer (sur votre dépôt Eprel) la page Web et la feuille de style (ébauche):
`projetSAE15.html`, `projetSAE15.css`.

---

> **📆 Semaine 02 : Spatialisation des données**

<table width="80%">
<tr height="60px"><td width="60px" align="center"><b>TP (3h)</b></td><td><ul><li>Activité 4 : Outils graphiques</li></ul></td></tr>
<tr height="60px"><td width="60px" align="center"><b>Projet en<br/>autonomie<br/>(4h)</b></td><td><ul><li>Finaliser la représentations textuelle et graphique</li><li>Poursuivre les publication Web (HTML+CSS)</li></ul></td></tr>
<tr height="60px"><td width="60px" align="center"><b>Portfolio</b></td><td><ul><li>Mettre à jour le portfolio</li></ul></td></tr>
</table><br/>

---

**🎯 Echéance 4 : 📆  le samedi 15/01/2022 à 18h :**

Livrer (sur votre dépôt Eprel) les fonctions :
`sae15_spec.exportStatistics()`, `sae15_spec.exportCityMap()`.

Livrer (sur votre dépôt Eprel) la page Web et la feuille de style (version finale):
`projetSAE15.html`, `projetSAE15.css`.

---

> **📆 Semaine 03 : Finalisation du projet**

<table width="80%">
<tr height="60px"><td width="60px" align="center"><b>Projet en<br/>autonomie<br/>(4h)</b></td><td><ul><li>Finaliser le programme principal et la publication Web</li></ul></td></tr>
<tr height="60px"><td width="60px" align="center"><b>Portfolio</b></td><td><ul><li>Mettre à jour le portfolio</li></ul></td></tr>
</table><br/>

---

**🎯 Echéance finale : 📆  le vendredi 21/01/2022 à 18h :**

Livrer la **version finale** de votre projet en la déposant sur Eprel. Passé ce délai, aucun nouvel apport ne sera pris en compte.

> ⚠ Le version finale à livrer est composée de l'ensemble des éléments du dossier `SEA15/` compressé.

---

### Versement du code sur Eprel

A l'issue de chaque fin de séance de TP ou de Projet vous êtes invités à **déposer sur Eprel des livrables**, à savoir :

* les **tests unitaires** `tu_ActivitéX.ipynb`, liés aux différentes activités planifiées (voir calendrier de travail).
* le **code des fonctions spécifiques** du module `sae15_spec.py`.
* les **ressources HTML/CSS** de votre publication Web.

⚠ Les livrables doivent faire l'objet d'un dépot sur Eprel qui respecte la date limite de rendu (voir l'échancier).

## **Activités de TP/Projet**

---

Le projet est ponctué d'un certain nombre d'activités à réaliser afin de progresser dans votre travail.

⚠ Une description complète de ces activités est donnée dans le Notebook `SAE15-Activités.ipynb`.

Ces activités sont les suivantes :

### Activité 1 : Mise en place de l’environnement 🕒3h

> ☝ **Objectif :** Mettre en place l'environnement de travail pour qu’il respecte les indications du cahier des charges. Appréhender le format de données JSON.

> 🎯 **Livrable :** en fin d'activité, vous devez déposer sur Eprel le script du test unitaire `tu_Activité1.ipynb` validant votre travail.



### Activité 2 : Sources de données en OpenData 🕒3h

> ☝ **Objectif :** Accéder à des jeux de données publiés sur un portail OpenData et mettre en forme ces données.



> 🎯 **Livrable :** en fin d'activité, vous devez déposer sur Eprel le script du test unitaire `tu_Activité2.ipynb` validant votre travail.

### Activité 3 : Analyse et publication Web 🕑2h

> ☝ **Objectif :** Publier sous forme textuelle, dans une page Web, les résultats de l'analyse des données.



> 🎯 **Livrable :** en fin d'activité, vous devez déposer sur Eprel le script du test unitaire `tu_Activité3.ipynb` validant votre travail.

### Activité 4 : Outils graphiques 🕑2h

> ☝ **Objectif :** Produire des représentations graphiques des résultats issus du traitement. Intégration de ces représentations dans la page Web.



> 🎯 **Livrable :** en fin d'activité, vous devez déposer sur Eprel le script du test unitaire `tu_Activité4.ipynb` validant votre travail.