Skip to content

Commit 81ce124

Browse files
avouacravouacr
andauthored
Quelques éléments sur la reproductibilité (#148)
Co-authored-by: avouacr <romain.avouac@insee.fr>
1 parent a1b8aaf commit 81ce124

File tree

1 file changed

+7
-10
lines changed

1 file changed

+7
-10
lines changed

content/course/evaluation/_index.md

Lines changed: 7 additions & 10 deletions
Original file line numberDiff line numberDiff line change
@@ -6,7 +6,6 @@ weight: 90
66
slug: evaluation
77
icon: user-graduate
88
icon_pack: fas
9-
#linktitle: "Partie 4: Natural Language Processing (NLP)"
109
summary: |
1110
Résumé des attentes pour les projets de fin d'année
1211
type: book
@@ -19,13 +18,12 @@ Résumé :
1918
- Un jeu de données (de préférence collecté par le groupe ou a minima enrichi)
2019
- De la visualisation
2120
- De la modélisation
21+
* Les étudiants sont invités à proposer des sujets qui leur plaisent, à faire valider par le chargé de TD.
22+
* __Le projet doit utiliser `Git` et être disponible sous
23+
[github](https://github.com/) <a href="https://github.com" class="github"><i class="fab fa-github"></i></a> ou [gitlab](https://gitlab.com/)__ <a href="https://gitlab.com" class="gitlab"><i class="fab fa-gitlab"></i></a> (dépôt public ou dépôt privé à partager avec le chargé de TD)
2224
* La __date du rendu__ est fixée au : **jeudi 6 janvier 2022 23h59**
2325
* Le **XX janvier 2022**, auront lieu des __soutenances__
24-
* __Le projet doit utiliser `Git` et être disponible sous
25-
[github](https://github.com/) <a href="https://github.com" class="github"><i class="fab fa-github"></i></a> ou [gitlab](https://gitlab.com/)__ <a href="https://gitlab.com" class="gitlab"><i class="fab fa-gitlab"></i></a>
26-
(dépôt public ou dépôt privé à partager avec le chargé de TD)
27-
* Les étudiants sont invités à proposer des sujets qui leur plaisent, à faire valider par le chargé de TD.
28-
* Un exemple de configuration d'intégration continue est disponible [ici](/getting-started/pythonCI) pour aider à avoir un notebook reproductible (:warning: ce n'est pas une garantie)
26+
2927

3028
## Attentes du projet
3129

@@ -74,19 +72,18 @@ Même si le projet n’est pas celui du cours de stats, il faut que la démarche
7472

7573
* Écrire un rapport sous forme de notebook
7674
* Avoir un répertoire github avec le rapport. Les données utilisées doivent être accessibles également, dans le dépôt ou sur internet.
77-
* Les dépôts Github où seul un *upload* du projet a été réalisé ne sont pas autorisés. Il faut utiliser effectivement le contrôle de version.
75+
* Les dépôts Github où seul un *upload* du projet a été réalisé seront pénalisés. A l'inverse, les dépôts dans lequels le contrôle de version et le travail collaboratif ont été activement pratiqués (commits fréquents, pull requests, ..) seront valorisés.
7876
* Le code contenu dans le rapport devra être un maximum propre (pas de copier coller de cellule, préférez des fonctions)
7977

80-
Le test à réaliser : faire tourner toutes les cellules de votre notebook et ne pas avoir d’erreur est une condition sine qua non pour avoir la moyenne.
81-
Un exemple de configuration d'intégration continue est disponible [ici](/getting-started/pythonCI) pour aider à avoir un notebook reproductible (:warning: ce n'est pas une garantie)
78+
Lors de l'évaluation, une attention particulière sera donnée à la *reproductibilité* de votre projet. Chaque étape (récupération et traitement des données, analyses descriptives, modélisation) doit pouvoir être reproduite à partir du notebook final. Pour les opérations qui prennent du temps (ex : webscraping massif, requêtage d'API avec des limites de nombre de requêtes, entraînement de modèle, etc.), vous devez inclure l'output (base de données, modèle entraîné..) dans le dépôt, afin que les étapes suivantes puissent s'éxecuter sans problème. Le test à réaliser : faire tourner toutes les cellules de votre notebook et ne pas avoir d’erreur est une condition sine qua non pour avoir la moyenne.
8279

8380

8481
## Barême approximatif
8582

8683
* Données (collecte et nettoyage) : 4 points
8784
* Analyse descriptive : 4 points
8885
* Modélisation : 2 points
89-
* Démarche scientifique tout au long du projet : 4 points
86+
* Démarche scientifique et reproductibilité du projet : 4 points
9087
* Format du code (code propre et github) : 2 points
9188
* Soutenance : 4 points
9289

0 commit comments

Comments
 (0)