You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Copy file name to clipboardExpand all lines: content/course/evaluation/_index.md
+7-10Lines changed: 7 additions & 10 deletions
Display the source diff
Display the rich diff
Original file line number
Diff line number
Diff line change
@@ -6,7 +6,6 @@ weight: 90
6
6
slug: evaluation
7
7
icon: user-graduate
8
8
icon_pack: fas
9
-
#linktitle: "Partie 4: Natural Language Processing (NLP)"
10
9
summary: |
11
10
Résumé des attentes pour les projets de fin d'année
12
11
type: book
@@ -19,13 +18,12 @@ Résumé :
19
18
- Un jeu de données (de préférence collecté par le groupe ou a minima enrichi)
20
19
- De la visualisation
21
20
- De la modélisation
21
+
* Les étudiants sont invités à proposer des sujets qui leur plaisent, à faire valider par le chargé de TD.
22
+
*__Le projet doit utiliser `Git` et être disponible sous
23
+
[github](https://github.com/) <ahref="https://github.com"class="github"><iclass="fab fa-github"></i></a> ou [gitlab](https://gitlab.com/)__ <ahref="https://gitlab.com"class="gitlab"><iclass="fab fa-gitlab"></i></a> (dépôt public ou dépôt privé à partager avec le chargé de TD)
22
24
* La __date du rendu__ est fixée au : **jeudi 6 janvier 2022 23h59**
23
25
* Le **XX janvier 2022**, auront lieu des __soutenances__
24
-
*__Le projet doit utiliser `Git` et être disponible sous
25
-
[github](https://github.com/) <ahref="https://github.com"class="github"><iclass="fab fa-github"></i></a> ou [gitlab](https://gitlab.com/)__ <ahref="https://gitlab.com"class="gitlab"><iclass="fab fa-gitlab"></i></a>
26
-
(dépôt public ou dépôt privé à partager avec le chargé de TD)
27
-
* Les étudiants sont invités à proposer des sujets qui leur plaisent, à faire valider par le chargé de TD.
28
-
* Un exemple de configuration d'intégration continue est disponible [ici](/getting-started/pythonCI) pour aider à avoir un notebook reproductible (:warning: ce n'est pas une garantie)
26
+
29
27
30
28
## Attentes du projet
31
29
@@ -74,19 +72,18 @@ Même si le projet n’est pas celui du cours de stats, il faut que la démarche
74
72
75
73
* Écrire un rapport sous forme de notebook
76
74
* Avoir un répertoire github avec le rapport. Les données utilisées doivent être accessibles également, dans le dépôt ou sur internet.
77
-
* Les dépôts Github où seul un *upload* du projet a été réalisé ne sont pas autorisés. Il faut utiliser effectivement le contrôle de version.
75
+
* Les dépôts Github où seul un *upload* du projet a été réalisé seront pénalisés. A l'inverse, les dépôts dans lequels le contrôle de version et le travail collaboratif ont été activement pratiqués (commits fréquents, pull requests, ..) seront valorisés.
78
76
* Le code contenu dans le rapport devra être un maximum propre (pas de copier coller de cellule, préférez des fonctions)
79
77
80
-
Le test à réaliser : faire tourner toutes les cellules de votre notebook et ne pas avoir d’erreur est une condition sine qua non pour avoir la moyenne.
81
-
Un exemple de configuration d'intégration continue est disponible [ici](/getting-started/pythonCI) pour aider à avoir un notebook reproductible (:warning: ce n'est pas une garantie)
78
+
Lors de l'évaluation, une attention particulière sera donnée à la *reproductibilité* de votre projet. Chaque étape (récupération et traitement des données, analyses descriptives, modélisation) doit pouvoir être reproduite à partir du notebook final. Pour les opérations qui prennent du temps (ex : webscraping massif, requêtage d'API avec des limites de nombre de requêtes, entraînement de modèle, etc.), vous devez inclure l'output (base de données, modèle entraîné..) dans le dépôt, afin que les étapes suivantes puissent s'éxecuter sans problème. Le test à réaliser : faire tourner toutes les cellules de votre notebook et ne pas avoir d’erreur est une condition sine qua non pour avoir la moyenne.
82
79
83
80
84
81
## Barême approximatif
85
82
86
83
* Données (collecte et nettoyage) : 4 points
87
84
* Analyse descriptive : 4 points
88
85
* Modélisation : 2 points
89
-
* Démarche scientifique tout au long du projet : 4 points
86
+
* Démarche scientifique et reproductibilité du projet : 4 points
90
87
* Format du code (code propre et github) : 2 points
0 commit comments