Skip to content

ArnaudGuibert/GrosData

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

71 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

GrosData

Project BigData

Groupe 6

Authors

Arnaud Guibert, Rémi Huguenot, Valentin Moreau

Détails Sujet

Score F1 :

  • score F1 donné par classe via sklearn.metrics.classification_report

Score de fairness :

  • calcul à la main du "disparate_impact" sur les données test

Structure du répertoire (scripts intégrés)

  • Dossier scripts : rassemblement des scripts créés
  • Dossier scripts/AWS : scripts de traitement à mettre dans l'instance EC2
  • Dossier scripts/AWS/models : fichier de Sauvegarde du modele entrainé
  • Dossier scripts/Hadoop : scripts lancés depuis la machine utilisateur pour la connection et communication à la VM Hadoop ainsi qu'aux instances AWS
  • Dossier scripts/MongoDB : description de la base mongoDB et scripts de sauvegarde des données

Structure du répertoire (scripts de développement de machineLearning)

  • Fichier machineLearning/build_model_saves.py : (ré)entraînement et scores de test pour les différents modèles (en jonglant avec les paramètres en fin de script)
  • Fichier machineLearning/predict.py : production du results.csv en fonction du modèle et du predict.py

About

Project BigData

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages