# Dashboard


| Dossier/ | Fichier         |
|:---------|:----------------|
| P7/      |                 |
|          | dashboard.py    |
|          | home_credit_data_sample.csv        |
|          | logo.png        |
|          | model.pkl       |
|          | requirements.txt|
|          | tools.py        |


## Dashboard.py


Ce fichier génere une application Streamlit destinée à créer un tableau de bord interactif pour évaluer le score de crédit d'un client. Cette application utilise diverses bibliothèques Python telles que Streamlit, NumPy, Pandas, LightGBM, Matplotlib, Plotly, et PIL (Pillow) pour créer une interface utilisateur conviviale.

Voici une brève description des principales fonctionnalités de cette application :

**Chargement des bibliothèques et configuration initiale** : Le code commence par importer les bibliothèques nécessaires, définir la configuration de la page Streamlit, et créer une fonction pour définir la couleur en fonction de la probabilité de crédit.

**Chargement du modèle** : Une fonction load_model est définie pour récupérer un modèle de machine learning à partir d'une API ou localement si l'API n'est pas disponible. Le modèle est ensuite mis en cache pour améliorer les performances.

**Chargement des données** : Une fonction load_dataframe est utilisée pour charger un jeu de données à partir d'un fichier CSV, et les fonctionnalités pertinentes sont extraites à l'aide de la fonction set_feats.

**Prédiction du score de crédit** : Une fonction lgbm_prediction est définie pour prédire le score de crédit d'un client en utilisant le modèle chargé et les données du client.

**Mise à jour de l'interface utilisateur** : L'interface utilisateur est mise à jour en fonction de l'identifiant du client saisi par l'utilisateur. L'application affiche des informations sur le client, y compris le genre, le montant du crédit, l'âge, etc. Elle affiche également un indicateur de probabilité de crédit et un message indiquant si le client est accepté ou refusé.

**Visualisations** : Si un client est identifié (la prédiciton est supérieur à zéro), l'application affiche plusieurs onglets avec des visualisations telles que l'importance des fonctionnalités locales et globales, des comparaisons avec d'autres clients, et des informations sur les clients similaires.

L'application est conçue pour aider les utilisateurs à évaluer le risque de crédit d'un client en fournissant des informations visuelles et interactives. Elle peut être exécutée localement en utilisant la commande streamlit run XX/dashboard.py depuis le dossier Python.




## Home_credit_data_sample.csv

Les données clients incluses dans ce fichier sont prétraitées et prêtes à être utilisées. Cependant, en raison des limitations de taille imposées par GitHub, il ne contient qu'un échantillon de 25 000 clients.




## Requirements.txt 

Ce fichier liste les bibliothèques Python nécessaires pour exécuter le projet :

- Streamlit 1.24.0 : Création d'applications web interactives.
- NumPy 1.23.5 : Calculs numériques.
- LightGBM 2.2.3 : Gradient boosting pour l'apprentissage automatique.
- Matplotlib 3.7.2 : Visualisation de données.
- Plotly 5.12.0 : Création de graphiques interactifs.
- Numba 0.53.1 : Accélération du code Python.
- SHAP 0.42.1 : Explication des prédictions de modèles d'apprentissage automatique.

Remarque : Il a été nécessaire de spécifier la version de Streamlit, car lors de l'installation de la version web, une version plus récente de Streamlit était installée **après** l'installation des autres bibliothèques mentionnées précédemment. Cela entraînait un conflit avec NumPy, car la version 1.25 de Streamlit installait une version supérieure de NumPy.
  
  
  
## Model.pkl

Ce fichier contient le modéle lgbm entrainé sur l'ensemble des données. Ce modéle est utilisé uniquement si l'API n'est pas disponible.





## Tools.py 

Ce code est une collection d'outils qui utilisent SHAP, Plotly, Pandas et NumPy, pour générer des graphiques et des visualisations liés à l'importance des caractéristiques, ainsi que des comparaisons entre un client sélectionné et d'autres clients.


**get_plot_global_feature_importance** : Cette fonction prend le modèle et une liste de colonnes en tant qu'entrée. Elle calcule l'importance globale des fonctionnalités dans le modèle et génère un graphique à barres interactif pour les 20 fonctionnalités les plus importantes.

**get_plot_local_feature_importance** : Cette fonction prend le modèle et les données d'un client en entrée. Elle calcule l'importance locale des fonctionnalités pour ce client spécifique et génère un graphique à barres interactif pour les 20 fonctionnalités les plus importantes.

**barplot_client_majority** : Cette fonction compare les caractéristiques d'un client sélectionné aux moyennes des caractéristiques pour un groupe majoritaire. Elle génère un graphique à barres pour les caractéristiques telles que le montant du crédit, l'annuité, etc.

**barplot_same_clients** : Cette fonction compare les caractéristiques d'un client sélectionné à celles des clients similaires, en fonction de certaines conditions. Elle génère un graphique à barres pour les caractéristiques telles que EXT_SOURCE_3, EXT_SOURCE_2, etc.

Ces fonctions sont destinées à être utilisées dans dashboard.py

## Logo.png

Logo du projet, chargé dans dashboard.py


# API

| Dossier/ | Fichier         |
|:---------|:----------------|
| P7-backend/      |                 |
|          | app.py    |
|          |   lgbm_client_scoring.pkl      |
|          |   requirements.txt      |
|  tests/        |        |
|          |test_app.py |
|          |    _ init _.py     |


## App.py

Ce fichier génére une API Flask.

L'application charge notre modèle 'lgbm_client_scoring.pkl' à l'aide de pickle et offre la possibilité de récupérer ce modèle via la route /get-model en réponse aux requêtes HTTP GET.

2 routes en plus ont été codés afin de réaliser des tests: 
La route racine '/' renvoie un message d'accueil invitant les utilisateurs à ajouter l'identifiant d'un client à l'URL.
La route '/<id_client>' prend l'identifiant d'un client dans l'URL et renvoie un message incluant cet identifiant.



## Lgbm_client_scoring.pkl
Ce fichier contient le modéle lgbm entrainé sur l'ensemble des données.

## Requirements.txt

Ce fichier liste les bibliothèques Python nécessaires pour exécuter le projet :

- flask==2.3.3 : Création d'applications web. 
- pandas==2.0.3 : Manipulation et analyse des données. 
- pytest==7.4.0 : Test pour Python.

Ces dépendances sont installées dans l'environnement Python du projet lors du build du projet. Elles garantissent que les fonctionnalités spécifiques à ces versions sont disponibles pour le projet, ce qui aide à éviter les problèmes de compatibilité.

## Test_app.py

Ce code est un ensemble de tests pour l'API. Il utilise pytest pour effectuer des tests unitaires sur les routes de l'application. Voici les points clés du code :

- Le code importe les modules pytest, requests et l'API (app.py).

- Un client de test est définie.

- Trois fonctions de test sont définies :
  - La première fonction teste la route principale ('/') de l'application Flask en vérifiant si la réponse de la requête GET a un code de statut 200 (OK) et contient un message spécifique.
  - La deuxième fonction teste une route ('/<id_client>') en vérifiant si la réponse de la requête GET a un code de statut 200 et contient un message spécifique avec un identifiant client.
  - La troisième fonction teste une route spéciale ('/get-model') en vérifiant si la réponse de la requête GET a un code de statut 200.

Ces tests permettent de vérifier que les différentes routes de l'API fonctionnent correctement et renvoient les réponses attendues lorsqu'elles sont sollicitées. Ils sont exécutés lors du build pour garantir la qualité et la fiabilité de l'application.
Il peut être lancé en local depuis le dossier P7-backend/, avec la commande "pytest Tests/"

## _ init _.py

Ce fichier est nécessaire afin d'aiguiller la librairie Pytest.