# Projet 7

## Mission : Intégrez et optimisez le système MLOps

L'objectif de cette partie sera de créer une interface API permettant de faire une prédiction à l'aide du modèle entrainé.

Le client pourra, via une requête HTTPS, envoyer de nouvelles données clients formatées selon les features du dataset d’entraînement et recevoir en retour les probabilités de solvabilité

Workflow :

1- création de l'API dans un fichier main.py 

2- on définit la fonction de prédiction qui appelle le pipeline du modèle entrainé dans un endpoint de l'API

3- on test en local le fonctionnement de l'API

4- on met en production l'API : déploiement sur le cloud

5- on test l'API en production

## Local API

In [1]:
# import des librairies
import pandas as pd
import requests
import json

In [26]:
# définition de l'url de l'API
url = "http://127.0.0.1:8000/predict"

In [27]:
# 1- on va récupérer un échantillon de données
data = pd.read_csv("../data_test.csv")

In [28]:
# 2- on va sélectionner un échantillon de 10 clients
data_sample = data.sample(10, random_state=42)

Nos données se présentent sous forme d'un DataFrame Pandas, les formats nativement acceptés par les APIs sont les formats json.
Il existe plusieurs techniques pour formater les données en json, la plus courante consiste à utiliser JSON orienté 'records'. Cette technique permet de transformer chaque ligne du dataframe en un dictionnaire et toutes les lignes, s'il y en a plusieurs, en liste.

In [29]:
# 3- on va convertir cet échantillon en json
data_json = data_sample.to_json(orient="records")

In [30]:
data_json

'[{"EXT_SOURCE_2":0.7718903221,"EXT_SOURCE_3":null,"CREDITCARD_CREDIT_UTILIZATION_MEAN":null,"CREDITCARD_CNT_DRAWINGS_ATM_CURRENT_MEAN":null,"CREDITCARD_CNT_DRAWINGS_CURRENT_MAX":null,"EXT_SOURCE_1":0.6370605089,"CREDITCARD_CREDIT_UTILIZATION_MAX":null,"DAYS_CREDIT_mean":null,"CREDITCARD_CNT_DRAWINGS_CURRENT_MEAN":null,"CREDIT_ACTIVE_Closed_mean":null,"DAYS_BIRTH":-11348.0,"CREDIT_ACTIVE_Active_mean":null,"DAYS_CREDIT_min":null,"CREDITCARD_AMT_INST_MIN_REGULARITY_MEAN":null,"CREDITCARD_CREDIT_UTILIZATION_STD":null,"DAYS_CREDIT_UPDATE_mean":null,"CREDITCARD_CNT_DRAWINGS_ATM_CURRENT_MAX":null,"REGION_RATING_CLIENT_W_CITY":1.0,"REGION_RATING_CLIENT":1.0,"NAME_INCOME_TYPE_Working":1.0,"NAME_EDUCATION_TYPE_Higher education":1.0,"DAYS_ENDDATE_FACT_min":null,"MONTHS_BALANCE_min":-24.0,"DAYS_LAST_PHONE_CHANGE":-730.0,"CODE_GENDER_M":1.0,"CODE_GENDER_F":0.0,"DAYS_DECISION_min":-730.0,"DAYS_ENDDATE_FACT_mean":null,"DAYS_ID_PUBLISH":-3953.0,"REG_CITY_NOT_WORK_CITY":0.0,"DAYS_CREDIT_std":null,"NAM

On a bien une liste de dictionnaires au format json utilisable par l'api

On a deux façon de tester l'API :

1- en utilisant cURL en bash dans un terminal
```bash
curl -X POST "http://127.0.0.1:8000/predict" \
     -H "Content-Type: application/json" \
     --data-binary @data.json # fichier json
```

2- en utilisant la lib python request
```python
response = requests.post(
     url,
     data=data_json,
     headers={"Content-Type": "application/json"}
     )
```

In [None]:
# 4- on va envoyer une requête POST à l'API
response = requests.post(
    url, # adresse de l'API
    data=data_json, # données en format JSON
    headers={"Content-Type": "application/json"}) # type de contenu envoyé = JSON

In [None]:
# 5- on affiche la réponse de l'API
print("Status Code:", response.status_code)
print("Response JSON:", response.text) # response.json() si la réponse est en JSON