# Setup 💻

### A. Importer les librairies

In [1]:
import requests
import pandas as pd 
import matplotlib
%matplotlib inline

### B. Lire la documentation de l'API 

Nous allons utiliser l'API Open data de l'urssaf afin d'analyser l'impact du Covid sur les impayés des entreprises de plus de 10 salariés. 

Le jeu de donnée est présenté sur cette [page](https://open.urssaf.fr/explore/dataset/taux-rar-horsto-mensuels-entreprises-de-10-salaries-ou-plus/information/) 


# C'est parti 💪

## A. Récupérer les données 

### 1. En lisant la documentation de la base de données, pouvez-vous dire quelle est la fréquence d'actualisation du jeu de données ? 

<details><summary>Solution</summary>

Le jeu de données est actualisé tous les 20 jours. C'est l'avantage de passer par une API. En requêtant la même URL les données seront mises à jour toutes seules. 

</details>

### 2. Allez dans l'onglet [API](https://open.urssaf.fr/explore/dataset/taux-rar-horsto-mensuels-entreprises-de-10-salaries-ou-plus/api/), regardez la structure de la réponse et stockez l'url à appeler dans une variable appelée `url`. 

In [14]:
# Votre code ici 

<details><summary>Solution</summary>

```python 
url="https://open.urssaf.fr/api/records/1.0/search/?dataset=taux-rar-horsto-mensuels-entreprises-de-10-salaries-ou-plus&q=&rows=10&facet=dernier_jour_du_mois"
```

</details>



### 3. Requêtez cette url et stockez le résultat dans une variable `response`.

In [13]:
# Votre code ici 

<details><summary>Solution</summary>

```python 
response = requests.get(url)
```

</details>



### 4. Vérifiez que le code de la réponse est bien 200 

In [170]:
# Votre code ici 

<details><summary>Solution</summary>

```python 
print(response.status_code) # Le code 200 si tout est OK
```

</details>



### 5. Parsez la réponse en json et stockez-la dans une variable `data` 

In [12]:
# Votre code ici 

<details><summary>Solution</summary>

```python 
data = response.json()
data
```

</details>



### 6. Trouvez où sont les données. 

La structure des données obtenues est compliquée, prenez votre temps pour l'analyser. Votre objectif est de localiser précisément les données qui vous intéressent et de définir le chemin d'accès. 

Pour tester votre compréhension, extrayez la première ligne de données de la réponse. 

In [172]:
# Votre code ici

<details><summary>Solution</summary>

    
En regardant la structure de la réponse, nous nous rendons compte que la réponse est un `dictionnaire`. Les données qui nous intéressent sont stockées dans une liste au niveau de la clé `records`. 


```python 
data = {
    ... 
    "records": [
        {
            ...
            "fields" = {
                # Les données sont ici 
            }
        }
    ]
}
```
    
Pour afficher la première ligne il faut donc taper 

```python 
    data["records"][0]["fields"]
```
    
</details>


### 6. Créez une boucle pour manipuler la réponse et stockez les dictionnaires qui nous intéressent dans une liste appelée `fields`

In [11]:
# Votre code ici 

<details><summary>Solution</summary>

```python 
fields = []
for record in data["records"]:
    fields.append(record["fields"])
```
        
</details>


## B. Construire et préparer le DataFrame 

### 1. Transformez cette liste en DataFrame

In [174]:
# Votre code ici 

<details><summary>Solution</summary>

```python 
df = pd.DataFrame(fields)
```
        
</details>


### 2. Affichez les 5 premières ligne de ce DataFrame 

In [175]:
# Votre code ici 

<details><summary>Solution</summary>

```python 
df.head()
```
        
</details>


### 3. Regardez le type des données du DataFrame 

In [176]:
# Votre code ici 

<details><summary>Solution</summary>

```python 
df.dtypes
```
        
</details>


### 4. Le type de `dernier_jour_du_mois` est un objet. Transformez-le en date  

In [177]:
# Votre code ici 

<details><summary>Indice 1 </summary>

Pour savoir comment faire la <a href="https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.to_datetime.html
    " target="_blank"> documentation</a> est toujours une bonne piste. En allant voir les exemples on trouve souvent la solution. 
        
</details>


<details><summary>Indice 2</summary>

Lire la <a href="https://docs.python.org/3/library/datetime.html#strftime-and-strptime-format-codes" target="_blank"> documentation</a> sur les formats des dates en python
        
</details>


<details><summary>Solution</summary>

```python 
    df['dernier_jour_du_mois'] = pd.to_datetime(df['dernier_jour_du_mois'], format= '%Y/%m/%d')
```
</details>


### 5. Classez les données par date croissante 


In [178]:
# Votre code ici 

<details><summary>Solution</summary>

```python 
df = df.sort_values('dernier_jour_du_mois', ascending=True)
```
</details>


### 6. Dessinez le taux d'impayés en fin de mois en fonction de la date 

In [1]:
# Votre code ici 

<details><summary>Solution</summary>

```python 
df.plot(x='dernier_jour_du_mois',y='taux_d_impayes_fin_de_mois')
```
</details>
