# Chapitre 1 👌🏼 : Introduction aux API et au Web Scraping 🕸️


Dans ce cours, nous allons explorer comment interagir avec des API et comment effectuer du web scraping en Python.

Tu vas voir comment utiliser requests et beautifoul soup ✅

Si tu as la moindre question 🙌🏼 n'hésite pas.


## Utilisation des API

### Une API KESAKO 🫢 ?

Une API de façon générale, c'est un bloc qui vous permet d'échanger des données entres deux types de services. 

Vous voulez faire le lien entre une base de données 💽 et une application mobile 📱 BAMM 💥 >> API

En gros, vous la questionnez et elle vous renvoie un truc.

Dans les faits, c'est assez simple 😲:

1. Une action de quelque chose ou de quelqu'un envoie des informations à l'api 
2. L'api récupère les infos, les traitent (à ce moment, elle peut contacter une base de données, ou d'autres services)
3. L'api (de façon générale) renvoie quelque chose qui peut être lu du côté de l'utilisateur

Une api peut être utilisée pour effectuer, beaucoup, beaucoup, beaucoup de choses 🥵. En fonction des actions que nous allons lui demander de faire, il convient d'utiliser la bonne méthode http.

Pour utiliser une api, il faut de façon générale :
1. Utiliser une méthode **REST** (GET,POST ...)
2. Avoir une **url**
3. Accessoirement avec des paramètres

<div style="text-align: center;">
<img src="./image/composeapi.png" width="500" style="box-shadow: 2px 2px 5px rgba(0, 0, 0, 0.3);"/>
</div>

✅ De façon générale, la réponse d'une api est dans le format Json (format le plus fréquent dans les retours d'api). Mais tu peux aussi avoir de l'xml ou autre format.


#### 📡 Les 4 Méthodes Principales d’une API REST

1.	GET 📥
	- **Description** : Récupère des données depuis le serveur.
  
	-	**Exemple** : Obtenir la liste des utilisateurs.
	-	**Usage** : Utilisé pour lire ou consulter des ressources sans les modifier.
2.	POST 📨
	-	**Description** : Envoie de nouvelles données au serveur pour créer une ressource.
	-	**Exemple** : Ajouter un nouvel utilisateur.
	-	**Usage** : Utilisé pour créer de nouvelles entrées dans la base de données.
3.	**PUT** 🔄
	-	**Description** : Mets à jour des données existantes sur le serveur.
	-	**Exemple** : Modifier les informations d’un utilisateur existant.
	-	**Usage** : Utilisé pour remplacer entièrement une ressource ou pour mettre à jour certaines de ses propriétés.
4.	**DELETE** 🗑️
	-	**Description** : Supprime des données du serveur.
	-	**Exemple** : Supprimer un utilisateur spécifique.
	-	**Usage** : Utilisé pour enlever des ressources de la base de données.

 
Dans le cadre de ce cours, nous allons qu'utiliser la méthode **get** pour récupérer des donneés. Mais si tu souhaites t'instruire tu pourras lire cet article (après la masterclass):
- 📚 [Explication des méthodes Rest](https://blog.postman.com/what-are-http-methods/)
 

Dans notre cours, nous allons l'utiliser pour récupérer des données et comprendre comment ajouter des paramètres aux besoins.   

#### Le statut code de la réponse api ✅
Les codes d’état HTTP sont des nombres à trois chiffres renvoyés par un serveur en réponse à une requête HTTP effectuée par un client. Ils sont classés en différentes catégories selon leur premier chiffre, indiquant le type de réponse.

-	1xx 🕒 : Informationnel – Indique que la requête est en cours de traitement.
-	2xx ✅ : Succès – La requête a été traitée avec succès.
-	3xx 🔄 : Redirection – Nécessite une action supplémentaire du client.
-	4xx ❌ : Erreurs du Client – Problème avec la requête envoyée par le client.
-	5xx 🚫 : Erreurs du Serveur – Problème côté serveur lors du traitement de la requête.



### Un petit exemple ✍🏽

Nous allons prendre un exemple courant ! Imaginons que je souhaite aller récupérer des données sur l'open data de la région Réunion (exemple pris totalement au hasard) 😏


- [Lien du portail open data de la Région Réunion](https://data.regionreunion.com/explore)



<div style="text-align: center;">
<img src="./image/api.png" width="300" style="box-shadow: 2px 2px 5px rgba(0, 0, 0, 0.3);"/>
</div>

1.	📤 J’effectue ma requête avec l’URL du bloc précédent et avec la méthode GET.
    -	Envoyer une demande pour obtenir des données spécifiques.
2.	🖥️ Le serveur réceptionne ma requête et vérifie les paramètres.
    -	Le serveur reçoit la demande et s’assure que toutes les informations nécessaires sont présentes et correctes.
3.	🔍 En fonction des paramètres, il demande à la base de données les informations dont il a besoin.
    -	Le serveur interroge la base de données en fonction des critères spécifiés dans la requête.
4.	📥 Il récupère les données.
    -	Les données demandées sont extraites de la base de données.
5.	🔄 Il les retourne à l’utilisateur.
	    -	Le serveur envoie les données récupérées en réponse à la requête initiale.


Avec l'url suivante (URL que nous avons utilisée plus haut) :
- [Url de l'api région en get](https://data.regionreunion.com//api/explore/v2.1/catalog/datasets/lieux-remarquables-lareunion-wssoubik/records?limit=20&refine=commune%3A%22Saint-Louis%22)

Voici le résultat :
<div style="text-align: center;">
<img src="./image/api-response.png" width="300" style="box-shadow: 2px 2px 5px rgba(0, 0, 0, 0.3);"/>
</div>

J'ai bien les informations pour la commune de Saint Louis 🎉 

**💥 Quand tu effectues une requête sur ton navigateur c'est un GET qui est effectué**


Astuce ✌🏼:
- Si tu souhaites avoir le json retour formaté dans ton navigateur, tu peux installer (plus tard)
  - [Basic json formatter pour firefox 🦊](https://addons.mozilla.org/en-US/firefox/addon/basic-json-formatter/)
  - [Json formatter pour chrome 🏀](https://chromewebstore.google.com/detail/json-formatter/bcjindcccaagfpapjjmafapmmgkkhgoa?hl=en&pli=1)

### Exercice 1 : Récupérer des données avec `requests`

Normalement avec les prepwork vous avez déjà du installer votre environnement python 🫣. Si ce n'est pas le cas, installez rapidement requests avec la commande suivande:
````
pip install requests
````
**requests** est une bibliothèque Python pour envoyer des requêtes HTTP. Elle simplifie la communication avec des services web et des APIs en permettant aux développeurs d’effectuer facilement des opérations telles que **GET, POST, PUT, DELETE,** et bien d’autres, sans avoir à gérer les détails complexes du protocole HTTP.

La première api que tu vas utiliser ici, possède l'url suivante :

````
url = "http://localhost:1337/api/test-w-ts"
````

Voici la réponse de l'api:

<div style="text-align: center;">
<img src="./image/api_reponse.png" width="300" style="box-shadow: 2px 2px 5px rgba(0, 0, 0, 0.3);"/>
</div>


<!-- ![Reponse de l'api](./image/api_reponse.png) -->

Clic sur ce lien et tu verras la même chose :

[Lien de l'api](http://localhost:1337/api/test-w-ts)

Dans ce premier exercice tu vas:
- Importer requests
- Définir l'url de l'api 
- Effectuer ton get avec requests
- Convertir la réponse en dictionnaire
- Stocker le statut et la réponse de l'api dans 
  - status_code 
  - api_response_data (⛔️ attention il faut le message de la réponse pour passer le test pas juste le dictionnaire)
- Afficher la reponse de l'api qui doit être **"Accès à l'api ok"**
- Afficher le statut de la réponse qui doit être "**200**"




In [None]:
import requests

# URL de l'API
url = "http://localhost:1337/api/test-w-ts"

#J'effectue une requête GET
response =

# Vérifier le statut de la réponse
status_code =
# Je récupère la réponse dont j'ai besoin
api_response_data =

print("Le statut de la réponse:", status_code)

# Ce dont j'ai besoin
print(f"Ce dont j'ai besoin: \n  ---- {api_response_data}")

Verifie tes résultats avec le test en dessous 🤞🏼:

In [None]:
import unittest
from IPython.display import Markdown, display
import test_api

test_api.status_code = status_code
test_api.api_response = api_response_data

loader = unittest.TestLoader()
suite = loader.loadTestsFromTestCase(test_api.TestApiResponse)

runner = unittest.TextTestRunner()
result = runner.run(suite)

if result.wasSuccessful():
    print("✅ Tous les tests ont réussi! ✅")
else:
    print("❌ Échec des tests")
    for failure in result.failures:
        print(failure)

Si tu n'as que des ✅ Tous les tests ont réussi! Sinon, essai de nouveau !

### Exercice 2 : Récupérer et parcourir des données

Dans cet exercice, les choses deviennent un petit peu plus compliquées.. Un petit peu **promis** 🤞🏼

L'url change pour cet exercice et tu vas utiliser la suivante :

````
url = http://localhost:1337/api/articles
````

Les api utilisent parfois des façons différentes d'envoyer des paramètres. Ce qui est par contre assez commun, c'est d'avoir un **?** qui sépare l'url des paramètres que nous avons vu plus haut (dans le cas d'un get).

En gros:
- **url**/**?** **params**

Dans cet exercice, tu vas devoir lister l'ensemble des titres et des id que retourne l'url que je t'ai donné un peu plus haut. 

Cette api est generée par STRAPI et possède une documentation simple pour savoir comment donner en paramètres les champs dont j'ai besoin à mon api. 
- [Documentation de strapi](https://docs.strapi.io/dev-docs/api/rest/populate-select)


Astuce 💡:
- Check la section **Field Selection**


Ceux que tu vas devoir faire:
1. Définir la bonne url 
2. Effectuer un get avec request
3. Convertir la réponse en dictionnaire
4. Faire une liste de l'ensemble des id dans la variable id_list
5. Faire une liste de l'ensemble des titres dans la variable id_titles
6. Tester ton code 

In [None]:
# Définir l'url de l'API
url_articles = ""

# Faire une requête GET
response =

# Convertir la réponse en dictionnaire
data =

# Faire une liste avec une list comprehension pour id_list et id_titles
id_list=
id_titles =
print(id_titles)

Vérifie tes résultats avec le test en dessous 🤞🏼:

In [None]:
import test_api_2
from IPython.display import HTML, display

test_api_2.id_list = id_list
test_api_2.id_titles = id_titles

loader = unittest.TestLoader()
suite = loader.loadTestsFromTestCase(test_api_2.TestArticlesAPI)

runner = unittest.TextTestRunner()
result = runner.run(suite)

if result.wasSuccessful():
    display(HTML('''
    <div style="text-align: center;">
        <img src="./image/bravo.jpg" width="300" style="box-shadow: 2px 2px 5px rgba(0, 0, 0, 0.3);"/>
    </div>
    '''))
else:
    print("❌ Échec des tests")
    for failure in result.failures:
        print(failure)

#### À ce stade, tu gères déjà bien les trucs essentiels du web 🎉:

-	Les méthodes HTTP : Tu sais quand utiliser GET, POST, etc., pour interagir avec une API.
-	Les status codes : Genre le 200, 404, 500… tu sais direct si tout va bien ou si ça plante.
-	Les paramètres d’URL : Tu sais ajouter des filtres dans l’URL pour récupérer juste ce dont tu as besoin.
-	Parser un JSON : T’es capable de récupérer des données d’une requête et les organiser en listes ou dicos.

----

## Partie 2 : Web Scraping avec BeautifulSoup

### Qu'est-ce que le Web Scraping ?

Le web scraping, c’est l’art d’extraire des infos d’un site web de manière automatisée.

Dans la partie précédente, je t’ai donné la grande nouvelle… Toutes les pages web sont accessibles via un simple **GET**.

➡️  Mais parfois, les données que tu attends ne sont pas là directement. Au lieu des articles, tu ne récupères que le squelette 🩻 du site. Pourquoi ? Parce que le site fait peut-être appel à une API en arrière-plan qui met du temps à répondre. Résultat : tu te retrouves avec une page vide ou incomplète.

Nous n'aurons pas à traiter cet exemple dans ce cours, mais si tu veux une piste pour régler ce type de problème, tu peux te tourner vers **Selenium** pour scraper des sites en python. 

**En résumé :**

-	Si la page est rendue via JavaScript (comme un site dynamique où les données arrivent après un certain temps), utilise **Selenium**.
-	Si les données sont dans le HTML dès le chargement initial (pas besoin d’attendre du JS), alors **requests** + **BeautifulSoup** suffisent.

**BeautifulSoup** 🍲, c’est une bibliothèque Python qui te permet de naviguer et extraire des données facilement à partir de pages HTML ou XML. En gros, elle t’aide à trouver et parser des éléments dans une page web, comme des titres, des liens, des paragraphes, etc.

Tu lui donnes le contenu **HTML** d’une page, et elle te permet de chercher rapidement des trucs comme des **balises** , des **classes**, des **ID**, ou d’autres éléments pour les **scraper**.

C’est super pratique quand tu utilises requests ou un autre moyen pour récupérer le HTML d’une page et que tu veux **extraire** des infos spécifiques.



### Exercice 1 : Extraire les titres des articles d'une page web 

Rendez-vous 👮🏼‍♂️  sur :
- [HackerNews](https://news.ycombinator.com/)

Vous êtes censé voir un ensemble d'articles un peu comme ça:

<div style="text-align: center;">
<img src="./image/hackernews.png" width="500" style="box-shadow: 2px 2px 5px rgba(0, 0, 0, 0.3);"/>
</div>

On peut déja identifier une structure qui se répéte plusieurs fois :
  - Des titres
  - Des auteurs
  - Des dates 
  - Des sites 

Dans toutes cette répétition d'article, on peut y voir un composant qui revient très souvent ⬇️ ⬇️ ⬇️:
<div style="text-align: center;">
<img src="./image/bloc_h.png" width="500" style="box-shadow: 2px 2px 5px rgba(0, 0, 0, 0.3);"/>
</div>

Pour cet exercice, il va falloir **scraper** sur la page d'hacker news 🏴‍☠️:
- Chaque titre 
- Chaque auteur


Mais **JAMY** comment on fait ca ? 🤓

<div style="text-align: center;">
<img src="./image/buthow.jpg" width="300" style="box-shadow: 2px 2px 5px rgba(0, 0, 0, 0.3);"/>
</div>

Quand tu vas sur hacker news, que tu fais clic droit et enfin voir le code source:
<div style="text-align: center;">
<img src="./image/option.png" width="500" style="box-shadow: 2px 2px 5px rgba(0, 0, 0, 0.3);"/>
</div>


Tu arrives sur une page du style:

<div style="text-align: center;">
<img src="./image/sourhn.png" width="700" style="box-shadow: 2px 2px 5px rgba(0, 0, 0, 0.3);"/>
</div>

Tu commence à avoir une idée ?  🧠

Le concept est en soit assez simple, tu dois: 
1. Identifier dans le code source de la page les informations dont tu as besoin 
2. Faire une request GET sur le site de hacker news
3. Parser tes données avec beautifoulsoup > Donc le code html de la page
4. Isoler les éléments dont tu as besoin
5. Placer dans une liste tous les titres et tous les auteurs


**No worries 🕵🏼‍♂️ nous allons le faire ensemble.**


In [None]:
#Importer les lib dont j'ai besoin
import requests
from bs4 import BeautifulSoup

# URL de la page à scraper
url = "https://news.ycombinator.com/"

# Obtenir le contenu de la page
response = requests.get(url)

# Parser le HTML
soup = BeautifulSoup(response.text, 'html.parser')

# Trouver tous les titres d'articles avec un find all sur des éléments uniques
titles = soup.find_all('span', class_='titleline')
title_list=[i.text  for i in titles]

author = soup.find_all('a', class_='hnuser')
author_list=[i.text  for i in author]

print(f"La liste des titres des articles d'hackerNews :\n{title_list}\n ainsi que le nombre d'éléments de cette liste: {len(title_list)}")
print(f"La liste des auteurs des articles d'hackerNews :\n{author_list}\n ainsi que le nombre d'éléments de cette liste: {len(author_list)}")


**Good 🎉**

Mais on a un petit problème... 🤷🏽‍♂️
La liste des titres, n'a pas la même longueur que celle des auteurs (en espérant que cela soit aussi le cas le jour de la masterclass 🥲)
Il faut donc améliorer ce script pour que cela soit exploitable, peut-être pour une futur api ? 
Convertissons en dictionnaire nos deux listes précédentes et de façon structurée s'il vous plaît !

Le début reste le même ..

À l'inverse de tout à l'heure, au lieu de cibler directement les éléments dont j'ai besoin, je vais essayer de trouver une div plus haute dans la hiérarchie qui englobe tout mon composant. Et j'enchaîne par une for loop afin de récupérer le titre et auteur que je place dans une liste de dictionnaires !! 🥵

In [None]:
# URL de la page à scraper
url = "https://news.ycombinator.com/"

# Obtenir le contenu de la page
response = requests.get(url)

# Parser le HTML
soup = BeautifulSoup(response.text, 'html.parser')

# J'identifie le point d'accroche possibe
tr_tags =

#J'ajoute mes id à ma liste tr_tags_list en effectuant le get je récupére l'id de mon tag tr
tr_tags_list =

# tr_title = soup.find('tr', id='41614949').find('span', class_='titleline').find('a').string
# tr_auteur = soup.find('span', id='score_41614949').find_parent('span', class_='subline').find('a',class_="hnuser").string

#Fonction lambda pour obtenir le titre et l'auteur
get_tr_title =

#Fonction lambda pour obtenir l'auteur
get_tr_auteur =

final_dict = [{ "id": key, "title": get_tr_title(key), "author": get_tr_auteur(key)} for key in tr_tags_list]
print(final_dict)

Ok, nous allons y aller doucement. 🐢
Je vais t'éxpliquer en détail comment ca fonctionne. 

Premièrement, dans le code source je remarque que je ne peux pas boucler sur une balise avec un **find_all**.

Le find_all va me **grouper** tout ce qu'il va trouver avec les conditions que je lui ai donné ici :
- Les balises ```tr```
- Qui ont une balise enfant ```span``` qui possèdent la classe ```subline```

Si cette condition n'est pas respectée, le ```tr``` n'est pas dans ma liste retour. 

Mon titre et mon auteur sont dans deux balises séparées ... C'est embêtant. 
Nous le voyons bien dans l'image suivante:
<div style="text-align: center;">
<img src="./image/group.png" width="700" style="box-shadow: 2px 2px 5px rgba(0, 0, 0, 0.3);"/>
</div>

Il faut donc trouver une solution. 
Pour ce faire, on remarque ça dans le code source: 
<div style="text-align: center;">
<img src="./image/reflexion.png" width="700" style="box-shadow: 2px 2px 5px rgba(0, 0, 0, 0.3);"/>
</div>

Il y a donc bien toujours une **solution** 🎉 

Pour récupérer le titre, voilà ce que je fais dans cette lambda function:

````python 
soup.find('tr', id=id).find('span', class_='titleline').find('a').string
````
C'est mieux expliqué en image: 
<div style="text-align: center;">
<img src="./image/firstsoup.png" width="700" style="box-shadow: 2px 2px 5px rgba(0, 0, 0, 0.3);"/>
</div>


Pour le deuxième bloc c'est un tout petit peu plus tricky:
````python
soup.find('span', id=f'score_{id}').find_parent('span', class_='subline').find('a', class_="hnuser").string
````
<div style="text-align: center;">
<img src="./image/groupsoup2.png" width="700" style="box-shadow: 2px 2px 5px rgba(0, 0, 0, 0.3);"/>
</div>

**Well done !! 👌🏼
Maintenant c'est à vous de jouer dans l'exercice 2!**

### Exercice 2 : À votre tour de scraper !!! ⭐️


Dans le cadre de cette masterclass, on vous met gracieusement à disposition un site test de scraping 🎉: 
- [Site Scraping masterclass 1](http://localhost:3000)

Le but de cet exercice va être le suivant, tu dois avoir exactement les mêmes résultats que cette requête api:

````python
url_articles = "http://localhost:1337/api/articles?fields[0]=id&fields[1]=title&fields[2]=body"
````
Qui ressemble à cela:
<div style="text-align: center;">
<img src="./image/newrequeststrapi.png" width="900" style="box-shadow: 2px 2px 5px rgba(0, 0, 0, 0.3);"/>
</div>


Sur le site, tu vas avoir une architecture comme celle la:

1. Pour la liste des articles
<div style="text-align: center;">
<img src="./image/whatiwant1.png" width="700" style="box-shadow: 2px 2px 5px rgba(0, 0, 0, 0.3);"/>
</div>

2. Pour le corps des articles (le body)
<div style="text-align: center;">
<img src="./image/whatiwant2.png" width="700" style="box-shadow: 2px 2px 5px rgba(0, 0, 0, 0.3);"/>
</div>

Il y a deux petits **pièges** 😬:
- Le site a une pagination, promis je ne l'ai pas fait exprès 🤞🏼
- Le body des articles se trouve à une autre URL que celle de la page d'acceuil 😇


**Comment te lancer dans cet exercice ? 🚀**
1.	Analyse bien les données du JSON que tu obtiens avec la requête vers url de l’API précédente. 🧐
2.	Regarde l’URL de la page d’accueil du site et observe comment fonctionne la pagination. Est-ce que l’URL change ou pas ? 🔄
3.	Vérifie la page article : de quoi est-elle composée ? Est-ce que j’ai des informations sur la page d’accueil qui me permettent d’accéder directement à la page article ? 🔗
4. Est-ce que je peux scraper tout le site avec un simple GET ? ❓ (👉 NON ❗)
5. Combien de pages j'ai ??? 🙄

🎯 Ton objectif : créer une liste de dictionnaires où chaque objet contiendra les champs suivants (bien remplis, bien sûr) :

```python
scrap_site_data = [
  {"id": 1, 
  "title": "Un titre random", 
  "body": "Un body random"},
  # etc...
]
```

📋 Pour chaque élément, assure-toi d’inclure :

-	id : l’identifiant unique de l’objet
-	title : le titre de l’article ou de la section
-	body : le contenu ou un résumé de l’article


🚀 Laisse-moi te filer un coup de pouce :

-	L’URL d’un article ressemble à ça : ```/article/{id}```
-	Pour naviguer entre les pages, tu dois simplement ajouter ce paramètre à l’URL : ```?page={pageNumber}```.
-	Pour trouver l’id… je te laisse fouiller un peu ! 🔍😉 Peut-être dans le code source de la page ? I dont know 🤷🏽‍♂️


Voila la checklist qu'on doit valider:
- ⬜️ Connaître le nombre de pages de façon programmatique
- ⬜️ Scraper le nombre de pages disponibles
- ⬜️ Accéder à chaque page pour scraper le body d'un article

<div style="text-align: center;">
<img src="./image/justdoit.jpg" width="400" style="box-shadow: 2px 2px 5px rgba(0, 0, 0, 0.3);"/>
</div>

##### Étape 1 - Récupère le nombre de pages 📖

In [90]:
import requests
from bs4 import BeautifulSoup
import re
urlToGet='http://localhost:3000'
#Je récupère la home page de mon site
website = requests.get(urlToGet)

#Je le parse avec Bs4
soup = BeautifulSoup(website.text, 'html.parser')
#Maintenant voyons voir combien de pages j'ai
pages =
nbPages=
print(f"Nombre de page: {nbPages}")

Nombre de page: 2


Dans le code source 💾 de cette page voilà ce que je remarque:
<div style="text-align: center;">
<img src="./image/pagination.png" width="700" style="box-shadow: 2px 2px 5px rgba(0, 0, 0, 0.3);"/>
</div>

Mais le **gTxG4** ou encore le **ro1Hj** me fait un peu peur 😱. Du coup, je pense qu’il y a de fortes chances que Home_pagination reste fixe, mais que cet ID mystérieux, probablement généré dynamiquement par la technologie du site, change régulièrement.
 
C’est pour cela que j’utilise cette commande :
```python
pages = soup.find_all('a', class_=re.compile(r'^Home_pagination'))
```

Elle demande de chercher la balise ```a``` qui contient une classe commençant par ```Home_pagination```. J’utilise une expression régulière pour m’assurer que cette donnée est bien présente : le symbole ```^``` signifie “**commence par**”.

➡️➡️➡️  [Si vous voulez en apprendre plus sur les expressions régulières](https://www.rexegg.com/regex-quickstart.php)  ⬅️⬅️⬅️

Notre checklist : 
- ✅ Connaître le nombre de pages de façon programmatique
- ⬜️ Scraper le nombre de pages disponibles
- ⬜️ Accéder à chaque page pour scraper le body d'un article

Et maintenant, en route pour le grand scrapathon sur le nombre de pages défini plus haut ! 🎉🚀

##### Étape 2 - Scraper les n pages et ... accéder à chaque page ...


In [121]:
urlToGet='http://localhost:3000'

get_article_body =
get_article_title =

listResult = []


print(listResult)


[{'id': '2', 'title': 'Comment jongler avec des baguettes magiques', 'body': 'Harry Potter nous raconte comment il a appris à jongler avec des baguettes magiques sans accident grave. Après un incident fâcheux avec Ron et une transformation en escargot, il a perfectionné sa technique. Maintenant, il ne transforme plus ses amis, mais il conseille de ne pas jongler avec des baguettes empruntées. Elles ont souvent un caractère capricieux et pourraient décider d’invoquer un Basilic au mauvais moment. Bref, le jonglage magique : à pratiquer avec modération !'}, {'id': '3', 'title': 'Le guide ultime du sabre laser', 'body': "Luke Skywalker nous explique que manier un sabre laser, ce n'est pas juste un exercice de style, mais un art ancestral. Il raconte comment son premier duel contre Dark Vador l’a aidé à mieux comprendre l’équilibre entre la lumière et l’obscurité. Il recommande de commencer avec des melons avant de passer à des combats réels. Si vous vous trouvez à court de batterie, pas d

**Notre checklist 🎉:**
- ✅ Connaître le nombre de pages de façon programmatique
- ✅ Scraper le nombre de pages disponibles
- ✅ Accéder à chaque page pour scraper le body d'un article

