# Extraction de données : API

## Qu'est-ce qu'une API ?

Le terme API signifie Application Programming Interface, ce que l'on pourrait traduire en français par "interface de programmation d'application". En pratique, une API est un ensemble de règles et de conventions qui permettent à deux systèmes de communiquer entre eux. Une API peut être vue comme un pont entre deux applications, qui permet d’échanger des informations ou de déclencher des actions.
Pour bien comprendre, prenons une analogie simple : imaginez que vous êtes au restaurant. Le menu représente ce que vous pouvez commander (les services offerts), vous êtes le client, et le serveur est l’API. Vous faites une commande au serveur, qui va la transmettre à la cuisine, et ensuite vous apporter la réponse. Vous ne voyez pas la cuisine (le système interne), vous interagissez uniquement avec l'interface : le serveur.

Dans le contexte du web, une API permet à un logiciel (par exemple une application mobile ou un site web) de demander des informations à un autre système (comme une base de données, un service météo, ou une plateforme de paiement).


## APIs REST

La majorité des APIs modernes sont de type REST (REpresentational State Transfer). Elles utilisent le protocole HTTP, tout comme les sites web, et s’appuient sur des méthodes standard (GET, POST, PUT, DELETE).
Reprenons notre exemple du restaurant, vous êtes le client, l’API est le serveur, et la cuisine est la base de données ou le système interne, les méthodes:     
● GET : permet de récupérer des informations. Par exemple pour consulter la liste des plats, lire les détails d’un produit ou consulter une commande existant       
● POST : permet de créer une nouvelle ressource. Par exemple pour passer une commande       
● PUT : permet de modifier une ressource existante. Par exemple pour modifier une commande passée précédemment ou corriger une information      
● DELETE : permet de supprimer une ressource. Par exemple pour annuler une commande     

# Premier contact avec une API

## Exercice 1:
1. En utilisant cette bibliothèque, faite une requête get sur l’url https://jsonplaceholder.typicode.com/posts          
    a. Stockez le résultat de cette requête dans une variable           
    b. Explorez l’objet stocké dans cette variable          
2. Que signifie le code “statut”?
3. Dans quel attribut trouve t’on des donnés?

In [1]:
# 1/ Importation de la bibliothèque requests
import requests

url = "https://jsonplaceholder.typicode.com/posts"

# 1. a on stocke la reponse de la requete get dans une variable "reponse"
reponse = requests.get(url)
print(reponse)

<Response [200]>


In [2]:
# 1.b on explore reponse
reponse.content  # affiche le contenu brut de la réponse
reponse.text     # affiche le contenu de la réponse sous forme de texte
reponse.json()  # convertit le contenu JSON en un dictionnaire Python
reponse.headers  # affiche les en-têtes de la réponse
reponse.status_code  # affiche le code de statut HTTP de la réponse*
reponse.elapsed  # affiche le temps écoulé pour obtenir la réponse
reponse.url  # affiche l'URL finale après les redirections (le cas échéant)reponse.cookies  # affiche les cookies renvoyés par le serveur
reponse.raise_for_status()  # lève une exception pour les codes d'erreur HTTP
reponse.history  # affiche l'historique des redirections (le cas échéant)
reponse.request  # affiche les détails de la requête envoyée
reponse.raw  # accès au flux brut de la réponse
reponse.iter_content(chunk_size=1024)  # itère sur le contenu de la réponse par morceaux

<generator object iter_slices at 0x0000021295DC5EE0>

In [3]:
# 2/ on affiche le code de statut de la reponse
reponse.status_code 
# 200 signifie que la requête a réussi, à défaut 404 signifie que la ressource n'a pas été trouvée.

200

In [4]:
# 3/ on trouve-t'on les données qui nous intéressent ?
# on peut tout trouver en transfrormant le json en dictionnaire python
Repjson=reponse.json()  # convertit le contenu JSON en un dictionnaire Python
Repjson[0]  # affiche le premier élément de la liste des posts
print(Repjson[0]['title'])  # affiche le titre du premier post
print(Repjson[0]['body'])  # affiche le corps du premier post
print(Repjson[0]['userId']) # affiche l'ID de l'utilisateur du premier post
print(Repjson[0]['id']) # affiche l'ID du premier post

sunt aut facere repellat provident occaecati excepturi optio reprehenderit
quia et suscipit
suscipit recusandae consequuntur expedita et cum
reprehenderit molestiae ut ut quas totam
nostrum rerum est autem sunt rem eveniet architecto
1
1


## Exercise 2 : The Cat and Dog API

https://thecatapi.com/

A l’aide de l’API et de la bibliothèque requests, écrire pour chaque exercice une fonction en python qui:

    1. Récupère une image aléatoire de chat ou de chien     
    2. Récupère 5 images aléatoires     
    3. Récupère 3 images aléatoires de type GIF uniquement      
    4. Récupère la liste complète des races de chats ou de chiens       
    5. Récupère 3 images de la race "bengal" (ou une autre race si vous travaillez avec les chiens)     
    6. Envoie un vote positif pour une image de chat ou de chien            
    7. Supprime le vote que tu viens de créer       
    8. Fais une requête volontairement incorrecte       
    9. (Bonus) Envoie une image personnalisée de ton chat ou de ton chien       

### 1. Récupérer une image aléatoire 

In [5]:
import requests
from IPython.display import Image, display


def random_image_url(url=None):
    '''
    url: str de l'endpoint de l'API
    '''
    r = requests.get(url)
    r.raise_for_status()

    data = r.json()
    return data[0]["url"]

In [6]:
## essaie surles chats
url_cat = "https://api.thecatapi.com/v1/images/search"
random_cat = random_image_url(url=url_cat)
display(Image(url=random_cat, width=600))

In [7]:
# essaie sur les chiens
url_dog = "https://api.thedogapi.com/v1/images/search"
random_dog = random_image_url(url=url_dog)
display(Image(url=random_dog, width=800, unconfined=True))

### 2. Récupèrer 5 images aléatoires 

In [8]:
def random_images(url=None, n=5, width=350):
    '''
    url: str de l'endpoint de l'API
    n = n images aléatoires à afficher
    width = largeur des images affichées
    '''
        
    r = requests.get(url, params={"limit": n})
    r.raise_for_status()

    data = r.json() # liste de dictionnaires
    urls = [item["url"] for item in data][:n]
    
    for u in urls:
        display(Image(url=u, width=width, unconfined=True)) ## unconfined pour éviter le recadrage automatique
    
    return urls

In [9]:
url_cat = "https://api.thecatapi.com/v1/images/search"
random_images(url=url_cat, n=5, width=400)


['https://cdn2.thecatapi.com/images/f5.jpg',
 'https://cdn2.thecatapi.com/images/mb.jpg',
 'https://cdn2.thecatapi.com/images/43d.gif',
 'https://cdn2.thecatapi.com/images/akq.jpg',
 'https://cdn2.thecatapi.com/images/b1p.jpg']

In [10]:
url_dog = "https://api.thedogapi.com/v1/images/search"
random_images(url=url_dog, n=5)


['https://cdn2.thedogapi.com/images/HkP7Vxc4Q_1280.jpg',
 'https://cdn2.thedogapi.com/images/ByCyKunBQ_1280.jpg',
 'https://cdn2.thedogapi.com/images/B1OLt_3rQ_1280.jpg',
 'https://cdn2.thedogapi.com/images/UDciB__0I.jpg',
 'https://cdn2.thedogapi.com/images/p4xvDeEpW.jpg']

### 3. Récupère 3 images aléatoires de type GIF uniquement 

In [11]:
def random_gif(url=None, n=3, width=350):
    '''
    url: str de l'endpoint de l'API
    n = n gif aléatoires à afficher
    width = largeur des images affichées
    '''
    params= {"limit": n, "mime_types":"gif"}    
    r = requests.get(url, params=params)
    r.raise_for_status()

    data = r.json() # liste de dictionnaires
    gif_urls = [item["url"] for item in data][:n]
    
    for u in gif_urls:
        display(Image(url=u, width=width, unconfined=True)) ## unconfined pour éviter le recadrage automatique
    
    return gif_urls

In [12]:
random_gif(url=url_cat, n=3)

['https://cdn2.thecatapi.com/images/7b.gif',
 'https://cdn2.thecatapi.com/images/88.gif',
 'https://cdn2.thecatapi.com/images/140.gif']

In [13]:
random_gif(url=url_dog, n=3)

['https://cdn2.thedogapi.com/images/BJZlTPpVX.gif',
 'https://cdn2.thedogapi.com/images/r156pDT4m.gif',
 'https://cdn2.thedogapi.com/images/By-GQTaNQ.gif']

 ### 4. Récupèrer la liste complète des races de chats ou de chiens 

In [14]:
def liste_race(url=None):
    '''
    url: str de l'endpoint de l'API
    '''
    r = requests.get(url)
    r.raise_for_status()

    data = r.json() # liste de dictionnaires
    race_noms=[item["name"] for item in data]
        
    return race_noms

In [15]:
race_chat= liste_race(url= "https://api.thecatapi.com/v1/breeds")
print("il y a", len(race_chat), "races de chat dans l'API TheCatAPI")
print("Les 10 première races:",race_chat[:10])
print("Les 10 dernières races:", race_chat[-10:])

il y a 67 races de chat dans l'API TheCatAPI
Les 10 première races: ['Abyssinian', 'Aegean', 'American Bobtail', 'American Curl', 'American Shorthair', 'American Wirehair', 'Arabian Mau', 'Australian Mist', 'Balinese', 'Bambino']
Les 10 dernières races: ['Siberian', 'Singapura', 'Snowshoe', 'Somali', 'Sphynx', 'Tonkinese', 'Toyger', 'Turkish Angora', 'Turkish Van', 'York Chocolate']


In [16]:
race_chien = liste_race(url="https://api.thedogapi.com/v1/breeds")
print("il y a", len(race_chien), "races de chiens dans l'API TheDogAPI")
print("Les 10 première races:",race_chien[:10])
print("Les 10 dernières races:", race_chien[-10:])



il y a 170 races de chiens dans l'API TheDogAPI
Les 10 première races: ['Affenpinscher', 'Afghan Hound', 'Airedale Terrier', 'Akbash Dog', 'Akita', 'Alapaha Blue Blood Bulldog', 'Alaskan Husky', 'Alaskan Malamute', 'American Bulldog', 'American Bully']
Les 10 dernières races: ['Weimaraner', 'Welsh Springer Spaniel', 'West Highland White Terrier', 'Whippet', 'White Shepherd', 'Wire Fox Terrier', 'Wirehaired Pointing Griffon', 'Wirehaired Vizsla', 'Xoloitzcuintli', 'Yorkshire Terrier']


### 5. Récupèrer 3 images de la race "bengal", et dogue allemand pour les chiens (Great Dane en anglais)  

In [21]:
from urllib.parse import urljoin

def specific_race(base_url=None, race=None, n=3, width=350):
    '''
    base_url : "https://api.thecatapi.com/" ou "https://api.thedogapi.com/"
    n = n images aléatoires à afficher
    width = largeur des images affichées
    race = nom de la race recherchée, ici "Bengal" par défaut
    '''
    endpoint_race = "v1/breeds"
    url_race = urljoin(base_url if base_url.endswith("/") else base_url + "/", endpoint_race)
        
    r = requests.get(url_race)
    r.raise_for_status()
    data = r.json() # liste de dictionnaires
    
    # filtre des données sur la race
    race_spe = [item for item in data if item.get("name") == race]
    if not race_spe:
        raise ValueError(f"Race '{race}' introuvable sur {base_url}")
    
    race_id = race_spe[0]["id"]
    
    # endpoint images
    endpoint_image= "v1/images/search"
    url_image = urljoin(base_url if base_url.endswith("/") else base_url + "/", endpoint_image)
    
    r2 = requests.get(url_image, 
                      params={"limit": n, "breed_id":race_id})
    r2.raise_for_status()
    images = r2.json() # liste de dictionnaires
    
    race_urls = [item["url"] for item in images][:n]
    
    for img in race_urls:
        display(Image(url=img, width=width, unconfined=True)) ## unconfined pour éviter le recadrage automatique
    
    return race_spe, images

In [22]:
specific_race(base_url="https://api.thecatapi.com/",race="Bengal",n=3)


([{'weight': {'imperial': '6 - 12', 'metric': '3 - 7'},
   'id': 'beng',
   'name': 'Bengal',
   'breed_group': None,
   'cfa_url': 'http://cfa.org/Breeds/BreedsAB/Bengal.aspx',
   'vetstreet_url': 'http://www.vetstreet.com/cats/bengal',
   'vcahospitals_url': 'https://vcahospitals.com/know-your-pet/cat-breeds/bengal',
   'temperament': 'Alert, Agile, Energetic, Demanding, Intelligent',
   'origin': 'United States',
   'country_codes': 'US',
   'country_code': 'US',
   'description': "Bengals are a lot of fun to live with, but they're definitely not the cat for everyone, or for first-time cat owners. Extremely intelligent, curious and active, they demand a lot of interaction and woe betide the owner who doesn't provide it.",
   'life_span': '12 - 15',
   'indoor': 0,
   'lap': 0,
   'adaptability': 5,
   'affection_level': 5,
   'child_friendly': 4,
   'cat_friendly': 4,
   'dog_friendly': 5,
   'energy_level': 5,
   'grooming': 1,
   'health_issues': 3,
   'intelligence': 5,
   'shedd

In [26]:
specific_race(base_url="https://api.thecatapi.com/",race="Sphynx",n=3)
# autre race de chat=> sphynx (ils sont "spéciaux") XD

([{'weight': {'imperial': '6 - 12', 'metric': '3 - 5'},
   'id': 'sphy',
   'name': 'Sphynx',
   'breed_group': None,
   'cfa_url': 'http://cfa.org/Breeds/BreedsSthruT/Sphynx.aspx',
   'vetstreet_url': 'http://www.vetstreet.com/cats/sphynx',
   'vcahospitals_url': 'https://vcahospitals.com/know-your-pet/cat-breeds/sphynx',
   'temperament': 'Loyal, Inquisitive, Friendly, Quiet, Gentle',
   'origin': 'Canada',
   'country_codes': 'CA',
   'country_code': 'CA',
   'description': 'The Sphynx is an intelligent, inquisitive, extremely friendly people-oriented breed. Sphynx commonly greet their owners  at the front door, with obvious excitement and happiness. She has an unexpected sense of humor that is often at odds with her dour expression.',
   'life_span': '12 - 14',
   'indoor': 0,
   'lap': 1,
   'alt_names': 'Canadian Hairless, Canadian Sphynx',
   'adaptability': 5,
   'affection_level': 5,
   'child_friendly': 4,
   'dog_friendly': 5,
   'energy_level': 3,
   'grooming': 2,
   'heal

In [23]:
specific_race(base_url="https://api.thedogapi.com/",race="Great Dane",n=3)
## qu'ils sont beaux ! une suele image par contre Danois est aussi appelé en anglais Danish Mastiff

([{'weight': {'imperial': '110 - 190', 'metric': '50 - 86'},
   'height': {'imperial': '28 - 32', 'metric': '71 - 81'},
   'id': 124,
   'name': 'Great Dane',
   'breed_group': 'Working',
   'bred_for': 'Hunting & holding boars, Guardian',
   'life_span': '7 - 10 years',
   'temperament': 'Friendly, Devoted, Reserved, Gentle, Confident, Loving',
   'reference_image_id': 'B1Edfl9NX'}],
 [{'id': 'B1Edfl9NX',
   'url': 'https://cdn2.thedogapi.com/images/B1Edfl9NX_1280.jpg',
   'width': 800,
   'height': 732}])

In [27]:
specific_race(base_url="https://api.thedogapi.com/",race="Akita",n=3)

([{'weight': {'imperial': '65 - 115', 'metric': '29 - 52'},
   'height': {'imperial': '24 - 28', 'metric': '61 - 71'},
   'id': 6,
   'name': 'Akita',
   'breed_group': 'Working',
   'bred_for': 'Hunting bears',
   'life_span': '10 - 14 years',
   'temperament': 'Docile, Alert, Responsive, Dignified, Composed, Friendly, Receptive, Faithful, Courageous',
   'reference_image_id': 'BFRYBufpm'}],
 [{'id': 'S1_8kx5Nm',
   'url': 'https://cdn2.thedogapi.com/images/S1_8kx5Nm_1280.jpg',
   'width': 305,
   'height': 300},
  {'id': 'IyR0sT3yy',
   'url': 'https://cdn2.thedogapi.com/images/IyR0sT3yy.jpg',
   'width': 1936,
   'height': 1229},
  {'id': 'H6UCIZJsc',
   'url': 'https://cdn2.thedogapi.com/images/H6UCIZJsc.jpg',
   'width': 1151,
   'height': 702},
  {'id': 'rqUG1kbaT',
   'url': 'https://cdn2.thedogapi.com/images/rqUG1kbaT.jpg',
   'width': 1025,
   'height': 794},
  {'id': 'iNX25KsSX',
   'url': 'https://cdn2.thedogapi.com/images/iNX25KsSX.jpg',
   'width': 2362,
   'height': 2355}

 ### 6. Envoyer un vote positif pour une image de chat ou de chien     

Création d'un compte pour recevoir une clé API et pouvoir voter

In [46]:
My_API_key = 'live_M0oJlzCmL2wL2Fn6Bd6gETfXemraSpAmTAPe9tw82PUgNR5SXFFesheWcYSIZvsj'

base_url = "https://api.thedogapi.com/"
vote_url = urljoin(base_url, "v1/votes")

In [38]:
# On va partir sur l'image du Dogue Allemand => great dane
spe, image = specific_race(base_url="https://api.thedogapi.com/",race="Great Dane",n=3)
image

[{'id': 'B1Edfl9NX',
  'url': 'https://cdn2.thedogapi.com/images/B1Edfl9NX_1280.jpg',
  'width': 800,
  'height': 732}]

In [37]:
image_id = image[0]["id"]
image_id

'B1Edfl9NX'

In [None]:
## vote upvote pour cette image
# création d'un dictionnaire payload avec les données du vote
payload = {
    "image_id": image_id,  # de toute beauté
    "value": 1,               # 1 = upvote, 0 = downvote (selon API)
    "sub_id": "mvanack"         # optionnel: identifiant utilisateur/app
}

In [48]:
headers = {
    "x-api-key": My_API_key,
    "Content-Type": "application/json"
}

r = requests.post(vote_url, headers=headers, json=payload) # json=payload pour appeler le dictionnaire en json
r.raise_for_status()

print(r.json())
# le vote a été enregistré avec succès

{'message': 'SUCCESS', 'id': 232799, 'image_id': 'B1Edfl9NX', 'sub_id': 'mvanack', 'value': 1, 'country_code': 'FR'}


In [49]:
votes_url = urljoin(base_url, "v1/votes")
rv = requests.get(votes_url, headers={"x-api-key": My_API_key}, params={"limit": 10})
rv.raise_for_status()
print(rv.json())
# les 10 derniers votes enregistrés
# ici il y en a qu'un seul pour l'instant

[{'id': 232799, 'image_id': 'B1Edfl9NX', 'sub_id': 'mvanack', 'created_at': '2025-12-23T09:03:08.000Z', 'value': 1, 'country_code': 'FR', 'image': {'id': 'B1Edfl9NX', 'url': 'https://cdn2.thedogapi.com/images/B1Edfl9NX.jpg'}}]


### 7. Supprimer le vote que je viens de créer (sniff)

Pour supprimer le vote il faut faire appel à l'endpoint DELETE

In [58]:
id_vote=r.json()["id"] # r.json() fait appel au dictionnaire du vote enregistré
delete_url = urljoin(base_url, f"v1/votes/{id_vote}")
r = requests.delete(delete_url, headers=headers, timeout=20)

In [60]:
r.raise_for_status()
print(r.json())

{'message': 'SUCCESS'}


In [62]:
# vérification de la suppression du vote
votes_url = urljoin(base_url, "v1/votes")

r = requests.get(
    votes_url,
    headers={"x-api-key": My_API_key},
    params={"sub_id": "mvanack"},
)
r.raise_for_status()

print(r.json())
# il n'y a rien donc le vote a été supprimé avec succès

[]


### 8. Faire une requête volontairement incorrecte  

In [None]:
# exemple d'un appel erroné dans cats API où on cherche des chiens
# envoie une erreur 404 qui signifie que la ressource n'a pas été trouvée

r = requests.get("https://api.thecatapi.com/v1/dogs/search")
print("status:", r.status_code)
print("body:", r.text[:200])


status: 404
body: {"message":"404 - please consult the documentation for correct url to call. https://docs.thecatapi.com/"}


In [67]:
# vote sans API key 
payload = {"image_id": image_id, "value": 1}
r = requests.post("https://api.thedogapi.com/v1/votes", json=payload)

print("status:", r.status_code)
print("body:", r.text[:200])



status: 401
body: AUTHENTICATION_ERROR


In [None]:
# pas d'erreur ici car l'endpoint est correct mais on cherche des chiens dans l'API des chats

r = requests.get(
    "https://api.thecatapi.com/v1/images/search",
    params={"breed_id": image_id, "limit": 1},  # ID du chien utilisé côté chats 
    timeout=10
)
print("status:", r.status_code)
print("json:", r.json())


status: 200
json: []
