# **Mini-Formation : Utilisation des API dans les Pipelines de Donn√©es**
Ce notebook vous guidera √† travers l'utilisation des **API REST** pour l'ingestion de donn√©es dans un pipeline de donn√©es.

**Objectifs :**
- Comprendre les bases des API REST (GET, POST, PUT, DELETE)
- Extraire des donn√©es d'APIs publiques et les stocker dans une base de donn√©es
- Automatiser l'ingestion de donn√©es via un pipeline
- G√©rer l'authentification et la pagination


## **1. Installation des Biblioth√®ques N√©cessaires**

In [17]:
%pip install requests pandas sqlalchemy

Note: you may need to restart the kernel to use updated packages.


## **2. Importation des Modules**

In [18]:

import requests
import pandas as pd
import sqlite3
from sqlalchemy import create_engine
import json


## **3. Introduction aux API REST**
Une API REST (Representational State Transfer) permet d'√©changer des donn√©es entre des syst√®mes via des requ√™tes HTTP. Les m√©thodes principales sont :

- `GET` : R√©cup√©rer des donn√©es
- `POST` : Envoyer de nouvelles donn√©es
- `PUT` : Mettre √† jour des donn√©es existantes
- `DELETE` : Supprimer des donn√©es

Nous allons maintenant faire des appels API et manipuler les donn√©es re√ßues.

## **4. Effectuer une Requ√™te API avec `requests`**

In [19]:

# URL d'une API publique (exemple : JSONPlaceholder)
url = "https://jsonplaceholder.typicode.com/posts"

# Faire une requ√™te GET
response = requests.get(url)

# V√©rifier si la requ√™te a r√©ussi
if response.status_code == 200:
    data = response.json()
    print("Donn√©es r√©cup√©r√©es avec succ√®s !")
    print(json.dumps(data[:2], indent=2))  # Affiche les 2 premiers r√©sultats
else:
    print("Erreur lors de la requ√™te :", response.status_code)


Donn√©es r√©cup√©r√©es avec succ√®s !
[
  {
    "userId": 1,
    "id": 1,
    "title": "sunt aut facere repellat provident occaecati excepturi optio reprehenderit",
    "body": "quia et suscipit\nsuscipit recusandae consequuntur expedita et cum\nreprehenderit molestiae ut ut quas totam\nnostrum rerum est autem sunt rem eveniet architecto"
  },
  {
    "userId": 1,
    "id": 2,
    "title": "qui est esse",
    "body": "est rerum tempore vitae\nsequi sint nihil reprehenderit dolor beatae ea dolores neque\nfugiat blanditiis voluptate porro vel nihil molestiae ut reiciendis\nqui aperiam non debitis possimus qui neque nisi nulla"
  }
]


## **5. Transformer les Donn√©es API en DataFrame**

In [20]:

# Convertir les donn√©es JSON en DataFrame pandas
df = pd.DataFrame(data)
print(df.head())  # Afficher les premi√®res lignes


   userId  id                                              title  \
0       1   1  sunt aut facere repellat provident occaecati e...   
1       1   2                                       qui est esse   
2       1   3  ea molestias quasi exercitationem repellat qui...   
3       1   4                               eum et est occaecati   
4       1   5                                 nesciunt quas odio   

                                                body  
0  quia et suscipit\nsuscipit recusandae consequu...  
1  est rerum tempore vitae\nsequi sint nihil repr...  
2  et iusto sed quo iure\nvoluptatem occaecati om...  
3  ullam et saepe reiciendis voluptatem adipisci\...  
4  repudiandae veniam quaerat sunt sed\nalias aut...  


## **6. Stockage des Donn√©es API dans une Base de Donn√©es**

In [21]:
import sqlite3
import pandas as pd

# Connexion directe √† SQLite
conn = sqlite3.connect("api_data.db")

# Stocker le DataFrame en SQLite
df.to_sql("posts", conn, if_exists="replace", index=False)

print("Donn√©es enregistr√©es avec succ√®s dans SQLite.")

# V√©rifier les donn√©es
df_from_db = pd.read_sql("SELECT * FROM posts", conn)
print(df_from_db)

# Fermer la connexion
conn.close()


Donn√©es enregistr√©es avec succ√®s dans SQLite.
    userId   id                                              title  \
0        1    1  sunt aut facere repellat provident occaecati e...   
1        1    2                                       qui est esse   
2        1    3  ea molestias quasi exercitationem repellat qui...   
3        1    4                               eum et est occaecati   
4        1    5                                 nesciunt quas odio   
..     ...  ...                                                ...   
95      10   96  quaerat velit veniam amet cupiditate aut numqu...   
96      10   97         quas fugiat ut perspiciatis vero provident   
97      10   98                        laboriosam dolor voluptates   
98      10   99  temporibus sit alias delectus eligendi possimu...   
99      10  100              at nam consequatur ea labore ea harum   

                                                 body  
0   quia et suscipit\nsuscipit recusandae consequu... 

## **7. Automatisation du Pipeline API**
Nous allons cr√©er une fonction qui :
- Fait une requ√™te API
- Transforme les donn√©es
- Stocke les r√©sultats en base de donn√©es
- Peut √™tre ex√©cut√©e automatiquement


In [23]:
import requests
import pandas as pd
import sqlite3

# Connexion √† SQLite avec sqlite3
conn = sqlite3.connect("api_data.db")  # Cr√©e ou ouvre la base SQLite

def fetch_and_store_data(api_url, table_name, conn):
    """R√©cup√®re des donn√©es depuis une API et les stocke dans une base SQLite"""
    response = requests.get(api_url)

    if response.status_code == 200:
        data = response.json()
        df = pd.DataFrame(data)

        # Stocker directement avec sqlite3
        df.to_sql(table_name, conn, if_exists="replace", index=False)

        print(f"Donn√©es mises √† jour dans la table {table_name}.")
    else:
        print(f"√âchec de la r√©cup√©ration des donn√©es. Code : {response.status_code}")

# Ex√©cuter le pipeline
fetch_and_store_data("https://jsonplaceholder.typicode.com/comments", "comments", conn)

# V√©rifier les donn√©es enregistr√©es
df_from_db = pd.read_sql("SELECT * FROM comments", conn)
print(df_from_db.head())

# Fermer la connexion
conn.close()


Donn√©es mises √† jour dans la table comments.
   postId  id                                       name  \
0       1   1               id labore ex et quam laborum   
1       1   2  quo vero reiciendis velit similique earum   
2       1   3              odio adipisci rerum aut animi   
3       1   4                             alias odio sit   
4       1   5      vero eaque aliquid doloribus et culpa   

                    email                                               body  
0      Eliseo@gardner.biz  laudantium enim quasi est quidem magnam volupt...  
1  Jayne_Kuhic@sydney.com  est natus enim nihil est dolore omnis voluptat...  
2     Nikita@garfield.biz  quia molestiae reprehenderit quasi aspernatur\...  
3           Lew@alysha.tv  non et atque\noccaecati deserunt quas accusant...  
4       Hayden@althea.biz  harum non quasi et ratione\ntempore iure ex vo...  


## **8. Conclusion**
- Nous avons vu comment **extraire des donn√©es depuis une API**.
- Nous avons appris √† **stocker ces donn√©es en base de donn√©es**.
- Nous avons automatis√© un **pipeline de r√©cup√©ration des donn√©es**.

**√Ä tester :** Essayez d'ex√©cuter ce pipeline avec une autre API publique ! üöÄ