# Connexion à l'API Adzuna

## Imports

In [26]:
import http.client
import requests
import json
import pandas as pd
import os

## Procédure

### Configuration

In [27]:
# ---------------------------
# CONFIGURATION
# ---------------------------
##################  VARIABLES  ##################
# Adzuna
ADZUNA_CLIENT_ID = os.environ.get("ADZUNA_CLIENT_ID")
ADZUNA_CLIENT_SECRET = os.environ.get("ADZUNA_CLIENT_SECRET")

### Paramètres

In [28]:
# ---------------------------
# PARAMETRES
# ---------------------------

# Paramètres de recherche
JOB_QUERY = "data analyst"
COMMUNE = "78300"
DISTANCE = 100

# Nombre d'annonces par page requise
BLOC_PAGINATION = 50

# Nombre de pages max
MAX_PAGES = 30   # Limiter le nombre de pages récupérées

### Lancement requête API Adzuna

In [29]:
# ---------------------------
# API CALL ADZUNA
# ---------------------------
def fetch_adzuna_jobs(max_pages=MAX_PAGES):
    headers = {"Accept": "application/json"}
    all_jobs = []
    b_stop_criteria = False
    
    for page in range(1, max_pages + 1):
        if b_stop_criteria == False:    
            url = f"https://api.adzuna.com/v1/api/jobs/fr/search/{page}"
            params = {
                "app_id" : ADZUNA_CLIENT_ID,
                "app_key" : ADZUNA_CLIENT_SECRET,
                "title_only": JOB_QUERY,
                "where": COMMUNE,
                "results_per_page" : BLOC_PAGINATION,
                "distance" : DISTANCE
            }
            r = requests.get(url,params=params)
            # r = requests.get(url, headers=headers, params=params)
            r.raise_for_status()
            data = r.json()
            offres = data.get("results")
                
            print(len(offres))

            for o in offres:
                all_jobs.append({
                    "source": "Adzuna",
                    "id" : o.get("id"),
                    "titre" : o.get("title"),
                    "description" : o.get("description"),
                    "date" : o.get("created"),
                    "date_actualisation": o.get("dateActualisation") if o.get("dateActualisation") is not None else "None",  
                    "lieu_libelle" : o.get("location").get("display_name") if o.get("location") is not None else "None",                  
                    "lieu_latitude" : o.get("latitude"),
                    "lieu_longitude" : o.get("longitude"),
                    "lieu_codePostal": o.get("lieu_codePostal") if o.get("lieu_codePostal") is not None else "None", 
                    "lieu_commune": o.get("lieu_commune") if o.get("lieu_commune") is not None else "None",              
                    "entreprise_nom": o.get("company").get("display_name") if o.get("company") is not None else "None",
                    "entreprise_description": o.get("entreprise_description") if o.get("entreprise_description") is not None else "None",  
                    "entreprise_logo": o.get("entreprise_logo") if o.get("entreprise_logo") is not None else "None",  
                    "entreprise_url": o.get("entreprise_url") if o.get("entreprise_url") is not None else "None",  

                    "typeContrat": o.get("typeContrat") if o.get("typeContrat") is not None else "None",  
                    "typeContratLibelle" : o.get("contract_type"),

                    
                    "natureContrat": o.get("natureContrat") if o.get("natureContrat") is not None else "None",  
                    "experienceExige": o.get("experienceExige") if o.get("experienceExige") is not None else "None",  
                    "experienceLibelle": o.get("experienceLibelle") if o.get("experienceLibelle") is not None else "None",  
                    "experienceCommentaire": o.get("experienceCommentaire") if o.get("experienceCommentaire") is not None else "None",  
   
                    # "formations": o.get("formations"),
                    "formations_codeFormation": o.get("formations_codeFormation") if o.get("formations_codeFormation") is not None else "None",  
                    "formations_domaineLibelle": o.get("formations_domaineLibelle") if o.get("formations_domaineLibelle") is not None else "None",  
                    "formations_niveauLibelle": o.get("formations_niveauLibelle") if o.get("formations_niveauLibelle") is not None else "None",  
                    "formations_commentaire": o.get("formations_commentaire") if o.get("formations_commentaire") is not None else "None",  
                    "formations_exigence": o.get("formations_exigence") if o.get("formations_exigence") is not None else "None",  


                    # "langues": o.get("langues"),
                    "langues_libelle": o.get("formations_exigence") if o.get("formations_exigence") is not None else "None", 
                    "langues_exigence": o.get("formations_exigence") if o.get("formations_exigence") is not None else "None", 
                
                    "permis": o.get("permis") if o.get("permis") is not None else "None", 
                    "permis_libelle": o.get("permis_libelle") if o.get("permis_libelle") is not None else "None", 
                    "permis_exigence": o.get("permis_exigence") if o.get("permis_exigence") is not None else "None", 

                    "outilsBureautiques": o.get("outilsBureautiques") if o.get("outilsBureautiques") is not None else "None", 

                    # "competences": o.get("competences") if o.get("competences") is not None else "None",
                    "competences_code": o.get("competences_code") if o.get("competences_code") is not None else "None",
                    "competences_libelle": o.get("competences_libelle") if o.get("competences_libelle") is not None else "None",
                    "competences_exigence": o.get("competences_exigence") if o.get("competences_exigence") is not None else "None",

                    # "salaire": o.get("salaire") if o.get("salaire") is not None else "None",
                    "salaire_libelle": o.get("salaire_libelle") if o.get("salaire_libelle") is not None else "None",
                    "salaire_commentaire": o.get("salaire_commentaire") if o.get("salaire_commentaire") is not None else "None",
                    "salaire_complement1": o.get("salaire_complement1") if o.get("salaire_complement1") is not None else "None",
                    "salaire_complement2": o.get("salaire_complement2") if o.get("salaire_complement2") is not None else "None",
                    "salaire_min" : o.get("salary_min"),
                    "salaire_max" : o.get("salary_max"),


                    "dureeTravailLibelle": o.get("dureeTravailLibelle") if o.get("dureeTravailLibelle") is not None else "None",

                    "dureeTravailLibelleConverti": o.get("dureeTravailLibelleConverti") if o.get("dureeTravailLibelleConverti") is not None else "None",
                    "complementExercice": o.get("complementExercice") if o.get("complementExercice") is not None else "None",
                    "conditionExercice": o.get("conditionExercice") if o.get("conditionExercice") is not None else "None",
                    "alternance": o.get("alternance") if o.get("alternance") is not None else "None",

                    # "contact": o.get("contact") if o.get("contact") is not None else "None",
                    "contact_nom": o.get("contact_nom") if o.get("contact_nom") is not None else "None",
                    "contact_coordonnees1": o.get("contact_coordonnees1") if o.get("contact_coordonnees1") is not None else "None",
                    "contact_coordonnees2": o.get("contact_coordonnees2") if o.get("contact_coordonnees2") is not None else "None",
                    "contact_coordonnees3": o.get("contact_coordonnees3") if o.get("contact_coordonnees3") is not None else "None",
                    "contact_telephone": o.get("contact_telephone") if o.get("contact_telephone") is not None else "None",
                    "contact_courriel": o.get("contact_courriel") if o.get("contact_courriel") is not None else "None",
                    "contact_commentaire": o.get("contact_commentaire") if o.get("contact_commentaire") is not None else "None",
                    "contact_urlRecruteur": o.get("contact_urlRecruteur") if o.get("contact_urlRecruteur") is not None else "None",
                    "contact_urlPostulation": o.get("contact_urlPostulation") if o.get("contact_urlPostulation") is not None else "None",

                    # "agence": o.get("agence") if o.get("agence") is not None else "None",
                    "agence_telephone": o.get("agence_telephone") if o.get("agence_telephone") is not None else "None",
                    "agence_courriel": o.get("agence_courriel") if o.get("agence_courriel") is not None else "None",

                    "nombrePostes": o.get("nombrePostes") if o.get("nombrePostes") is not None else "None",
                    "deplacementCode": o.get("deplacementCode") if o.get("deplacementCode") is not None else "None",
                    "deplacementLibelle": o.get("deplacementLibelle") if o.get("deplacementLibelle") is not None else "None",

                    "qualificationCode": o.get("qualificationCode") if o.get("qualificationCode") is not None else "None",
                    "qualificationLibelle": o.get("qualificationLibelle") if o.get("qualificationLibelle") is not None else "None",

                    "codeNAF": o.get("codeNAF") if o.get("codeNAF") is not None else "None",
                    "secteurActivite": o.get("secteurActivite") if o.get("secteurActivite") is not None else "None",
                    "secteurActiviteLibelle": o.get("secteurActiviteLibelle") if o.get("secteurActiviteLibelle") is not None else "None",

                    # "qualitesProfessionnelles": o.get("qualitesProfessionnelles") if o.get("qualitesProfessionnelles") is not None else "None",
                    "qualitesProfessionnelles_libelle": o.get("qualitesProfessionnelles_libelle") if o.get("qualitesProfessionnelles_libelle") is not None else "None",
                    "qualitesProfessionnelles_description": o.get("qualitesProfessionnelles_description") if o.get("qualitesProfessionnelles_description") is not None else "None",

                    "trancheEffectifEtab": o.get("trancheEffectifEtab") if o.get("trancheEffectifEtab") is not None else "None",
                    

                    # "origineOffre": o.get("origineOffre") if o.get("origineOffre") is not None else "None",
                    "origineOffre_origine": o.get("origineOffre_origine") if o.get("origineOffre_origine") is not None else "None",
                    "origineOffre_urlOrigine" : o.get("redirect_url"),     
                
                    # "origineOffre_partenaires": o.get("origineOffre_partenaires") if o.get("origineOffre_partenaires") is not None else "None",

                    "origineOffre_partenaires_nom": o.get("origineOffre_partenaires_nom") if o.get("origineOffre_partenaires_nom") is not None else "None",
                    "origineOffre_partenaires_url": o.get("origineOffre_partenaires_url") if o.get("origineOffre_partenaires_url") is not None else "None",
                    "origineOffre_partenaires_logo": o.get("origineOffre_partenaires_logo") if o.get("origineOffre_partenaires_logo") is not None else "None",

                    "offresManqueCandidats": o.get("offresManqueCandidats") if o.get("offresManqueCandidats") is not None else "None",

                    # "contexteTravail": o.get("contexteTravail") if o.get("contexteTravail") is not None else "None",
                    "contexteTravail_horaires": o.get("contexteTravail_horaires") if o.get("contexteTravail_horaires") is not None else "None",
                    "contexteTravail_conditionsExercice": o.get("contexteTravail_conditionsExercice") if o.get("contexteTravail_conditionsExercice") is not None else "None",
    
                    "category_label" : o.get("category").get("label") if o.get("category") is not None else "None"                        
                })
                
            # Si le nombre d'offres est inférieur au nombre max d'offre par pages, c'est un signe qu'il n'y a plus d'offres à extraire après la page actuelle.
            if len(offres) < BLOC_PAGINATION:
                b_stop_criteria = True
            
    return all_jobs


# result = adzuna_jobs = fetch_adzuna_jobs()
# df = pd.DataFrame(result).head()
# display(df.shape)

### Procédure principale

In [30]:
# ---------------------------
# MAIN
# ---------------------------
if __name__ == "__main__":
    print("Récupération des offres Adzuna...")
    adzuna_jobs = fetch_adzuna_jobs()

    print("Affichage Extract offres Adzuna...")
    df = pd.DataFrame(adzuna_jobs)
    display(df.shape)
    display(df.head())

    # Export vers CSV
    path = "../data/raw_data/"
    file_name = "offres_emploi_adzuna.csv"
    
    df.to_csv(path + file_name, index=False, encoding="utf-8")
    print(f"{len(adzuna_jobs)} offres uniques exportées dans {file_name} ✅")

Récupération des offres Adzuna...
50
50
50
50
50
50
50
50
50
50
50
50
50
50
50
50
50
50
50
50
50
19
Affichage Extract offres Adzuna...


(1069, 77)

Unnamed: 0,source,id,titre,description,date,date_actualisation,lieu_libelle,lieu_latitude,lieu_longitude,lieu_codePostal,...,trancheEffectifEtab,origineOffre_origine,origineOffre_urlOrigine,origineOffre_partenaires_nom,origineOffre_partenaires_url,origineOffre_partenaires_logo,offresManqueCandidats,contexteTravail_horaires,contexteTravail_conditionsExercice,category_label
0,Adzuna,5395526559,Data Analyst H/F,Vous aimez transformer des données en leviers ...,2025-09-12T04:14:50Z,,"Charles-de-Gaulles Aéroport, Val-d'Oise",49.00403,2.51524,,...,,,https://www.adzuna.fr/land/ad/5395526559?se=_v...,,,,,,,Unknown
1,Adzuna,5382331760,Data Analyst H/F,"Au sein du département Data, composé de Data S...",2025-09-04T03:55:59Z,,"Levallois-Perret, Nanterre",48.89434,2.28834,,...,,,https://www.adzuna.fr/land/ad/5382331760?se=_v...,,,,,,,Unknown
2,Adzuna,5321381714,Data Analyst H/F,"En tant que Data Analyst, vous participez à no...",2025-07-25T10:24:21Z,,"Roissy-en-Brie, Torcy",48.79119,2.65432,,...,,,https://www.adzuna.fr/land/ad/5321381714?se=_v...,,,,,,,Unknown
3,Adzuna,5182554562,Data Analyst H/F,Envie de rejoindre un groupe qui contribue à a...,2025-05-06T05:54:29Z,,"Taverny, Pontoise",49.05119,2.20585,,...,,,https://www.adzuna.fr/land/ad/5182554562?se=_v...,,,,,,,Unknown
4,Adzuna,5234030255,Data Analyst H/F,"Enjeu stratégique du Groupe, la direction Tech...",2025-06-05T07:10:25Z,,"Saint-Quentin-en-Yvelines, Versailles",48.77173,2.07015,,...,,,https://www.adzuna.fr/land/ad/5234030255?se=_v...,,,,,,,Unknown


1069 offres uniques exportées dans offres_emploi_adzuna.csv ✅
