# Connexion à l'API France Travail

Ce script a pour objectif d'extraire les offres d'emploi mises à disposition par l'API de France Travail et de les stocker dans un fichier (CSV ou Excel) en local.

Comment ?
1. Récupération du token permettant d'utiliser l'API de France Travail.
2. Sur la base de critères spécifiques (mots clés, localisation, etc...), lancement d'une requête pour obtenir les offres d'emploi correspondantes.
3. Une fois les offres trouvées, une sauvegarde en local est exécutée et les offres sont stockées dans un fichier (CSV ou Excel).

Les URL utiles sont :
- https://francetravail.io/data/api/offres-emploi
- https://francetravail.io/data/api/offres-emploi/documentation#/

## Imports

In [2]:
import http.client
import requests
import json
import pandas as pd
import os

## Procédure

### Configuration

In [3]:
# ---------------------------
# CONFIGURATION
# ---------------------------
# France Travail (ex-Pôle emploi)
# FT_CLIENT_ID = Defined in .env
# FT_CLIENT_SECRET = Defined in .env
# FT_SCOPE = Defined in .env

##################  VARIABLES  ##################
FT_CLIENT_ID = os.environ.get("FT_CLIENT_ID")
FT_CLIENT_SECRET = os.environ.get("FT_CLIENT_SECRET")
FT_SCOPE = os.environ.get("FT_SCOPE")

### Paramètres

In [4]:
# ---------------------------
# PARAMETRES
# ---------------------------

# Paramètres de recherche
JOB_QUERY = "data analyst"
COMMUNE = "78300"
DISTANCE = 100000

# Nombre d'annonces par page requise
BLOC_PAGINATION = 50

# Nombre de pages max
MAX_PAGES = 20   # Limiter le nombre de pages récupérées

### Authentification France Travail

In [5]:
# ---------------------------
# AUTH FRANCE TRAVAIL
# ---------------------------
def get_ft_token():
    url = "https://entreprise.pole-emploi.fr/connexion/oauth2/access_token?realm=/partenaire"
    data = {
        "grant_type": "client_credentials",
        "client_id": FT_CLIENT_ID,
        "client_secret": FT_CLIENT_SECRET,
        "scope": FT_SCOPE,
    }
    r = requests.post(url, data=data)
    r.raise_for_status()
    return r.json()["access_token"]

### Lancement requête API France Travail

In [6]:
# ---------------------------
# API CALL FRANCE TRAVAIL
# ---------------------------
def fetch_france_travail_jobs(token, max_pages=MAX_PAGES):
    headers = {"Authorization": f"Bearer {token}"}
    all_jobs = []
    b_stop_criteria = False
    
    for page in range(1, max_pages + 1):
        if b_stop_criteria == False:    
            url = f"https://api.francetravail.io/partenaire/offresdemploi/v2/offres/search"
            params = {
                "motsCles": JOB_QUERY,
                "commune": COMMUNE,
                "distance" : DISTANCE,
                "range": f"{(page-1)*BLOC_PAGINATION}-{page*BLOC_PAGINATION-1}"  # pagination par blocs de 50
            }
            r = requests.get(url, headers=headers, params=params)
            r.raise_for_status()
            data = r.json()
            offres = data.get("resultats", [])
                
            for o in offres:
                all_jobs.append({
                    "source": "France Travail",
                    "id":o.get("id"),                    
                    "titre": o.get("intitule"),
                    "description": o.get("description"),
                    "date": o.get("dateCreation"),
                    "date_actualisation": o.get("dateActualisation"),
                    "lieu_libelle": o.get("lieuTravail", {}).get("libelle"),
                    "lieu_latitude": o.get("lieuTravail", {}).get("latitude"),
                    "lieu_longitude": o.get("lieuTravail", {}).get("longitude"),
                    "lieu_codePostal": o.get("lieuTravail", {}).get("codePostal"),
                    "lieu_commune": o.get("lieuTravail", {}).get("commune"),
                    "entreprise_nom": o.get("entreprise", {}).get("nom"),
                    "entreprise_description": o.get("entreprise", {}).get("description"),
                    "entreprise_logo": o.get("entreprise", {}).get("logo"),
                    "entreprise_url": o.get("entreprise", {}).get("url"),
                    "typeContrat": o.get("typeContrat"),
                    "typeContratLibelle": o.get("typeContratLibelle"),
                    "natureContrat": o.get("natureContrat"),
                    "experienceExige": o.get("experienceExige"),
                    "experienceLibelle": o.get("experienceLibelle"),
                    "experienceCommentaire": o.get("experienceCommentaire"),
                    "experienceCommentaire": o.get("experienceCommentaire"),    
                    
                    # "formations": o.get("formations"),
                    "formations_codeFormation": o.get("formations")[0].get("codeFormation") if o.get("formations") is not None else "None",
                    "formations_domaineLibelle": o.get("formations")[0].get("domaineLibelle") if o.get("formations") is not None else "None",
                    "formations_niveauLibelle": o.get("formations")[0].get("niveauLibelle") if o.get("formations") is not None else "None",
                    "formations_commentaire": o.get("formations")[0].get("commentaire") if o.get("formations") is not None else "None",
                    "formations_exigence": o.get("formations")[0].get("exigence") if o.get("formations") is not None else "None",
                    
                    # "langues": o.get("langues"),
                    "langues_libelle": o.get("langues")[0].get("libelle") if o.get("langues") is not None else "None",
                    "langues_exigence": o.get("langues")[0].get("exigence") if o.get("langues") is not None else "None",
                
                    "permis": o.get("permis"),
                    "permis_libelle": o.get("permis")[0].get("libelle") if o.get("permis") is not None else "None",
                    "permis_exigence": o.get("permis")[0].get("exigence") if o.get("permis") is not None else "None",

                    "outilsBureautiques": o.get("outilsBureautiques"),

                    # "competences": o.get("competences"),
                    "permis_code": o.get("competences")[0].get("code") if o.get("competences") is not None else "None",
                    "permis_libelle": o.get("competences")[0].get("libelle") if o.get("competences") is not None else "None",
                    "permis_exigence": o.get("competences")[0].get("exigence") if o.get("competences") is not None else "None",

                    # "salaire": o.get("salaire"),
                    "salaire_libelle": o.get("salaire").get("libelle") if o.get("salaire") is not None else "None",
                    "salaire_commentaire": o.get("salaire").get("commentaire") if o.get("salaire") is not None else "None",
                    "salaire_complement1": o.get("salaire").get("complement1") if o.get("salaire") is not None else "None",
                    "salaire_complement2": o.get("salaire").get("complement2") if o.get("salaire") is not None else "None",

                    "dureeTravailLibelle": o.get("dureeTravailLibelle"),

                    "dureeTravailLibelleConverti": o.get("dureeTravailLibelleConverti"),
                    "complementExercice": o.get("complementExercice"),
                    "conditionExercice": o.get("conditionExercice"),
                    "alternance": o.get("alternance"),

                    # "contact": o.get("contact"),
                    "contact_nom": o.get("contact").get("nom") if o.get("contact") is not None else "None",
                    "contact_coordonnees1": o.get("contact").get("coordonnees1") if o.get("contact") is not None else "None",
                    "contact_coordonnees2": o.get("contact").get("coordonnees2") if o.get("contact") is not None else "None",
                    "contact_coordonnees3": o.get("contact").get("coordonnees3") if o.get("contact") is not None else "None",
                    "contact_telephone": o.get("contact").get("telephone") if o.get("contact") is not None else "None",
                    "contact_courriel": o.get("contact").get("courriel") if o.get("contact") is not None else "None",
                    "contact_commentaire": o.get("contact").get("commentaire") if o.get("contact") is not None else "None",
                    "contact_urlRecruteur": o.get("contact").get("urlRecruteur") if o.get("contact") is not None else "None",
                    "contact_urlPostulation": o.get("contact").get("urlPostulation") if o.get("contact") is not None else "None",

                    # "agence": o.get("agence"),
                    "agence_telephone": o.get("agence").get("telephone") if o.get("agence") is not None else "None",
                    "agence_courriel": o.get("agence").get("courriel") if o.get("agence") is not None else "None",

                    "nombrePostes": o.get("nombrePostes"),
                    "deplacementCode": o.get("deplacementCode"),
                    "deplacementLibelle": o.get("deplacementLibelle"),

                    "qualificationCode": o.get("qualificationCode"),
                    "qualificationLibelle": o.get("qualificationLibelle"),

                    "codeNAF": o.get("codeNAF"),
                    "secteurActivite": o.get("secteurActivite"),
                    "secteurActiviteLibelle": o.get("secteurActiviteLibelle"),
                    
                    # "qualitesProfessionnelles": o.get("qualitesProfessionnelles"),
                    "qualitesProfessionnelles_libelle": o.get("qualitesProfessionnelles")[0].get("libelle") if o.get("qualitesProfessionnelles") is not None else "None",
                    "qualitesProfessionnelles_description": o.get("qualitesProfessionnelles")[0].get("description") if o.get("qualitesProfessionnelles") is not None else "None",

                    "trancheEffectifEtab": o.get("trancheEffectifEtab"),


                    # "origineOffre": o.get("origineOffre"),
                    "origineOffre_origine": o.get("origineOffre").get("origine") if o.get("origineOffre") is not None else "None",
                    "origineOffre_urlOrigine": o.get("origineOffre").get("urlOrigine") if o.get("origineOffre") is not None else "None",
                
                    # "origineOffre_partenaires": o.get("origineOffre").get("partenaires") if o.get("origineOffre") is not None else "None",

                    "origineOffre_partenaires_nom": o.get("origineOffre").get("partenaires")[0].get("nom") if o.get("origineOffre").get("partenaires") is not None else "None",
                    "origineOffre_partenaires_url": o.get("origineOffre").get("partenaires")[0].get("url") if o.get("origineOffre").get("partenaires") is not None else "None",
                    "origineOffre_partenaires_logo": o.get("origineOffre").get("partenaires")[0].get("logo") if o.get("origineOffre").get("partenaires") is not None else "None",

                    "offresManqueCandidats": o.get("offresManqueCandidats"),

                    # "contexteTravail": o.get("contexteTravail"),
                    "contexteTravail_horaires": o.get("contexteTravail").get("horaires")[0] if o.get("contexteTravail").get("horaires") is not None else "None",
                    "contexteTravail_conditionsExercice": o.get("contexteTravail").get("conditionsExercice")[0] if o.get("contexteTravail").get("conditionsExercice") is not None else "None",
                })
            print(len(offres))

            # Si le nombre d'offres est inférieur au nombre max d'offre par pages, c'est un signe qu'il n'y a plus d'offres à extraire après la page actuelle.
            if len(offres) < BLOC_PAGINATION:
                b_stop_criteria = True
            
    return all_jobs

### Procédure principale

In [7]:
# ---------------------------
# MAIN
# ---------------------------
if __name__ == "__main__":
    print("Authentification France Travail...")
    token = get_ft_token()

    print("Récupération des offres France Travail...")
    ft_jobs = fetch_france_travail_jobs(token)

    print("Affichage Extract offres France Travail...")
    df = pd.DataFrame(ft_jobs)
    display(df.shape)
    display(df.head())

    # Export vers CSV
    path = "../data/raw_data/"
    file_name = "offres_emploi_2.csv"
    
    df.to_csv(path + file_name, index=False, encoding="utf-8")
    print(f"{len(ft_jobs)} offres uniques exportées dans {file_name} ✅")

Authentification France Travail...
Récupération des offres France Travail...
50
50
50
33
Affichage Extract offres France Travail...


(183, 72)

Unnamed: 0,source,id,titre,description,date,date_actualisation,lieu_libelle,lieu_latitude,lieu_longitude,lieu_codePostal,...,qualitesProfessionnelles_description,trancheEffectifEtab,origineOffre_origine,origineOffre_urlOrigine,origineOffre_partenaires_nom,origineOffre_partenaires_url,origineOffre_partenaires_logo,offresManqueCandidats,contexteTravail_horaires,contexteTravail_conditionsExercice
0,France Travail,197PLRS,Data Analyst (h/f),"Adecco recherche pour l'un de ses clients, une...",2025-09-09T16:27:22.779Z,2025-09-10T08:31:13.461Z,13 - Marignane,43.407483,5.255358,13700,...,,,1,https://candidat.francetravail.fr/offres/reche...,,,,False,35H/semaine\nTravail en journée,
1,France Travail,197JSYL,Data analyst (F/H) (H/F),"Au sein de la direction Excellence Clients, no...",2025-09-04T13:51:37.276Z,2025-09-08T10:46:32.157Z,26 - Valence,44.933273,4.892158,26000,...,"Capacité à planifier, prioriser, anticiper des...",,1,https://candidat.francetravail.fr/offres/reche...,,,,False,39H/semaine\nTravail en journée,
2,France Travail,197FWLH,Data analyst senior (H/F),Data Analyst Senior F/H - CDI - La Défense\n\n...,2025-09-02T11:49:20.769Z,2025-09-03T10:44:07.803Z,92 - PUTEAUX,48.884019,2.237979,92800,...,,,1,https://candidat.francetravail.fr/offres/reche...,,,,False,36H30/semaine\nTravail en journée,Station assise prolongée
3,France Travail,197GFLX,Data analyst (F/H),"Directement rattaché au DSI , vous serez un él...",2025-09-02T14:41:39.561Z,2025-09-02T14:41:39.755Z,34 - Montpellier,43.626378,3.882533,34000,...,,,1,https://candidat.francetravail.fr/offres/reche...,,,,False,35H/semaine\nTravail en journée,
4,France Travail,197DQJQ,Data Analyst (H/F),"Le Groupe WATT&CO, acteur reconnu depuis 15 an...",2025-09-01T14:10:09.118Z,2025-09-01T14:10:09.609Z,81 - MAZAMET,43.489968,2.376418,81200,...,Capacité à travailler et à se coordonner avec ...,,1,https://candidat.francetravail.fr/offres/reche...,,,,False,35H/semaine\nTravail en journée,


183 offres uniques exportées dans offres_emploi_2.csv ✅
