# Connexion à l'API France Travail

URL : 

https://francetravail.io/data/api/offres-emploi

https://francetravail.io/data/api/offres-emploi/documentation#/

## Imports

In [5]:
import http.client
import requests
import json
import pandas as pd
import os

In [6]:
# ---------------------------
# CONFIGURATION
# ---------------------------
# France Travail (ex-Pôle emploi)
# FT_CLIENT_ID = Defined in .env
# FT_CLIENT_SECRET = Defined in .env
# FT_SCOPE = Defined in .env

##################  VARIABLES  ##################
FT_CLIENT_ID = os.environ.get("FT_CLIENT_ID")
FT_CLIENT_SECRET = os.environ.get("FT_CLIENT_SECRET")
FT_SCOPE = os.environ.get("FT_SCOPE")

# Paramètres de recherche
JOB_QUERY = "data analyst"
COMMUNE = "78300"
DISTANCE = 500

# Nombre d'annonces par page requise
BLOC_PAGINATION = 50

# Nombre de pages max
MAX_PAGES = 20   # Limiter le nombre de pages récupérées

# ---------------------------
# AUTH FRANCE TRAVAIL
# ---------------------------
def get_ft_token():
    url = "https://entreprise.pole-emploi.fr/connexion/oauth2/access_token?realm=/partenaire"
    data = {
        "grant_type": "client_credentials",
        "client_id": FT_CLIENT_ID,
        "client_secret": FT_CLIENT_SECRET,
        "scope": FT_SCOPE,
    }
    r = requests.post(url, data=data)
    r.raise_for_status()
    return r.json()["access_token"]


# ---------------------------
# REFERENTIEL FRANCE TRAVAIL
# ---------------------------
def fetch_france_travail_referentiel(token):
    referential = ["appellations",
        "nafs",
        "communes",
        "continents",
        "departements",
        "domaines",
        "langues",
        "metiers",
        "naturesContrats",
        "niveauxFormations",
        "pays",
        "permis",
        "regions",
        "secteursActivites",
        "themes",
        "typesContrats"]
    headers = {"Authorization": f"Bearer {token}"}

    # Save into different sheets of the same Excel file
    with pd.ExcelWriter("../data/raw_data/my_data_new.xlsx") as writer:
        for ref in referential:
            url = f"https://api.francetravail.io/partenaire/offresdemploi/v2/referentiel/{ref}"
            r = requests.get(url, headers=headers)
            r.raise_for_status()
            data = r.json()
            df = pd.DataFrame(data)
            df.to_excel(writer, sheet_name=f"{ref}", index=False)   
    print("Récupération du référentiel France Travail...TERMINE !")

    
# ---------------------------
# API CALL FRANCE TRAVAIL
# ---------------------------
def fetch_france_travail_jobs(token, max_pages=MAX_PAGES):
    headers = {"Authorization": f"Bearer {token}"}
    all_jobs = []
    b_stop_criteria = False
    
    for page in range(1, max_pages + 1):
        if b_stop_criteria == False:    
            url = f"https://api.francetravail.io/partenaire/offresdemploi/v2/offres/search"
            params = {
                "motsCles": JOB_QUERY,
                "commune": COMMUNE,
                "distance" : DISTANCE,
                "range": f"{(page-1)*BLOC_PAGINATION}-{page*BLOC_PAGINATION-1}"  # pagination par blocs de 50
            }
            r = requests.get(url, headers=headers, params=params)
            r.raise_for_status()
            data = r.json()
            offres = data.get("resultats", [])
                
            for o in offres:
                all_jobs.append({
                    "source": "France Travail",
                    "id":o.get("id"),                    
                    "titre": o.get("intitule"),
                    "description": o.get("description"),
                    "date": o.get("dateCreation"),
                    "date_actualisation": o.get("dateActualisation"),
                    "lieu_libelle": o.get("lieuTravail", {}).get("libelle"),
                    "lieu_latitude": o.get("lieuTravail", {}).get("latitude"),
                    "lieu_longitude": o.get("lieuTravail", {}).get("longitude"),
                    "lieu_codePostal": o.get("lieuTravail", {}).get("codePostal"),
                    "lieu_commune": o.get("lieuTravail", {}).get("commune"),
                    "entreprise_nom": o.get("entreprise", {}).get("nom"),
                    "entreprise_description": o.get("entreprise", {}).get("description"),
                    "entreprise_logo": o.get("entreprise", {}).get("logo"),
                    "entreprise_url": o.get("entreprise", {}).get("url"),
                    "typeContrat": o.get("typeContrat"),
                    "typeContratLibelle": o.get("typeContratLibelle"),
                    "natureContrat": o.get("natureContrat"),
                    "experienceExige": o.get("experienceExige"),
                    "experienceLibelle": o.get("experienceLibelle"),
                    "experienceCommentaire": o.get("experienceCommentaire"),
                    "experienceCommentaire": o.get("experienceCommentaire"),    
                    
                    # "formations": o.get("formations"),
                    "formations_codeFormation": o.get("formations")[0].get("codeFormation") if o.get("formations") is not None else "None",
                    "formations_domaineLibelle": o.get("formations")[0].get("domaineLibelle") if o.get("formations") is not None else "None",
                    "formations_niveauLibelle": o.get("formations")[0].get("niveauLibelle") if o.get("formations") is not None else "None",
                    "formations_commentaire": o.get("formations")[0].get("commentaire") if o.get("formations") is not None else "None",
                    "formations_exigence": o.get("formations")[0].get("exigence") if o.get("formations") is not None else "None",
                    
                    # "langues": o.get("langues"),
                    "langues_libelle": o.get("langues")[0].get("libelle") if o.get("langues") is not None else "None",
                    "langues_exigence": o.get("langues")[0].get("exigence") if o.get("langues") is not None else "None",
                
                    "permis": o.get("permis"),
                    "permis_libelle": o.get("permis")[0].get("libelle") if o.get("permis") is not None else "None",
                    "permis_exigence": o.get("permis")[0].get("exigence") if o.get("permis") is not None else "None",

                    "outilsBureautiques": o.get("outilsBureautiques"),

                    # "competences": o.get("competences"),
                    "permis_code": o.get("competences")[0].get("code") if o.get("competences") is not None else "None",
                    "permis_libelle": o.get("competences")[0].get("libelle") if o.get("competences") is not None else "None",
                    "permis_exigence": o.get("competences")[0].get("exigence") if o.get("competences") is not None else "None",

                    # "salaire": o.get("salaire"),
                    "salaire_libelle": o.get("salaire").get("libelle") if o.get("salaire") is not None else "None",
                    "salaire_commentaire": o.get("salaire").get("commentaire") if o.get("salaire") is not None else "None",
                    "salaire_complement1": o.get("salaire").get("complement1") if o.get("salaire") is not None else "None",
                    "salaire_complement2": o.get("salaire").get("complement2") if o.get("salaire") is not None else "None",

                    "dureeTravailLibelle": o.get("dureeTravailLibelle"),

                    "dureeTravailLibelleConverti": o.get("dureeTravailLibelleConverti"),
                    "complementExercice": o.get("complementExercice"),
                    "conditionExercice": o.get("conditionExercice"),
                    "alternance": o.get("alternance"),

                    # "contact": o.get("contact"),
                    "contact_nom": o.get("contact").get("nom") if o.get("contact") is not None else "None",
                    "contact_coordonnees1": o.get("contact").get("coordonnees1") if o.get("contact") is not None else "None",
                    "contact_coordonnees2": o.get("contact").get("coordonnees2") if o.get("contact") is not None else "None",
                    "contact_coordonnees3": o.get("contact").get("coordonnees3") if o.get("contact") is not None else "None",
                    "contact_telephone": o.get("contact").get("telephone") if o.get("contact") is not None else "None",
                    "contact_courriel": o.get("contact").get("courriel") if o.get("contact") is not None else "None",
                    "contact_commentaire": o.get("contact").get("commentaire") if o.get("contact") is not None else "None",
                    "contact_urlRecruteur": o.get("contact").get("urlRecruteur") if o.get("contact") is not None else "None",
                    "contact_urlPostulation": o.get("contact").get("urlPostulation") if o.get("contact") is not None else "None",

                    # "agence": o.get("agence"),
                    "agence_telephone": o.get("agence").get("telephone") if o.get("agence") is not None else "None",
                    "agence_courriel": o.get("agence").get("courriel") if o.get("agence") is not None else "None",

                    "nombrePostes": o.get("nombrePostes"),
                    "deplacementCode": o.get("deplacementCode"),
                    "deplacementLibelle": o.get("deplacementLibelle"),

                    "qualificationCode": o.get("qualificationCode"),
                    "qualificationLibelle": o.get("qualificationLibelle"),

                    "codeNAF": o.get("codeNAF"),
                    "secteurActivite": o.get("secteurActivite"),
                    "secteurActiviteLibelle": o.get("secteurActiviteLibelle"),
                    
                    # "qualitesProfessionnelles": o.get("qualitesProfessionnelles"),
                    "qualitesProfessionnelles_libelle": o.get("qualitesProfessionnelles")[0].get("libelle") if o.get("qualitesProfessionnelles") is not None else "None",
                    "qualitesProfessionnelles_description": o.get("qualitesProfessionnelles")[0].get("description") if o.get("qualitesProfessionnelles") is not None else "None",

                    "trancheEffectifEtab": o.get("trancheEffectifEtab"),


                    # "origineOffre": o.get("origineOffre"),
                    "origineOffre_origine": o.get("origineOffre").get("origine") if o.get("origineOffre") is not None else "None",
                    "origineOffre_urlOrigine": o.get("origineOffre").get("urlOrigine") if o.get("origineOffre") is not None else "None",
                
                    # "origineOffre_partenaires": o.get("origineOffre").get("partenaires") if o.get("origineOffre") is not None else "None",

                    "origineOffre_partenaires_nom": o.get("origineOffre").get("partenaires")[0].get("nom") if o.get("origineOffre").get("partenaires") is not None else "None",
                    "origineOffre_partenaires_url": o.get("origineOffre").get("partenaires")[0].get("url") if o.get("origineOffre").get("partenaires") is not None else "None",
                    "origineOffre_partenaires_logo": o.get("origineOffre").get("partenaires")[0].get("logo") if o.get("origineOffre").get("partenaires") is not None else "None",

                    "offresManqueCandidats": o.get("offresManqueCandidats"),

                    # "contexteTravail": o.get("contexteTravail"),
                    "contexteTravail_horaires": o.get("contexteTravail").get("horaires")[0] if o.get("contexteTravail").get("horaires") is not None else "None",
                    "contexteTravail_conditionsExercice": o.get("contexteTravail").get("conditionsExercice")[0] if o.get("contexteTravail").get("conditionsExercice") is not None else "None",
                })
            print(len(offres))

            # Si le nombre d'offres est inférieur au nombre max d'offre par pages, c'est un signe qu'il n'y a plus d'offres à extraire après la page actuelle.
            if len(offres) < BLOC_PAGINATION:
                b_stop_criteria = True

    with pd.ExcelWriter("../data/raw_data/my_data_new.xlsx", mode='a') as writer:
        df = pd.DataFrame(all_jobs)
        df.to_excel(writer, sheet_name=f"Offres_{JOB_QUERY}", index=False)   

    # with pd.ExcelWriter("../data/raw_data/my_data_new.xlsx", mode='a', engine='openpyxl') as writer:
    #     df = pd.DataFrame(all_jobs)
    #     df.to_excel(writer, sheet_name=f"Offres_{JOB_QUERY}", index=False)  
            
    return all_jobs

# ---------------------------
# MAIN
# ---------------------------
if __name__ == "__main__":
    print("Authentification France Travail...")
    token = get_ft_token()

    # print("Récupération du référentiel France Travail...")
    # fetch_france_travail_referentiel(token)

    print("Récupération des offres France Travail...")
    ft_jobs = fetch_france_travail_jobs(token)

    print("Affichage Extract offres France Travail...")
    df = pd.DataFrame(ft_jobs)
    display(df.shape)
    display(df.head(20))

    # # Export vers CSV
    # df.to_csv("../data/raw_data/offres_emploi.csv", index=False, encoding="utf-8")
    print(f"{len(ft_jobs)} offres uniques exportées dans offres_emploi.csv ✅")


Authentification France Travail...
Récupération des offres France Travail...
50
50
50
19


ModuleNotFoundError: No module named 'openpyxl'

In [None]:
# # ---------------------------
# # CONFIGURATION
# # ---------------------------
# # France Travail (ex-Pôle emploi)
# # FT_CLIENT_ID = Defined in .env
# # FT_CLIENT_SECRET = Defined in .env
# # FT_SCOPE = Defined in .env

# ##################  VARIABLES  ##################
# FT_CLIENT_ID = os.environ.get("FT_CLIENT_ID")
# FT_CLIENT_SECRET = os.environ.get("FT_CLIENT_SECRET")
# FT_SCOPE = os.environ.get("FT_SCOPE")

# # Paramètres de recherche
# JOB_QUERY = "data analyst"
# COMMUNE = "78300"
# DISTANCE = 500

# # Nombre d'annonces par page requise
# BLOC_PAGINATION = 50

# # Nombre de pages max
# MAX_PAGES = 20   # Limiter le nombre de pages récupérées

# # ---------------------------
# # AUTH FRANCE TRAVAIL
# # ---------------------------
# def get_ft_token():
#     url = "https://entreprise.pole-emploi.fr/connexion/oauth2/access_token?realm=/partenaire"
#     data = {
#         "grant_type": "client_credentials",
#         "client_id": FT_CLIENT_ID,
#         "client_secret": FT_CLIENT_SECRET,
#         "scope": FT_SCOPE,
#     }
#     r = requests.post(url, data=data)
#     r.raise_for_status()
#     return r.json()["access_token"]

# # ---------------------------
# # API CALL FRANCE TRAVAIL
# # ---------------------------
# def fetch_france_travail_jobs(token, max_pages=MAX_PAGES):
#     headers = {"Authorization": f"Bearer {token}"}
#     all_jobs = []
#     b_stop_criteria = False
    
#     for page in range(1, max_pages + 1):
#         if b_stop_criteria == False:    
#             url = f"https://api.francetravail.io/partenaire/offresdemploi/v2/offres/search"
#             params = {
#                 "motsCles": JOB_QUERY,
#                 "commune": COMMUNE,
#                 "distance" : DISTANCE,
#                 "range": f"{(page-1)*BLOC_PAGINATION}-{page*BLOC_PAGINATION-1}"  # pagination par blocs de 50
#             }
#             r = requests.get(url, headers=headers, params=params)
#             r.raise_for_status()
#             data = r.json()
#             offres = data.get("resultats", [])
                
#             for o in offres:
#                 all_jobs.append({
#                     "source": "France Travail",
#                     "id":o.get("id"),                    
#                     "titre": o.get("intitule"),
#                     "description": o.get("description"),
#                     "date": o.get("dateCreation"),
#                     "date_actualisation": o.get("dateActualisation"),
#                     "lieu_libelle": o.get("lieuTravail", {}).get("libelle"),
#                     "lieu_latitude": o.get("lieuTravail", {}).get("latitude"),
#                     "lieu_longitude": o.get("lieuTravail", {}).get("longitude"),
#                     "lieu_codePostal": o.get("lieuTravail", {}).get("codePostal"),
#                     "lieu_commune": o.get("lieuTravail", {}).get("commune"),
#                     "entreprise_nom": o.get("entreprise", {}).get("nom"),
#                     "entreprise_description": o.get("entreprise", {}).get("description"),
#                     "entreprise_logo": o.get("entreprise", {}).get("logo"),
#                     "entreprise_url": o.get("entreprise", {}).get("url"),
#                     "typeContrat": o.get("typeContrat"),
#                     "typeContratLibelle": o.get("typeContratLibelle"),
#                     "natureContrat": o.get("natureContrat"),
#                     "experienceExige": o.get("experienceExige"),
#                     "experienceLibelle": o.get("experienceLibelle"),
#                     "experienceCommentaire": o.get("experienceCommentaire"),
#                     "experienceCommentaire": o.get("experienceCommentaire"),    
                    
#                     # "formations": o.get("formations"),
#                     "formations_codeFormation": o.get("formations")[0].get("codeFormation") if o.get("formations") is not None else "None",
#                     "formations_domaineLibelle": o.get("formations")[0].get("domaineLibelle") if o.get("formations") is not None else "None",
#                     "formations_niveauLibelle": o.get("formations")[0].get("niveauLibelle") if o.get("formations") is not None else "None",
#                     "formations_commentaire": o.get("formations")[0].get("commentaire") if o.get("formations") is not None else "None",
#                     "formations_exigence": o.get("formations")[0].get("exigence") if o.get("formations") is not None else "None",
                    
#                     # "langues": o.get("langues"),
#                     "langues_libelle": o.get("langues")[0].get("libelle") if o.get("langues") is not None else "None",
#                     "langues_exigence": o.get("langues")[0].get("exigence") if o.get("langues") is not None else "None",
                
#                     "permis": o.get("permis"),
#                     "permis_libelle": o.get("permis")[0].get("libelle") if o.get("permis") is not None else "None",
#                     "permis_exigence": o.get("permis")[0].get("exigence") if o.get("permis") is not None else "None",

#                     "outilsBureautiques": o.get("outilsBureautiques"),

#                     # "competences": o.get("competences"),
#                     "permis_code": o.get("competences")[0].get("code") if o.get("competences") is not None else "None",
#                     "permis_libelle": o.get("competences")[0].get("libelle") if o.get("competences") is not None else "None",
#                     "permis_exigence": o.get("competences")[0].get("exigence") if o.get("competences") is not None else "None",

#                     # "salaire": o.get("salaire"),
#                     "salaire_libelle": o.get("salaire").get("libelle") if o.get("salaire") is not None else "None",
#                     "salaire_commentaire": o.get("salaire").get("commentaire") if o.get("salaire") is not None else "None",
#                     "salaire_complement1": o.get("salaire").get("complement1") if o.get("salaire") is not None else "None",
#                     "salaire_complement2": o.get("salaire").get("complement2") if o.get("salaire") is not None else "None",

#                     "dureeTravailLibelle": o.get("dureeTravailLibelle"),

#                     "dureeTravailLibelleConverti": o.get("dureeTravailLibelleConverti"),
#                     "complementExercice": o.get("complementExercice"),
#                     "conditionExercice": o.get("conditionExercice"),
#                     "alternance": o.get("alternance"),

#                     # "contact": o.get("contact"),
#                     "contact_nom": o.get("contact").get("nom") if o.get("contact") is not None else "None",
#                     "contact_coordonnees1": o.get("contact").get("coordonnees1") if o.get("contact") is not None else "None",
#                     "contact_coordonnees2": o.get("contact").get("coordonnees2") if o.get("contact") is not None else "None",
#                     "contact_coordonnees3": o.get("contact").get("coordonnees3") if o.get("contact") is not None else "None",
#                     "contact_telephone": o.get("contact").get("telephone") if o.get("contact") is not None else "None",
#                     "contact_courriel": o.get("contact").get("courriel") if o.get("contact") is not None else "None",
#                     "contact_commentaire": o.get("contact").get("commentaire") if o.get("contact") is not None else "None",
#                     "contact_urlRecruteur": o.get("contact").get("urlRecruteur") if o.get("contact") is not None else "None",
#                     "contact_urlPostulation": o.get("contact").get("urlPostulation") if o.get("contact") is not None else "None",

#                     # "agence": o.get("agence"),
#                     "agence_telephone": o.get("agence").get("telephone") if o.get("agence") is not None else "None",
#                     "agence_courriel": o.get("agence").get("courriel") if o.get("agence") is not None else "None",

#                     "nombrePostes": o.get("nombrePostes"),
#                     "deplacementCode": o.get("deplacementCode"),
#                     "deplacementLibelle": o.get("deplacementLibelle"),

#                     "qualificationCode": o.get("qualificationCode"),
#                     "qualificationLibelle": o.get("qualificationLibelle"),

#                     "codeNAF": o.get("codeNAF"),
#                     "secteurActivite": o.get("secteurActivite"),
#                     "secteurActiviteLibelle": o.get("secteurActiviteLibelle"),
                    
#                     # "qualitesProfessionnelles": o.get("qualitesProfessionnelles"),
#                     "qualitesProfessionnelles_libelle": o.get("qualitesProfessionnelles")[0].get("libelle") if o.get("qualitesProfessionnelles") is not None else "None",
#                     "qualitesProfessionnelles_description": o.get("qualitesProfessionnelles")[0].get("description") if o.get("qualitesProfessionnelles") is not None else "None",

#                     "trancheEffectifEtab": o.get("trancheEffectifEtab"),


#                     # "origineOffre": o.get("origineOffre"),
#                     "origineOffre_origine": o.get("origineOffre").get("origine") if o.get("origineOffre") is not None else "None",
#                     "origineOffre_urlOrigine": o.get("origineOffre").get("urlOrigine") if o.get("origineOffre") is not None else "None",
                
#                     # "origineOffre_partenaires": o.get("origineOffre").get("partenaires") if o.get("origineOffre") is not None else "None",

#                     "origineOffre_partenaires_nom": o.get("origineOffre").get("partenaires")[0].get("nom") if o.get("origineOffre").get("partenaires") is not None else "None",
#                     "origineOffre_partenaires_url": o.get("origineOffre").get("partenaires")[0].get("url") if o.get("origineOffre").get("partenaires") is not None else "None",
#                     "origineOffre_partenaires_logo": o.get("origineOffre").get("partenaires")[0].get("logo") if o.get("origineOffre").get("partenaires") is not None else "None",

#                     "offresManqueCandidats": o.get("offresManqueCandidats"),

#                     # "contexteTravail": o.get("contexteTravail"),
#                     "contexteTravail_horaires": o.get("contexteTravail").get("horaires")[0] if o.get("contexteTravail").get("horaires") is not None else "None",
#                     "contexteTravail_conditionsExercice": o.get("contexteTravail").get("conditionsExercice")[0] if o.get("contexteTravail").get("conditionsExercice") is not None else "None",
#                 })
#             print(len(offres))

#             # Si le nombre d'offres est inférieur au nombre max d'offre par pages, c'est un signe qu'il n'y a plus d'offres à extraire après la page actuelle.
#             if len(offres) < BLOC_PAGINATION:
#                 b_stop_criteria = True
            
#     return all_jobs

# # ---------------------------
# # MAIN
# # ---------------------------
# if __name__ == "__main__":
#     print("Authentification France Travail...")
#     token = get_ft_token()

#     print("Récupération des offres France Travail...")
#     ft_jobs = fetch_france_travail_jobs(token)

#     print("Affichage Extract offres France Travail...")
#     df = pd.DataFrame(ft_jobs)
#     display(df.shape)
#     display(df.head(20))

#     # Export vers CSV
#     df.to_csv("../data/raw_data/offres_emploi.csv", index=False, encoding="utf-8")
#     print(f"{len(ft_jobs)} offres uniques exportées dans offres_emploi.csv ✅")
