# Connexion à l'API France Travail

URL : 

https://francetravail.io/data/api/offres-emploi

https://francetravail.io/data/api/offres-emploi/documentation#/

## Imports

In [36]:
import http.client
import requests
import json
import pandas as pd
import os

In [151]:
# ---------------------------
# CONFIGURATION
# ---------------------------
# France Travail (ex-Pôle emploi)
# FT_CLIENT_ID = Defined in .env
# FT_CLIENT_SECRET = Defined in .env
# FT_SCOPE = Defined in .env

##################  VARIABLES  ##################
FT_CLIENT_ID = os.environ.get("FT_CLIENT_ID")
FT_CLIENT_SECRET = os.environ.get("FT_CLIENT_SECRET")
FT_SCOPE = os.environ.get("FT_SCOPE")

# Paramètres de recherche
JOB_QUERY = "data scientist"
COMMUNE = "78300"
DISTANCE = 500
BLOC_PAGINATION = 50

MAX_PAGES = 1   # Limiter le nombre de pages récupérées

# ---------------------------
# AUTH FRANCE TRAVAIL
# ---------------------------
def get_ft_token():
    url = "https://entreprise.pole-emploi.fr/connexion/oauth2/access_token?realm=/partenaire"
    data = {
        "grant_type": "client_credentials",
        "client_id": FT_CLIENT_ID,
        "client_secret": FT_CLIENT_SECRET,
        "scope": FT_SCOPE,
    }
    r = requests.post(url, data=data)
    r.raise_for_status()
    return r.json()["access_token"]

# ---------------------------
# API CALL FRANCE TRAVAIL
# ---------------------------
def fetch_france_travail_jobs(token, max_pages=MAX_PAGES):
    headers = {"Authorization": f"Bearer {token}"}
    all_jobs = []
    b_stop_criteria = False
    
    for page in range(1, max_pages + 1):
        if b_stop_criteria == False:    
            url = f"https://api.francetravail.io/partenaire/offresdemploi/v2/offres/search"
            params = {
                "motsCles": JOB_QUERY,
                "commune": COMMUNE,
                "distance" : DISTANCE,
                "range": f"{(page-1)*BLOC_PAGINATION}-{page*BLOC_PAGINATION-1}"  # pagination par blocs de 50
            }
            r = requests.get(url, headers=headers, params=params)
            r.raise_for_status()
            data = r.json()
            offres = data.get("resultats", [])
                
            for o in offres:
                all_jobs.append({
                    "source": "France Travail",
                    "id":o.get("id"),                    
                    "titre": o.get("intitule"),
                    "description": o.get("description"),
                    "date": o.get("dateCreation"),
                    "date_actualisation": o.get("dateActualisation"),
                    "lieu_libelle": o.get("lieuTravail", {}).get("libelle"),
                    "lieu_latitude": o.get("lieuTravail", {}).get("latitude"),
                    "lieu_longitude": o.get("lieuTravail", {}).get("longitude"),
                    "lieu_codePostal": o.get("lieuTravail", {}).get("codePostal"),
                    "lieu_commune": o.get("lieuTravail", {}).get("commune"),
                    "entreprise_nom": o.get("entreprise", {}).get("nom"),
                    "entreprise_description": o.get("entreprise", {}).get("description"),
                    "entreprise_logo": o.get("entreprise", {}).get("logo"),
                    "entreprise_url": o.get("entreprise", {}).get("url"),
                    "typeContrat": o.get("typeContrat"),
                    "typeContratLibelle": o.get("typeContratLibelle"),
                    "natureContrat": o.get("natureContrat"),
                    "experienceExige": o.get("experienceExige"),
                    "experienceLibelle": o.get("experienceLibelle"),
                    "experienceCommentaire": o.get("experienceCommentaire"),
                    "experienceCommentaire": o.get("experienceCommentaire"),      
                    "formations": o.get("formations"),
                    "formations_codeFormation": o.get("formations")[0].get("codeFormation") if o.get("formations") is not None else "None",
                    "formations_domaineLibelle": o.get("formations")[0].get("domaineLibelle") if o.get("formations") is not None else "None",
                    "formations_niveauLibelle": o.get("formations")[0].get("niveauLibelle") if o.get("formations") is not None else "None",
                    "formations_commentaire": o.get("formations")[0].get("commentaire") if o.get("formations") is not None else "None",
                    "formations_exigence": o.get("formations")[0].get("exigence") if o.get("formations") is not None else "None",
                    "langues": o.get("langues"),
                    "langues_libelle": o.get("langues")[0].get("libelle") if o.get("langues") is not None else "None",
                    "langues_exigence": o.get("langues")[0].get("exigence") if o.get("langues") is not None else "None",
                
                    "permis": o.get("permis"),
                    "permis_libelle": o.get("permis")[0].get("libelle") if o.get("permis") is not None else "None",
                    "permis_exigence": o.get("permis")[0].get("exigence") if o.get("permis") is not None else "None",

                    "outilsBureautiques": o.get("outilsBureautiques"),

                    "competences": o.get("competences"),
                    "permis_code": o.get("competences")[0].get("code") if o.get("competences") is not None else "None",
                    "permis_libelle": o.get("competences")[0].get("libelle") if o.get("competences") is not None else "None",
                    "permis_exigence": o.get("competences")[0].get("exigence") if o.get("competences") is not None else "None",

                    "salaire": o.get("salaire"),
                    "salaire_libelle": o.get("salaire").get("libelle") if o.get("salaire") is not None else "None",
                    "salaire_commentaire": o.get("salaire").get("commentaire") if o.get("salaire") is not None else "None",
                    "salaire_complement1": o.get("salaire").get("complement1") if o.get("salaire") is not None else "None",
                    "salaire_complement2": o.get("salaire").get("complement2") if o.get("salaire") is not None else "None",

                    "dureeTravailLibelle": o.get("dureeTravailLibelle"),

                    "dureeTravailLibelleConverti": o.get("dureeTravailLibelleConverti"),
                    "complementExercice": o.get("complementExercice"),
                    "conditionExercice": o.get("conditionExercice"),
                    "alternance": o.get("alternance"),

                    "contact": o.get("contact"),
                    "contact_nom": o.get("contact").get("nom") if o.get("contact") is not None else "None",
                    "contact_coordonnees1": o.get("contact").get("coordonnees1") if o.get("contact") is not None else "None",
                    "contact_coordonnees2": o.get("contact").get("coordonnees2") if o.get("contact") is not None else "None",
                    "contact_coordonnees3": o.get("contact").get("coordonnees3") if o.get("contact") is not None else "None",
                    "contact_telephone": o.get("contact").get("telephone") if o.get("contact") is not None else "None",
                    "contact_courriel": o.get("contact").get("courriel") if o.get("contact") is not None else "None",
                    "contact_commentaire": o.get("contact").get("commentaire") if o.get("contact") is not None else "None",
                    "contact_urlRecruteur": o.get("contact").get("urlRecruteur") if o.get("contact") is not None else "None",
                    "contact_urlPostulation": o.get("contact").get("urlPostulation") if o.get("contact") is not None else "None",

                    "agence": o.get("agence"),
                    "agence_telephone": o.get("agence").get("telephone") if o.get("agence") is not None else "None",
                    "agence_courriel": o.get("agence").get("courriel") if o.get("agence") is not None else "None",

                    "nombrePostes": o.get("nombrePostes"),
                    "deplacementCode": o.get("deplacementCode"),
                    "deplacementLibelle": o.get("deplacementLibelle"),

                    "qualificationCode": o.get("qualificationCode"),
                    "qualificationLibelle": o.get("qualificationLibelle"),

                    "codeNAF": o.get("codeNAF"),
                    "secteurActivite": o.get("secteurActivite"),
                    "secteurActiviteLibelle": o.get("secteurActiviteLibelle"),
                    
                    "qualitesProfessionnelles": o.get("qualitesProfessionnelles"),
                    "qualitesProfessionnelles_libelle": o.get("qualitesProfessionnelles")[0].get("libelle") if o.get("qualitesProfessionnelles") is not None else "None",
                    "qualitesProfessionnelles_description": o.get("qualitesProfessionnelles")[0].get("description") if o.get("qualitesProfessionnelles") is not None else "None",

                    "trancheEffectifEtab": o.get("trancheEffectifEtab"),


                    "origineOffre": o.get("origineOffre"),
                    "origineOffre_origine": o.get("origineOffre").get("origine") if o.get("origineOffre") is not None else "None",
                    "origineOffre_urlOrigine": o.get("origineOffre").get("urlOrigine") if o.get("origineOffre") is not None else "None",
                    "origineOffre_partenaires": o.get("origineOffre").get("partenaires") if o.get("origineOffre") is not None else "None",

                    "origineOffre_partenaires_nom": o.get("origineOffre").get("partenaires")[0].get("nom") if o.get("origineOffre").get("partenaires") is not None else "None",
                    "origineOffre_partenaires_url": o.get("origineOffre").get("partenaires")[0].get("url") if o.get("origineOffre").get("partenaires") is not None else "None",
                    "origineOffre_partenaires_logo": o.get("origineOffre").get("partenaires")[0].get("logo") if o.get("origineOffre").get("partenaires") is not None else "None",

                    "offresManqueCandidats": o.get("offresManqueCandidats"),

                    "contexteTravail": o.get("contexteTravail"),
                    "contexteTravail_horaires": o.get("contexteTravail").get("horaires") if o.get("contexteTravail") is not None else "None",
                    "contexteTravail_conditionsExercice": o.get("contexteTravail").get("conditionsExercice") if o.get("contexteTravail") is not None else "None",
                    
                    "lieu": o.get("lieuTravail", {}).get("libelle"),                    
                    "url": o.get("origineOffre", {}).get("urlOrigine")
                })
            print(len(offres))
            
            if len(offres) < BLOC_PAGINATION:
                b_stop_criteria = True
            
    return all_jobs

# ---------------------------
# MAIN
# ---------------------------
if __name__ == "__main__":
    print("Authentification France Travail...")
    token = get_ft_token()

    print("Récupération des offres France Travail...")
    ft_jobs = fetch_france_travail_jobs(token)

    print("Affichage Extract offres France Travail...")
    df = pd.DataFrame(ft_jobs)
    display(df.head(20))

    # Export vers CSV
    df.to_csv("../data/raw_data/offres_emploi.csv", index=False, encoding="utf-8")
    print(f"{len(ft_jobs)} offres uniques exportées dans offres_emploi.csv ✅")


Authentification France Travail...
Récupération des offres France Travail...
50
Affichage Extract offres France Travail...


Unnamed: 0,source,id,titre,description,date,date_actualisation,lieu_libelle,lieu_latitude,lieu_longitude,lieu_codePostal,...,origineOffre_partenaires,origineOffre_partenaires_nom,origineOffre_partenaires_url,origineOffre_partenaires_logo,offresManqueCandidats,contexteTravail,contexteTravail_horaires,contexteTravail_conditionsExercice,lieu,url
0,France Travail,197TJGR,Data Scientist - H/F - CDI (H/F),"Intégré(e) au sein de l'équipe Data, vous part...",2025-09-12T15:47:35.716Z,2025-09-12T15:47:36.257Z,75 - PARIS 09,48.872479,2.341194,75009.0,...,,,,,False,{'horaires': ['39H/semaine Travail en journée']},[39H/semaine\nTravail en journée],,75 - PARIS 09,https://candidat.francetravail.fr/offres/reche...
1,France Travail,197QNVL,Senior Data Scientist (H/F),Descriptif du poste\n\nAu sein de l'équipe Dat...,2025-09-10T14:39:46.067Z,2025-09-10T14:39:46.609Z,75 - PARIS 02,,,75002.0,...,,,,,False,{'horaires': ['35H/semaine Travail en journée'...,[35H/semaine\nTravail en journée],[Autre],75 - PARIS 02,https://candidat.francetravail.fr/offres/reche...
2,France Travail,197PFLJ,Data Scientist - Senior (H/F),Nous recrutons un(e) Data Scientist Senior pou...,2025-09-09T14:55:00.882Z,2025-09-09T14:55:01.363Z,75 - PARIS 09,48.872479,2.341194,75009.0,...,,,,,False,{'horaires': ['35H/semaine Travail en journée']},[35H/semaine\nTravail en journée],,75 - PARIS 09,https://candidat.francetravail.fr/offres/reche...
3,France Travail,197PFBS,Lead Data Scientist (H/F),Nous recrutons un(e) Lead Data Scientist pour ...,2025-09-09T14:51:41.441Z,2025-09-09T14:51:41.883Z,75 - PARIS 09,48.872479,2.341194,75009.0,...,,,,,False,{'horaires': ['35H/semaine Travail en journée']},[35H/semaine\nTravail en journée],,75 - PARIS 09,https://candidat.francetravail.fr/offres/reche...
4,France Travail,197JFPL,Data scientist (H/F),Missions au sein de la F2RSM Psy :\nSous la r...,2025-09-04T09:08:08.298Z,2025-09-04T13:48:05.572Z,59 - ST ANDRE LEZ LILLE,50.661022,3.050033,59350.0,...,,,,,False,{'horaires': ['37H30/semaine Travail en journé...,[37H30/semaine\nTravail en journée],,59 - ST ANDRE LEZ LILLE,https://candidat.francetravail.fr/offres/reche...
5,France Travail,197HRZP,Data scientist (H/F),"Allianz France, depuis 2016, développe des cap...",2025-09-03T14:57:02.718Z,2025-09-04T10:58:13.036Z,92 - PUTEAUX,48.884019,2.237979,92800.0,...,,,,,False,{'horaires': ['36H/semaine Travail en journée'...,"[36H/semaine\nTravail en journée, Horaires an...",,92 - PUTEAUX,https://candidat.francetravail.fr/offres/reche...
6,France Travail,197HZVD,Data scientist (H/F),"Ingénieur(e) en IA pour différentes missions, ...",2025-09-03T17:53:28.629Z,2025-09-12T07:54:12.616Z,75 - PARIS 01,,,75001.0,...,,,,,False,{'horaires': ['Temps partiel - 7H/semaine Trav...,[Temps partiel - 7H/semaine\nTravail en journée],,75 - PARIS 01,https://candidat.francetravail.fr/offres/reche...
7,France Travail,197HDVX,Ingénieur-e de recherche data-scientist h/f (...,Pourquoi a-t-on besoin de vous?\nAu sein de la...,2025-09-03T10:44:09.081Z,2025-09-03T13:50:37.013Z,93 - Aubervilliers,48.914557,2.381792,93300.0,...,,,,,False,{'horaires': ['35H/semaine Travail en journée']},[35H/semaine\nTravail en journée],,93 - Aubervilliers,https://candidat.francetravail.fr/offres/reche...
8,France Travail,196RLRG,Ingénieur-e de recherche data-scientist (H/F),Pourquoi a-t-on besoin de vous ?\n\nAu sein de...,2025-08-20T11:35:00.575Z,2025-09-01T13:59:51.923Z,93 - AUBERVILLIERS,48.914557,2.381792,93300.0,...,,,,,False,{'horaires': ['37H30/semaine Travail en journé...,[37H30/semaine\nTravail en journée],,93 - AUBERVILLIERS,https://candidat.francetravail.fr/offres/reche...
9,France Travail,197JQWD,Chargé d'études (H/F),Avec près de 1 100 salariés et environ 2 milli...,2025-09-04T12:17:03.096Z,2025-09-04T13:13:22.606Z,75 - PARIS 15,48.841401,2.300274,75015.0,...,,,,,False,{'horaires': ['39H/semaine Travail en journée']},[39H/semaine\nTravail en journée],,75 - PARIS 15,https://candidat.francetravail.fr/offres/reche...


50 offres uniques exportées dans offres_emploi.csv ✅


In [111]:
print i 


SyntaxError: Missing parentheses in call to 'print'. Did you mean print(...)? (2442003204.py, line 1)

In [110]:
# # ---------------------------
# # CONFIGURATION
# # ---------------------------
# # France Travail (ex-Pôle emploi)
# # FT_CLIENT_ID = Defined in .env
# # FT_CLIENT_SECRET = Defined in .env
# # FT_SCOPE = Defined in .env

# ##################  VARIABLES  ##################
# FT_CLIENT_ID = os.environ.get("FT_CLIENT_ID")
# FT_CLIENT_SECRET = os.environ.get("FT_CLIENT_SECRET")
# FT_SCOPE = os.environ.get("FT_SCOPE")

# # Paramètres de recherche
# JOB_QUERY = "data scientist"
# COMMUNE = "78300"
# DISTANCE = 500
# BLOC_PAGINATION = 50

# MAX_PAGES = 10   # Limiter le nombre de pages récupérées

# # ---------------------------
# # AUTH FRANCE TRAVAIL
# # ---------------------------
# def get_ft_token():
#     url = "https://entreprise.pole-emploi.fr/connexion/oauth2/access_token?realm=/partenaire"
#     data = {
#         "grant_type": "client_credentials",
#         "client_id": FT_CLIENT_ID,
#         "client_secret": FT_CLIENT_SECRET,
#         "scope": FT_SCOPE,
#     }
#     r = requests.post(url, data=data)
#     r.raise_for_status()
#     return r.json()["access_token"]

# # ---------------------------
# # API CALL FRANCE TRAVAIL
# # ---------------------------
# def fetch_france_travail_jobs(token, max_pages=MAX_PAGES):
#     headers = {"Authorization": f"Bearer {token}"}
#     all_jobs = []
#     b_stop_criteria = False
#     b_first_pass = True
    
#     for page in range(1, max_pages + 1):
#         if b_stop_criteria == False:    
#             url = f"https://api.francetravail.io/partenaire/offresdemploi/v2/offres/search"
#             params = {
#                 "motsCles": JOB_QUERY,
#                 "commune": COMMUNE,
#                 "distance" : DISTANCE,
#                 "range": f"{(page-1)*BLOC_PAGINATION}-{page*BLOC_PAGINATION-1}"  # pagination par blocs de 50
#             }
#             r = requests.get(url, headers=headers, params=params)
#             r.raise_for_status()
#             data = r.json()
#             offres = data.get("resultats", [])

#             if b_first_pass == True:
#                 # Transformer en DataFrame en aplatissant les colonnes imbriquées
#                 df = pd.json_normalize(offres,sep="_")  # pour que les clés imbriquées deviennent "lieuTravail.libelle", etc.
#             else:
#                 df = pd.concat([df,pd.json_normalize(offres,sep="_")])

            
#             print(len(offres))
            
#             if len(offres) < BLOC_PAGINATION:
#                 b_stop_criteria = True

#             b_first_pass = False
            
#     return df

# # ---------------------------
# # MAIN
# # ---------------------------
# if __name__ == "__main__":
#     print("Authentification France Travail...")
#     token = get_ft_token()

#     print("Récupération des offres France Travail...")
#     ft_jobs_df = fetch_france_travail_jobs(token)

#     # print("Affichage Extract offres France Travail...")
#     # df = pd.DataFrame(ft_jobs)
#     # display(df.tail(5))

#     # Export vers CSV
#     ft_jobs_df.to_csv("../data/raw_data/offres_emploi.csv", index=False, encoding="utf-8")
#     print(f"{len(ft_jobs_df)} offres uniques exportées dans offres_emploi.csv ✅")


Authentification France Travail...
Récupération des offres France Travail...
50
50
1
101 offres uniques exportées dans offres_emploi.csv ✅


In [104]:
# # ---------------------------
# # CONFIGURATION
# # ---------------------------
# # France Travail (ex-Pôle emploi)
# # FT_CLIENT_ID = Defined in .env
# # FT_CLIENT_SECRET = Defined in .env
# # FT_SCOPE = Defined in .env

# ##################  VARIABLES  ##################
# FT_CLIENT_ID = os.environ.get("FT_CLIENT_ID")
# FT_CLIENT_SECRET = os.environ.get("FT_CLIENT_SECRET")
# FT_SCOPE = os.environ.get("FT_SCOPE")

# # Paramètres de recherche
# JOB_QUERY = "data scientist"
# COMMUNE = "78300"
# DISTANCE = 500
# BLOC_PAGINATION = 50

# MAX_PAGES = 1   # Limiter le nombre de pages récupérées

# # ---------------------------
# # AUTH FRANCE TRAVAIL
# # ---------------------------
# def get_ft_token():
#     url = "https://entreprise.pole-emploi.fr/connexion/oauth2/access_token?realm=/partenaire"
#     data = {
#         "grant_type": "client_credentials",
#         "client_id": FT_CLIENT_ID,
#         "client_secret": FT_CLIENT_SECRET,
#         "scope": FT_SCOPE,
#     }
#     r = requests.post(url, data=data)
#     r.raise_for_status()
#     return r.json()["access_token"]

# # ---------------------------
# # API CALL FRANCE TRAVAIL
# # ---------------------------
# def fetch_france_travail_jobs(token, max_pages=MAX_PAGES):
#     headers = {"Authorization": f"Bearer {token}"}
#     all_jobs = []
#     b_stop_criteria = False
    
#     for page in range(1, max_pages + 1):
#         if b_stop_criteria == False:    
#             url = f"https://api.francetravail.io/partenaire/offresdemploi/v2/offres/search"
#             params = {
#                 "motsCles": JOB_QUERY,
#                 "commune": COMMUNE,
#                 "distance" : DISTANCE,
#                 "range": f"{(page-1)*BLOC_PAGINATION}-{page*BLOC_PAGINATION-1}"  # pagination par blocs de 50
#             }
#             r = requests.get(url, headers=headers, params=params)
#             r.raise_for_status()
#             data = r.json()
#             offres = data.get("resultats", [])
                
#             for o in offres:
#                 all_jobs.append({
#                     "source": "France Travail",
#                     "id":o.get("id"),                    
#                     "titre": o.get("intitule"),
#                     "description": o.get("description"),
#                     "date": o.get("dateCreation"),
#                     "date_actualisation": o.get("dateActualisation"),
#                     "lieu_libelle": o.get("lieuTravail", {}).get("libelle"),
#                     "lieu_latitude": o.get("lieuTravail", {}).get("latitude"),
#                     "lieu_longitude": o.get("lieuTravail", {}).get("longitude"),
#                     "lieu_codePostal": o.get("lieuTravail", {}).get("codePostal"),
#                     "lieu_commune": o.get("lieuTravail", {}).get("commune"),
#                     "entreprise_nom": o.get("entreprise", {}).get("nom"),
#                     "entreprise_description": o.get("entreprise", {}).get("description"),
#                     "entreprise_logo": o.get("entreprise", {}).get("logo"),
#                     "entreprise_url": o.get("entreprise", {}).get("url"),
#                     "typeContrat": o.get("typeContrat"),
#                     "typeContratLibelle": o.get("typeContratLibelle"),
#                     "natureContrat": o.get("natureContrat"),
#                     "experienceExige": o.get("experienceExige"),
#                     "experienceLibelle": o.get("experienceLibelle"),
#                     "experienceCommentaire": o.get("experienceCommentaire"),
#                     "experienceCommentaire": o.get("experienceCommentaire"),      

#                     "formations": o.get("formations"),
#                     # if len(o.get("formations")) != 0:
#                     #     "codeFormation": o.get("formations",{}).get("codeFormation"),   
                
#                     # if isinstance(o.get("formations"), list):
#                     #     "codeFormation": o.get("formations"),
#                     # "codeFormation": o.get("formations", []).get("codeFormation"),

                    
#                     "lieu": o.get("lieuTravail", {}).get("libelle"),                    
#                     "url": o.get("origineOffre", {}).get("urlOrigine")
#                 })
#             print(len(offres))
            
#             if len(offres) < BLOC_PAGINATION:
#                 b_stop_criteria = True
            
#     return all_jobs

# # ---------------------------
# # MAIN
# # ---------------------------
# if __name__ == "__main__":
#     print("Authentification France Travail...")
#     token = get_ft_token()

#     print("Récupération des offres France Travail...")
#     ft_jobs = fetch_france_travail_jobs(token)

#     print("Affichage Extract offres France Travail...")
#     df = pd.DataFrame(ft_jobs)
#     display(df.tail(5))

#     # Export vers CSV
#     df.to_csv("../data/raw_data/offres_emploi.csv", index=False, encoding="utf-8")
#     print(f"{len(ft_jobs)} offres uniques exportées dans offres_emploi.csv ✅")


Authentification France Travail...
Récupération des offres France Travail...
50
Affichage Extract offres France Travail...


Unnamed: 0,source,id,titre,description,date,date_actualisation,lieu_libelle,lieu_latitude,lieu_longitude,lieu_codePostal,...,entreprise_url,typeContrat,typeContratLibelle,natureContrat,experienceExige,experienceLibelle,experienceCommentaire,formations,lieu,url
45,France Travail,1230514,Data scientist (H/F),Description du poste :\nEn rejoignant cette en...,2025-08-21T11:36:40.000Z,2025-08-21T11:36:40.000Z,75 - PARIS 09,48.872479,2.341194,75009,...,,CDI,Contrat à durée indéterminée,Contrat travail,E,Expérience exigée de 1 An(s),,,75 - PARIS 09,https://candidat.francetravail.fr/offres/reche...
46,France Travail,1213064,"DATA SCIENTIST SENIOR F/H - Système, réseaux, ...",Descriptif du poste:\n\nNous recherchons un(e)...,2025-08-20T17:30:21.000Z,2025-08-21T06:33:21.000Z,92 - NANTERRE,48.897181,2.222257,92000,...,,CDI,Contrat à durée indéterminée,Contrat travail,E,Expérience exigée de 5 An(s),,,92 - NANTERRE,https://candidat.francetravail.fr/offres/reche...
47,France Travail,1041235,Banque de France - Data Scientist expérimenté ...,DESCRIPTIF DE MISSION\n\nLe pôle « Statistique...,2025-08-15T03:58:47.000Z,2025-08-15T03:58:47.000Z,75 - PARIS 02,,,75002,...,,CDD,Contrat à durée déterminée - 9 Mois,Contrat travail,E,Expérience exigée,,,75 - PARIS 02,https://candidat.francetravail.fr/offres/reche...
48,France Travail,547772,Data scientist (H/F),Description du poste :\nEnvie de piloter des p...,2025-08-02T08:53:36.000Z,2025-09-06T08:04:05.000Z,75 - PARIS 09,48.872479,2.341194,75009,...,,CDI,Contrat à durée indéterminée,Contrat travail,E,Expérience exigée de 1 An(s),,,75 - PARIS 09,https://candidat.francetravail.fr/offres/reche...
49,France Travail,393053,Datascientist confirme(e) F/H (H/F),La Fabrique du Pôle Numérique et Data de la Di...,2025-07-30T10:38:24.000Z,2025-08-08T05:34:39.000Z,92 - PUTEAUX,48.884019,2.237979,92800,...,,CDI,Contrat à durée indéterminée,Contrat travail,D,Débutant accepté,,,92 - PUTEAUX,https://candidat.francetravail.fr/offres/reche...


50 offres uniques exportées dans offres_emploi.csv ✅


In [63]:
# # ---------------------------
# # CONFIGURATION
# # ---------------------------
# # France Travail (ex-Pôle emploi)
# # FT_CLIENT_ID = Defined in .env
# # FT_CLIENT_SECRET = Defined in .env
# # FT_SCOPE = Defined in .env

# ##################  VARIABLES  ##################
# FT_CLIENT_ID = os.environ.get("FT_CLIENT_ID")
# FT_CLIENT_SECRET = os.environ.get("FT_CLIENT_SECRET")
# FT_SCOPE = os.environ.get("FT_SCOPE")

# # Paramètres de recherche
# JOB_QUERY = "data engineer"
# COMMUNE = "78300"
# DISTANCE = 500
# BLOC_PAGINATION = 50

# MAX_PAGES = 20   # Limiter le nombre de pages récupérées

# # ---------------------------
# # AUTH FRANCE TRAVAIL
# # ---------------------------
# def get_ft_token():
#     url = "https://entreprise.pole-emploi.fr/connexion/oauth2/access_token?realm=/partenaire"
#     data = {
#         "grant_type": "client_credentials",
#         "client_id": FT_CLIENT_ID,
#         "client_secret": FT_CLIENT_SECRET,
#         "scope": FT_SCOPE,
#     }
#     r = requests.post(url, data=data)
#     r.raise_for_status()
#     return r.json()["access_token"]

# # ---------------------------
# # API CALL FRANCE TRAVAIL
# # ---------------------------
# def fetch_france_travail_jobs(token, max_pages=MAX_PAGES):
#     headers = {"Authorization": f"Bearer {token}"}
#     all_jobs = []
#     b_stop_criteria = False
    
#     for page in range(1, max_pages + 1):
#         if b_stop_criteria == False:    
#             url = f"https://api.francetravail.io/partenaire/offresdemploi/v2/offres/search"
#             params = {
#                 "motsCles": JOB_QUERY,
#                 "commune": COMMUNE,
#                 "distance" : DISTANCE,
#                 "range": f"{(page-1)*BLOC_PAGINATION}-{page*BLOC_PAGINATION-1}"  # pagination par blocs de 50
#             }
#             r = requests.get(url, headers=headers, params=params)
#             r.raise_for_status()
#             data = r.json()
#             offres = data.get("resultats", [])
#             for o in offres:
#                 all_jobs.append({
#                     "source": "France Travail",
#                     "titre": o.get("intitule"),
#                     "entreprise": o.get("entreprise", {}).get("nom"),
#                     "lieu": o.get("lieuTravail", {}).get("libelle"),
#                     "date": o.get("dateCreation"),
#                     "url": o.get("origineOffre", {}).get("urlOrigine"),
#                 })
#             print(len(offres))
            
#             if len(offres) < BLOC_PAGINATION:
#                 b_stop_criteria = True
            
#     return all_jobs

# # ---------------------------
# # MAIN
# # ---------------------------
# if __name__ == "__main__":
#     print("Authentification France Travail...")
#     token = get_ft_token()

#     print("Récupération des offres France Travail...")
#     ft_jobs = fetch_france_travail_jobs(token)

#     print("Affichage Extract offres France Travail...")
#     df = pd.DataFrame(ft_jobs)
#     display(df.head(10))

#     # Export vers CSV
#     df.to_csv("../data/raw_data/offres_emploi.csv", index=False, encoding="utf-8")
#     print(f"{len(ft_jobs)} offres uniques exportées dans offres_emploi.csv ✅")


Authentification France Travail...
Récupération des offres France Travail...
50
50
50
50
50
50
50
50
16
Affichage Extract offres France Travail...


Unnamed: 0,source,titre,entreprise,lieu,date,url
0,France Travail,Data Engineer - H/F - CDI (H/F),POLYCEA,75 - PARIS 09,2025-09-12T15:46:22.604Z,https://candidat.francetravail.fr/offres/reche...
1,France Travail,Data engineer,E-KENT,75 - Paris 13e Arrondissement,2025-09-12T16:20:49.815Z,https://candidat.francetravail.fr/offres/reche...
2,France Travail,Data engineer,EPSYL,33 - Bordeaux,2025-09-12T16:01:21.737Z,https://candidat.francetravail.fr/offres/reche...
3,France Travail,Data Engineer Kafka / BigQuery (H/F),SEGMENT ELITE,75 - PARIS 09,2025-09-11T18:06:20.094Z,https://candidat.francetravail.fr/offres/reche...
4,France Travail,Data Engineer - EMEA (H/F),DOLEAD,75 - PARIS 02,2025-09-11T09:48:37.782Z,https://candidat.francetravail.fr/offres/reche...
5,France Travail,Data Engineer SQL (H/F),SEGMENT ELITE,75 - PARIS 09,2025-09-09T13:23:39.343Z,https://candidat.francetravail.fr/offres/reche...
6,France Travail,Data Engineer (H/F),SEGMENT ELITE,75 - PARIS 09,2025-09-09T13:13:35.180Z,https://candidat.francetravail.fr/offres/reche...
7,France Travail,Data engineer (H/F),AMILTONE,59 - VILLENEUVE D ASCQ,2025-09-09T10:21:15.382Z,https://candidat.francetravail.fr/offres/reche...
8,France Travail,Software Engineer Data & AI (H/F),HIPAY,44 - Nantes,2025-09-09T11:28:00.390Z,https://candidat.francetravail.fr/offres/reche...
9,France Travail,Data engineer (H/F),,69 - LYON 07,2025-09-08T11:38:56.778Z,https://candidat.francetravail.fr/offres/reche...


416 offres uniques exportées dans offres_emploi.csv ✅
