In [1]:
from typing import TypedDict, List, Optional
from langgraph.graph import StateGraph
from openai import OpenAI
from langchain_community.chat_models import ChatOpenAI

# D√©finition de l'√©tat
class CVGenerationState(TypedDict):
    profile: dict             # Donn√©es du profil
    job: dict                # Donn√©es sur le job
    current_step: str
    error: Optional[str]

# Exemple de structure pour les donn√©es
# profile = {
#     "head_raw": dict,           # Informations de l'en-t√™te
#     "skills_raw": dict,         # Comp√©tences
#     "experiences": List[dict],  # Liste d'exp√©riences
#     "education": List[dict],    # Liste de formations
#     "hobbies_raw": dict         # Loisirs
# }
# job = {
#     "job_posting": str,     # Fiche de poste
#     "job_summary": Optional[str] # R√©sum√© de la fiche de poste
# }

# Structure pour une exp√©rience dans profile["experiences"]
# experience = {
#     "titre_raw": str,
#     "titre_refined": str,
#     "dates_raw": str,
#     "dates_refined": str,
#     "entreprise_raw": str,
#     "entreprise_refined": str,
#     "lieu_raw": str,
#     "lieu_refined": str,
#     "description": str,         # Description brute
#     "sumup": str,              # R√©sum√©
#     "bullets_points": List[str], # Points cl√©s
#     "poid": float              # Poids en %
# }

# Structure pour une formation dans profile["education"]
# education = {
#     "titre_raw": str,
#     "titre_refined": str,
#     "dates_raw": str,
#     "dates_refined": str,
#     "etablissement_raw": str,
#     "etablissement_refined": str,
#     "lieu_raw": str,
#     "lieu_refined": str,
#     "description": str,         # Description brute
#     "sumup": str,              # R√©sum√©
#     "poid": float              # Poids en %
# }


In [2]:
# D√©finition du mod√®le de langage
llm = ChatOpenAI(
    model="gpt-4o-mini",
    temperature=0,
)

# Test du mod√®le
test_response = llm.invoke("Dis bonjour en fran√ßais")
print("Test de r√©ponse du mod√®le:")
print(test_response.content)


  llm = ChatOpenAI(


Test de r√©ponse du mod√®le:
Bonjour !


In [3]:
import json

# Chargement des donn√©es de test depuis le fichier JSON
with open('data_test.json', 'r', encoding='utf-8') as json_file:
    test_data = json.load(json_file)

# Chargement de la fiche de poste depuis le fichier texte
with open('fiche_poste.txt', 'r', encoding='utf-8') as text_file:
    job_posting = text_file.read()

# Initialisation de l'√©tat avec les donn√©es de test et la fiche de poste
initial_state = {
    "profile": {
        "head_raw": test_data["cv_data"]["head"],
        "skills_raw": test_data["cv_data"]["skills"],
        "experiences": [
            {
                "titre_raw": exp["intitule"],
                "titre_refined": None,
                "dates_raw": exp["dates"],
                "dates_refined": None,
                "entreprise_raw": exp["etablissement"],
                "entreprise_refined": None,
                "lieu_raw": exp["lieu"],
                "lieu_refined": None,
                "description": exp["description"],
                "sumup": None,
                "bullets_points": [],
                "poid": None
            }
            for exp in test_data["cv_data"]["experiences"]["experiences"]
        ],
        "education": [
            {
                "titre_raw": edu["intitule"],
                "titre_refined": None,
                "dates_raw": edu["dates"],
                "dates_refined": None,
                "etablissement_raw": edu["etablissement"],
                "etablissement_refined": None,
                "lieu_raw": edu["lieu"],
                "lieu_refined": None,
                "description": edu["description"],
                "sumup": None,
                "poid": None
            }
            for edu in test_data["cv_data"]["education"]["educations"]
        ],
        "hobbies_raw": test_data["cv_data"]["hobbies"]
    },
    "job": {
        "job_posting": job_posting,
        "job_summary": None
    }
}

In [4]:
# Nodes (fonctions de transformation)
def summarize_job(state: CVGenerationState) -> CVGenerationState:
    response = llm.invoke(
        "Faites un r√©sum√© de cette fiche de poste en 100 mots maximum, en incluant les informations principales pour r√©diger un CV.\n\n" + 
        state["job"]["job_posting"]
    )
    state["job"]["job_summary"] = response.content.strip()
    return state


In [5]:
initial_state = summarize_job(initial_state)

# on affiche le r√©sum√© de la fiche de poste
print(initial_state["job"]["job_summary"])


**R√©sum√© de la fiche de poste - Machine Learning Engineer**

Poste : Machine Learning Engineer en CDI, Paris (hybride). Exp√©rience requise : 3+ ans. Salaire : 55k - 75k ‚Ç¨. Startup innovante en IA et Data, d√©veloppant des solutions de Machine Learning et Deep Learning. Missions : concevoir et d√©ployer des mod√®les ML, optimiser pipelines de donn√©es, d√©velopper des API, et collaborer avec des √©quipes pluridisciplinaires. Comp√©tences requises : Python (TensorFlow, PyTorch), SQL, AWS, MLOps (MLflow, Kubeflow), et bonnes pratiques en ing√©nierie ML. Dipl√¥me en Informatique ou √©quivalent souhait√©. Environnement dynamique et projets innovants.


In [6]:
def summarize_profile(state: CVGenerationState) -> CVGenerationState:
    # R√©sumer chaque exp√©rience
    for experience in state["profile"]["experiences"]:
        response = llm.invoke(
            "Faites un r√©sum√© de cette exp√©rience en 50 mots maximum.\n\n" + 
            experience["description"]
        )
        experience["sumup"] = response.content.strip()
    
    # R√©sumer chaque formation
    for education in state["profile"]["education"]:
        response = llm.invoke(
            "Faites un r√©sum√© de cette formation en 50 mots maximum.\n\n" + 
            education["description"]
        )
        education["sumup"] = response.content.strip()
    
    return state

#tester la fonction sur initial_state
initial_state = summarize_profile(initial_state)

#afficher les r√©sum√©s
for experience in initial_state["profile"]["experiences"]:
    print("R√©sum√© de l'exp√©rience :", experience.get("sumup", "Pas de r√©sum√© disponible."))


R√©sum√© de l'exp√©rience : Mission chez Renault (FLMDH) visant √† moderniser et structurer les √©quipes de data engineering. Pilotage de projets essentiels pour soutenir la transition vers le leasing et les v√©hicules √©lectriques.
R√©sum√© de l'exp√©rience : D√©veloppement d'une application mobile innovante pour l'analyse automatique de tickets de caisse, incluant la d√©finition de l'architecture technique et l'impl√©mentation de solutions d'intelligence artificielle. Cette exp√©rience met en avant des comp√©tences en gestion de projet et en technologies avanc√©es.
R√©sum√© de l'exp√©rience : Gestion de projets strat√©giques visant √† moderniser l'entreprise par la digitalisation et l'optimisation des processus internes, notamment dans le domaine de la fabrication, pour am√©liorer l'efficacit√© et la performance globale.
R√©sum√© de l'exp√©rience : Participation √† des missions strat√©giques visant √† optimiser la supply chain en utilisant des approches quantitatives pour r√©soudre d

In [7]:
#afficher les r√©sum√©s des √©ducations
for education in initial_state["profile"]["education"]:
    print("R√©sum√© de l'√©ducation :", education.get("sumup", "Pas de r√©sum√© disponible."))


R√©sum√© de l'√©ducation : Cette formation de haut niveau allie des comp√©tences scientifiques et techniques, ax√©es sur la supply chain et le machine learning. Elle pr√©pare les participants √† relever des d√©fis complexes dans ces domaines, en leur fournissant des connaissances approfondies et des outils pratiques pour optimiser les processus et l'analyse de donn√©es.
R√©sum√© de l'√©ducation : Cette formation permet d'approfondir les connaissances en math√©matiques appliqu√©es, finance computationnelle, machine learning et gestion de la cha√Æne d'approvisionnement, offrant ainsi des comp√©tences essentielles pour analyser des donn√©es complexes et optimiser des processus dans divers secteurs.
R√©sum√© de l'√©ducation : Formation acad√©mique rigoureuse visant √† pr√©parer les √©tudiants aux concours des grandes √©coles d'ing√©nieurs, en d√©veloppant des comp√©tences techniques et scientifiques essentielles. Elle combine cours th√©oriques, travaux pratiques et entra√Ænements aux √©pre

In [8]:
def select_experiences(state: CVGenerationState) -> CVGenerationState:
    # Pr√©parer le contexte pour l'IA
    job_context = state["job"]["job_summary"]
    experiences_context = "\n".join([
        f"- {exp['titre_raw']} √† {exp['lieu_raw']} ({exp['dates_raw']}) chez {exp['entreprise_raw']}: {exp['sumup']}" 
        for exp in state["profile"]["experiences"]
    ])
    
    # Premier LLM pour s√©lectionner et pond√©rer les exp√©riences
    prompt = f"""
    En tant qu'expert RH, analysez les exp√©riences du candidat par rapport au poste.
    S√©lectionnez les exp√©riences les plus pertinentes et attribuez-leur un pourcentage d'importance (la somme doit faire 100%).
    R√©pondez sous forme de texte simple en listant les exp√©riences retenues avec leur pourcentage.
    
    Poste √† pourvoir:
    {job_context}
    
    Exp√©riences du candidat:
    {experiences_context}
    """
    
    selection_response = llm.invoke(prompt)
    selection_text = selection_response.content
    
    # Pour chaque exp√©rience, demander au second LLM d'extraire le poids
    for exp in state["profile"]["experiences"]:
        exp_prompt = f"""
        Voici la s√©lection d'exp√©riences pertinentes avec leurs pourcentages:
        {selection_text}
        
        Pour l'exp√©rience suivante, retournez uniquement le pourcentage attribu√© (juste le nombre), ou "null" si elle n'est pas mentionn√©e:
        {exp['titre_raw']} chez {exp['entreprise_raw']}
        """
        
        weight_response = llm.invoke(exp_prompt)
        try:
            weight = float(weight_response.content.strip())
            exp["poid"] = weight
        except ValueError:
            exp["poid"] = None
    
    return state

# Tester la fonction
initial_state = select_experiences(initial_state)

# Afficher les exp√©riences s√©lectionn√©es
print("\nExp√©riences s√©lectionn√©es et leur poids:")
for exp in initial_state["profile"]["experiences"]:
    weight = exp.get("poid")
    if weight is not None:
        print(f"- {exp['titre_raw']} chez {exp['entreprise_raw']}: {weight}%")
    else:
        print(f"- {exp['titre_raw']} chez {exp['entreprise_raw']}: Non retenue")



Exp√©riences s√©lectionn√©es et leur poids:
- Senior Data Scientist chez EY: 30.0%
- Co-fondateur et CTO chez Kadi: 25.0%
- Ing√©nieur en Transformation Digitale chez Blispac: 15.0%
- Consultant en Strat√©gie et Supply Chain chez Diagma: 10.0%
- Analyste de March√© chez Total: 10.0%
- Coordinateur de Projets chez L‚Äô≈íuvre d‚ÄôOrient: 5.0%
- Consultant junior chez Cdiscount: 5.0%


In [12]:
print("\n√âtat actuel:")
print(json.dumps(initial_state, indent=2, ensure_ascii=False))



√âtat actuel:
{
  "profile": {
    "head_raw": {
      "general_title": "Data Engineer / Data Scientist | Expert Cloud et Data. Alexis de Monts est un ing√©nieur des Ponts et Chauss√©es, sp√©cialis√© en Data Science, qui aide les entreprises √† transformer leurs donn√©es en valeur. Avec une expertise approfondie dans les domaines du Cloud (GCP, AWS), DevOps (CI/CD, Docker) et MLOps, il int√®gre des solutions d'intelligence artificielle et de machine learning dans des syst√®mes informatiques complexes. Son parcours professionnel est marqu√© par des r√©alisations significatives, telles que la cr√©ation d'un Data Hub centralis√© pour Renault et le d√©veloppement d'une application mobile innovante int√©grant une IA d'analyse.",
      "email": "alexis.demonts.s@gmail.com",
      "phone": "07 81 37 86 80",
      "name": "Alexis de Monts"
    },
    "skills_raw": {
      "description": "Alexis poss√®de un large √©ventail de comp√©tences techniques et manag√©riales. En tant que Senior Data Sc

In [10]:
def select_education(state):
    """
    S√©lectionne et pond√®re les formations pertinentes pour le poste.
    """
    # R√©cup√©rer le contexte
    job_context = state["job"]["job_summary"]
    education_context = "\n".join([f"{edu['titre_raw']} - {edu['etablissement_raw']} ({edu['dates_raw']}) {edu['lieu_raw']} {edu['sumup']}" 
                                 for edu in state["profile"]["education"]])
    
    # Cr√©er le prompt
    prompt = f"""
    En tant qu'expert RH, analysez les formations du candidat et s√©lectionnez celles qui sont les plus pertinentes 
    pour le poste √† pourvoir. Attribuez un pourcentage √† chaque formation selon sa pertinence.

    Formations du candidat:
    {education_context}

    Poste √† pourvoir:
    {job_context}
    """
    
    selection_response = llm.invoke(prompt)
    selection_text = selection_response.content
    
    # Pour chaque formation, demander au LLM d'extraire le poids
    for edu in state["profile"]["education"]:
        edu_prompt = f"""
        Voici la s√©lection de formations pertinentes avec leurs pourcentages:
        {selection_text}
        
        Pour la formation suivante, retournez uniquement le pourcentage attribu√© (juste le nombre), ou "null" si elle n'est pas mentionn√©e:
        {edu['titre_raw']} √† {edu['etablissement_raw']}
        """
        
        weight_response = llm.invoke(edu_prompt)
        try:
            weight = float(weight_response.content.strip())
            edu["poid"] = weight
        except ValueError:
            edu["poid"] = None
    
    return state

# Tester la fonction
initial_state = select_education(initial_state)

# Afficher les formations s√©lectionn√©es
print("\nFormations s√©lectionn√©es et leur poids:")
for edu in initial_state["profile"]["education"]:
    weight = edu.get("poid")
    if weight is not None:
        print(f"- {edu['titre_raw']} √† {edu['etablissement_raw']}: {weight}%")
    else:
        print(f"- {edu['titre_raw']} √† {edu['etablissement_raw']}: Non retenue")



Formations s√©lectionn√©es et leur poids:
- Dipl√¥me d‚Äôing√©nieur √† √âcole des Ponts ParisTech: 40.0%
- Master 2 en Mathematical Engineering √† Politecnico di Milano: 50.0%
- Classe pr√©paratoire scientifique √† Coll√®ge Stanislas Paris: 20.0%


In [11]:
def generate_experience_bullets(state):
    """
    G√©n√®re des bullet points pour chaque exp√©rience en fonction de leur poids
    """
    if "cv" not in state or "experiences_refined" not in state["cv"]:
        return state
    
    for exp in state["cv"]["experiences_refined"]:
        # Calculer le nombre de bullet points en fonction du weight
        nb_bullets = max(2, min(6, round(exp["weight"] / 20)))
        
        prompt = f"""
        En tant qu'expert RH, g√©n√©rez {nb_bullets} bullet points percutants qui mettent en valeur cette exp√©rience 
        professionnelle par rapport au poste vis√©.
        
        Chaque bullet point doit:
        - Commencer par un verbe d'action fort
        - √ätre concis et impactant
        - Mettre en avant les r√©alisations concr√®tes
        - √ätre adapt√© au poste vis√©
        
        R√©pondez au format JSON suivant:
        {{
            "bullet_points": [
                "Premier bullet point",
                "Deuxi√®me bullet point",
                etc.
            ]
        }}
        
        Poste vis√© (r√©sum√©):
        {state["job"]["job_summary"]}
        
        Exp√©rience √† d√©crire:
        {exp["description"]}
        """
        
        response = llm.invoke(input=prompt, response_format={"type": "json_object"})
        bullets = json.loads(response.content)
        
        # Ajouter les bullet points √† l'exp√©rience
        exp["bullet_points"] = bullets["bullet_points"]
    
    return state

# Tester la fonction
initial_state = generate_experience_bullets(initial_state)

# Afficher les bullet points g√©n√©r√©s
print("\nBullet points g√©n√©r√©s pour chaque exp√©rience:")
for exp in initial_state["cv"]["experiences_refined"]:
    print(f"\n{exp['poste']} chez {exp['entreprise']}:")
    for bullet in exp["bullet_points"]:
        print(f"‚Ä¢ {bullet}")



Bullet points g√©n√©r√©s pour chaque exp√©rience:


KeyError: 'cv'

In [None]:
def create_cv_generation_graph():
    # Cr√©ation du graph
    graph = StateGraph()
    
    # Ajout des nodes
    graph.add_node("summarize_job", summarize_job)
    graph.add_node("summarize_profile", summarize_profile)
    
    # Configuration du flux
    graph.set_entry_point("summarize_job")
    graph.add_edge("summarize_job", "summarize_profile")
    
    # Compiler le graph
    chain = graph.compile()
    return chain
