In [1]:
from typing import TypedDict, List, Optional
from langgraph.graph import StateGraph
from openai import OpenAI
from langchain_community.chat_models import ChatOpenAI

# D√©finition de l'√©tat
class CVGenerationState(TypedDict):
    profile: dict             # Donn√©es du profil
    job: dict                # Donn√©es sur le job
    current_step: str
    error: Optional[str]

# Exemple de structure pour les donn√©es
# profile = {
#     "head_raw": dict,           # Informations de l'en-t√™te
#     "skills_raw": dict,         # Comp√©tences
#     "experiences": List[dict],  # Liste d'exp√©riences
#     "education": List[dict],    # Liste de formations
#     "hobbies_raw": dict         # Loisirs
# }
# job = {
#     "job_posting": str,     # Fiche de poste
#     "job_summary": Optional[str] # R√©sum√© de la fiche de poste
# }

# Structure pour une exp√©rience dans profile["experiences"]
# experience = {
#     "titre_raw": str,
#     "titre_refined": str,
#     "dates_raw": str,
#     "dates_refined": str,
#     "entreprise_raw": str,
#     "entreprise_refined": str,
#     "lieu_raw": str,
#     "lieu_refined": str,
#     "description": str,         # Description brute
#     "sumup": str,              # R√©sum√©
#     "bullets_points": List[str], # Points cl√©s
#     "poid": float              # Poids en %
# }

# Structure pour une formation dans profile["education"]
# education = {
#     "titre_raw": str,
#     "titre_refined": str,
#     "dates_raw": str,
#     "dates_refined": str,
#     "etablissement_raw": str,
#     "etablissement_refined": str,
#     "lieu_raw": str,
#     "lieu_refined": str,
#     "description": str,         # Description brute
#     "description_refined": str, # Description raffin√©e
#     "sumup": str,              # R√©sum√©
#     "poid": float              # Poids en %
# }


In [2]:
# D√©finition du mod√®le de langage
llm = ChatOpenAI(
    model="gpt-4o-mini",
    temperature=0,
)

# Test du mod√®le
test_response = llm.invoke("Dis bonjour en fran√ßais")
print("Test de r√©ponse du mod√®le:")
print(test_response.content)


  llm = ChatOpenAI(


Test de r√©ponse du mod√®le:
Bonjour !


In [3]:
import json

# Chargement des donn√©es de test depuis le fichier JSON
with open('data_test.json', 'r', encoding='utf-8') as json_file:
    test_data = json.load(json_file)

# Chargement de la fiche de poste depuis le fichier texte
with open('fiche_poste.txt', 'r', encoding='utf-8') as text_file:
    job_posting = text_file.read()

# Initialisation de l'√©tat avec les donn√©es de test et la fiche de poste
initial_state = {
    "profile": {
        "head_raw": test_data["cv_data"]["head"],
        "skills_raw": test_data["cv_data"]["skills"],
        "experiences": [
            {
                "titre_raw": exp["intitule"],
                "titre_refined": None,
                "dates_raw": exp["dates"],
                "dates_refined": None,
                "entreprise_raw": exp["etablissement"],
                "entreprise_refined": None,
                "lieu_raw": exp["lieu"],
                "lieu_refined": None,
                "description": exp["description"],
                "sumup": None,
                "bullets_points": [],
                "poid": None
            }
            for exp in test_data["cv_data"]["experiences"]["experiences"]
        ],
        "education": [
            {
                "titre_raw": edu["intitule"],
                "titre_refined": None,
                "dates_raw": edu["dates"],
                "dates_refined": None,
                "etablissement_raw": edu["etablissement"],
                "etablissement_refined": None,
                "lieu_raw": edu["lieu"],
                "lieu_refined": None,
                "description_raw": edu["description"],
                "description_refined": None,
                "sumup": None,
                "poid": None
            }
            for edu in test_data["cv_data"]["education"]["educations"]
        ],
        "hobbies_raw": test_data["cv_data"]["hobbies"]
    },
    "job": {
        "job_posting": job_posting,
        "job_summary": None
    }
}

In [4]:
# Nodes (fonctions de transformation)
def summarize_job(state: CVGenerationState) -> CVGenerationState:
    response = llm.invoke(
        "Faites un r√©sum√© de cette fiche de poste en 100 mots maximum, en incluant les informations principales pour r√©diger un CV.\n\n" + 
        state["job"]["job_posting"]
    )
    state["job"]["job_summary"] = response.content.strip()
    return state


In [5]:
initial_state = summarize_job(initial_state)

# on affiche le r√©sum√© de la fiche de poste
print(initial_state["job"]["job_summary"])


**R√©sum√© de la fiche de poste - Machine Learning Engineer**

Poste : Machine Learning Engineer en CDI, Paris (hybride). Exp√©rience requise : 3+ ans. Salaire : 55k - 75k ‚Ç¨. Startup innovante en IA, sp√©cialis√©e dans le Machine Learning et Deep Learning. Missions : concevoir et d√©ployer des mod√®les ML, optimiser pipelines de donn√©es, d√©velopper des API, et collaborer avec des √©quipes pluridisciplinaires. Comp√©tences requises : ma√Ætrise de Python (TensorFlow, PyTorch), SQL, AWS, GCP, MLOps (MLflow, Kubeflow), et d√©veloppement (FastAPI, Flask). Dipl√¥me en Informatique ou √©quivalent souhait√©. Environnement dynamique et projets innovants. Postuler √† recrutement@startupAI.com.


In [6]:
def summarize_profile(state: CVGenerationState) -> CVGenerationState:
    # R√©sumer chaque exp√©rience
    for experience in state["profile"]["experiences"]:
        response = llm.invoke(
            "Faites un r√©sum√© de cette exp√©rience en 50 mots maximum.\n\n" + 
            experience["description"]
        )
        experience["sumup"] = response.content.strip()
    
    # R√©sumer chaque formation
    for education in state["profile"]["education"]:
        response = llm.invoke(
            "Faites un r√©sum√© de cette formation en 50 mots maximum.\n\n" + 
            education["description_raw"]
        )
        education["sumup"] = response.content.strip()
    
    return state

#tester la fonction sur initial_state
initial_state = summarize_profile(initial_state)

#afficher les r√©sum√©s
for experience in initial_state["profile"]["experiences"]:
    print("R√©sum√© de l'exp√©rience :", experience.get("sumup", "Pas de r√©sum√© disponible."))


R√©sum√© de l'exp√©rience : Lors de ma mission chez Renault, j'ai modernis√© les √©quipes de data engineering, pilot√© la transition vers dbt sur Cloud Run, et introduit des pratiques DevOps. J'ai √©galement d√©velopp√© des outils pour faciliter l'acc√®s aux donn√©es et cr√©√© des mod√®les de Machine Learning pour estimer les valeurs r√©siduelles des v√©hicules.
R√©sum√© de l'exp√©rience : En tant que co-fondateur et CTO de Kadi, j'ai dirig√© le d√©veloppement d'une application mobile innovante pour l'analyse automatique de tickets de caisse, int√©grant IA et cloud. J'ai supervis√© l'architecture technique, le d√©ploiement sur les stores, et optimis√© des pipelines de donn√©es, garantissant une exp√©rience utilisateur fluide.
R√©sum√© de l'exp√©rience : Dans une entreprise familiale de proth√®ses m√©dicales, j'ai modernis√© les processus internes par la digitalisation des bases de donn√©es, l'optimisation de la fabrication via un algorithme g√©n√©tique, et l'automatisation des tests. C

In [7]:
#afficher les r√©sum√©s des √©ducations
for education in initial_state["profile"]["education"]:
    print("R√©sum√© de l'√©ducation :", education.get("sumup", "Pas de r√©sum√© disponible."))


R√©sum√© de l'√©ducation : √Ä l‚Äô√âcole des Ponts ParisTech, j'ai acquis une formation scientifique et technique de haut niveau, incluant un tronc commun en math√©matiques, physique, informatique et sciences de l‚Äôing√©nieur, suivi d'une sp√©cialisation en supply chain et machine learning durant les deux derni√®res ann√©es.
R√©sum√© de l'√©ducation : Cette ann√©e de sp√©cialisation en ing√©nierie math√©matique a permis d'approfondir les math√©matiques appliqu√©es, la finance computationnelle, le machine learning et la gestion de la cha√Æne d'approvisionnement, tout en apprenant l'italien. Les cours principaux incluent la finance computationnelle et le machine learning, avec un accent sur les m√©thodes quantitatives et les algorithmes.
R√©sum√© de l'√©ducation : J'ai suivi une formation acad√©mique rigoureuse en classes pr√©paratoires pendant deux ans, ax√©e sur la pr√©paration aux concours des grandes √©coles d'ing√©nieurs, d√©veloppant ainsi mes comp√©tences en sciences et en math√©

In [8]:
def select_experiences(state: CVGenerationState) -> CVGenerationState:
    # Pr√©parer le contexte pour l'IA
    job_context = state["job"]["job_summary"]
    experiences_context = "\n".join([
        f"- {exp['titre_raw']} √† {exp['lieu_raw']} ({exp['dates_raw']}) chez {exp['entreprise_raw']}: {exp['sumup']}" 
        for exp in state["profile"]["experiences"]
    ])
    
    # Premier LLM pour s√©lectionner et pond√©rer les exp√©riences
    prompt = f"""
    En tant qu'expert RH, analysez les exp√©riences du candidat par rapport au poste.
    S√©lectionnez les exp√©riences les plus pertinentes et attribuez-leur un pourcentage d'importance (la somme doit faire 100%).
    R√©pondez sous forme de texte simple en listant les exp√©riences retenues avec leur pourcentage.
    
    Poste √† pourvoir:
    {job_context}
    
    Exp√©riences du candidat:
    {experiences_context}
    """
    
    selection_response = llm.invoke(prompt)
    selection_text = selection_response.content
    
    # Pour chaque exp√©rience, demander au second LLM d'extraire le poids
    for exp in state["profile"]["experiences"]:
        exp_prompt = f"""
        Voici la s√©lection d'exp√©riences pertinentes avec leurs pourcentages:
        {selection_text}
        
        Pour l'exp√©rience suivante, retournez uniquement le pourcentage attribu√© (juste le nombre), ou "null" si elle n'est pas mentionn√©e:
        {exp['titre_raw']} chez {exp['entreprise_raw']}
        """
        
        weight_response = llm.invoke(exp_prompt)
        try:
            weight = float(weight_response.content.strip())
            exp["poid"] = weight
        except ValueError:
            exp["poid"] = None
    
    return state

# Tester la fonction
initial_state = select_experiences(initial_state)

# Afficher les exp√©riences s√©lectionn√©es
print("\nExp√©riences s√©lectionn√©es et leur poids:")
for exp in initial_state["profile"]["experiences"]:
    weight = exp.get("poid")
    if weight is not None:
        print(f"- {exp['titre_raw']} chez {exp['entreprise_raw']}: {weight}%")
    else:
        print(f"- {exp['titre_raw']} chez {exp['entreprise_raw']}: Non retenue")



Exp√©riences s√©lectionn√©es et leur poids:
- Senior Data Scientist chez EY: 40.0%
- Co-fondateur et CTO chez Kadi: 30.0%
- Ing√©nieur en Transformation Digitale chez Blispac: 15.0%
- Consultant en Strat√©gie et Supply Chain chez Diagma: Non retenue
- Analyste de March√© chez Total: 10.0%
- Coordinateur de Projets chez L‚Äô≈íuvre d‚ÄôOrient: Non retenue
- Consultant junior chez Cdiscount: 5.0%


In [9]:
def select_education(state):
    """
    S√©lectionne et pond√®re les formations pertinentes pour le poste.
    """
    # R√©cup√©rer le contexte
    job_context = state["job"]["job_summary"]
    education_context = "\n".join([f"{edu['titre_raw']} - {edu['etablissement_raw']} ({edu['dates_raw']}) {edu['lieu_raw']} {edu['sumup']}" 
                                 for edu in state["profile"]["education"]])
    
    # Cr√©er le prompt
    prompt = f"""
    En tant qu'expert RH, analysez les formations du candidat et s√©lectionnez celles qui sont les plus pertinentes 
    pour le poste √† pourvoir. Attribuez un pourcentage √† chaque formation selon sa pertinence.

    Formations du candidat:
    {education_context}

    Poste √† pourvoir:
    {job_context}
    """
    
    selection_response = llm.invoke(prompt)
    selection_text = selection_response.content
    
    # Pour chaque formation, demander au LLM d'extraire le poids
    for edu in state["profile"]["education"]:
        edu_prompt = f"""
        Voici la s√©lection de formations pertinentes avec leurs pourcentages:
        {selection_text}
        
        Pour la formation suivante, retournez uniquement le pourcentage attribu√© (juste le nombre), ou "null" si elle n'est pas mentionn√©e:
        {edu['titre_raw']} √† {edu['etablissement_raw']}
        """
        
        weight_response = llm.invoke(edu_prompt)
        try:
            weight = float(weight_response.content.strip())
            edu["poid"] = weight
        except ValueError:
            edu["poid"] = None
    
    return state

# Tester la fonction
initial_state = select_education(initial_state)

# Afficher les formations s√©lectionn√©es
print("\nFormations s√©lectionn√©es et leur poids:")
for edu in initial_state["profile"]["education"]:
    weight = edu.get("poid")
    if weight is not None:
        print(f"- {edu['titre_raw']} √† {edu['etablissement_raw']}: {weight}%")
    else:
        print(f"- {edu['titre_raw']} √† {edu['etablissement_raw']}: Non retenue")



Formations s√©lectionn√©es et leur poids:
- Dipl√¥me d‚Äôing√©nieur √† √âcole des Ponts ParisTech: 40.0%
- Master 2 en Mathematical Engineering √† Politecnico di Milano: 45.0%
- Classe pr√©paratoire scientifique √† Coll√®ge Stanislas Paris: 15.0%


In [10]:
def adjust_weights(state, threshold=10):
    """
    Ajuste les poids des exp√©riences et formations :
    - Met √† 0 les poids inf√©rieurs ou √©gaux au seuil 
    - R√©√©quilibre les poids restants pour garder une somme de 100%
    """
    # Ajuster les poids des exp√©riences
    if "profile" in state and "experiences" in state["profile"]:
        # Mettre 0 pour les poids None ou non num√©riques
        for exp in state["profile"]["experiences"]:
            try:
                if exp.get("poid") is None or not isinstance(exp.get("poid"), (int, float)):
                    exp["poid"] = 0
            except:
                exp["poid"] = 0

        exp_weights = [exp["poid"] for exp in state["profile"]["experiences"]]
        total_weight = sum(w for w in exp_weights if w > threshold)
        
        if total_weight > 0:
            for exp in state["profile"]["experiences"]:
                if exp["poid"] <= threshold:
                    exp["poid"] = 0
                else:
                    exp["poid"] = round((exp["poid"] / total_weight) * 100)

    # Ajuster les poids des formations
    if "profile" in state and "education" in state["profile"]:
        # Mettre 0 pour les poids None ou non num√©riques
        for edu in state["profile"]["education"]:
            try:
                if edu.get("poid") is None or not isinstance(edu.get("poid"), (int, float)):
                    edu["poid"] = 0
            except:
                edu["poid"] = 0

        edu_weights = [edu["poid"] for edu in state["profile"]["education"]]
        total_weight = sum(w for w in edu_weights if w > threshold)
        
        if total_weight > 0:
            for edu in state["profile"]["education"]:
                if edu["poid"] <= threshold:
                    edu["poid"] = 0
                else:
                    edu["poid"] = round((edu["poid"] / total_weight) * 100)
    
    return state

# Tester la fonction
initial_state = adjust_weights(initial_state)


In [11]:
def generate_experience_bullets(state):
    """
    G√©n√®re des bullet points pour chaque exp√©rience en fonction de leur poids
    """
    if "profile" not in state or "experiences" not in state["profile"]:
        return state
    
    for exp in state["profile"]["experiences"]:
        # V√©rifier que poid existe et n'est pas None avant de l'utiliser
        if not exp.get("poid"):
            continue
            
        # Calculer le nombre de bullet points en fonction du poids
        nb_bullets = max(2, min(6, round(exp["poid"] / 20)))
        
        prompt = f"""
        En tant qu'expert RH, g√©n√©rez {nb_bullets} bullet points percutants qui mettent en valeur cette exp√©rience 
        professionnelle par rapport au poste vis√©.
        
        Chaque bullet point doit:
        - Commencer par un verbe d'action fort
        - √ätre concis et impactant
        - Mettre en avant les r√©alisations concr√®tes
        - √ätre adapt√© au poste vis√©
        
        R√©pondez au format JSON suivant:
        {{
            "bullet_points": [
                "Premier bullet point",
                "Deuxi√®me bullet point",
                etc.
            ]
        }}
        
        Poste vis√© (r√©sum√©):
        {state["job"]["job_summary"]}
        
        Exp√©rience √† d√©crire:
        {exp["description"]}
        """
        
        response = llm.invoke(input=prompt, response_format={"type": "json_object"})
        bullets = json.loads(response.content)
        
        # Ajouter les bullet points √† l'exp√©rience
        exp["bullets_points"] = bullets["bullet_points"]
    
    return state

# Tester la fonction
initial_state = generate_experience_bullets(initial_state)

# Afficher les bullet points g√©n√©r√©s
print("\nBullet points g√©n√©r√©s pour chaque exp√©rience:")
for exp in initial_state["profile"]["experiences"]:
    if exp.get("poid", 0) > 0:
        print(f"\n{exp['titre_refined']} chez {exp['entreprise_refined']}:")
        for bullet in exp["bullets_points"]:
            print(f"‚Ä¢ {bullet}")



Bullet points g√©n√©r√©s pour chaque exp√©rience:

None chez None:
‚Ä¢ Optimis√© les pipelines de donn√©es en concevant et d√©ployant une solution dbt sur Cloud Run, am√©liorant la qualit√© et la rapidit√© des processus de transformation des donn√©es, approuv√©e par la direction technique.
‚Ä¢ Dirig√© une √©quipe de 5 data engineers pour moderniser les pratiques de data engineering, int√©grant des m√©thodologies agiles et des outils modernes, ce qui a permis une adoption g√©n√©ralis√©e de dbt comme standard au sein de Renault.

None chez None:
‚Ä¢ Con√ßu et d√©ploy√© une application mobile innovante sur GCP, int√©grant des mod√®les de Machine Learning pour l'analyse automatique de tickets de caisse, valid√©e par des utilisateurs sur les principales plateformes mobiles.
‚Ä¢ Optimis√© des pipelines de donn√©es √©volutifs en int√©grant des pratiques MLOps, garantissant la scalabilit√© et la haute disponibilit√© des services, tout en am√©liorant la performance des mod√®les de d√©tection d

In [12]:
def generate_education_description(state):
    """
    G√©n√®re une description raffin√©e pour chaque formation en fonction de leur poids
    """
    if "profile" not in state or "education" not in state["profile"]:
        return state
    
    for edu in state["profile"]["education"]:
        if edu.get("poid", 0) == 0:
            continue
            
        # Adapter la longueur de la description en fonction du poids
        nb_mots = max(15, min(50, round(edu["poid"] / 10)))
        
        prompt = f"""
        En tant qu'expert RH, g√©n√©rez une description percutante de cette formation
        qui met en valeur sa pertinence par rapport au poste vis√©.
        
        La description doit:
        - √ätre concise (environ {nb_mots} mots)
        - Mettre en avant les comp√©tences acquises
        - Souligner les r√©alisations acad√©miques importantes
        - √ätre adapt√©e au poste vis√©
        
        Poste vis√© (r√©sum√©):
        {state["job"]["job_summary"]}
        
        Formation √† d√©crire:
        {edu["description_raw"]}
        """
        
        response = llm.invoke(input=prompt)
        
        # Ajouter la description raffin√©e √† la formation
        edu["description_refined"] = response.content
    
    return state

# Tester la fonction
initial_state = generate_education_description(initial_state)

# Afficher les descriptions g√©n√©r√©es
print("\nDescriptions raffin√©es pour chaque formation:")
for edu in initial_state["profile"]["education"]:
    if edu.get("poid", 0) > 0:
        print(f"\n{edu['titre_raw']} - {edu['etablissement_raw']}:")
        print(edu["description_refined"])



Descriptions raffin√©es pour chaque formation:

Dipl√¥me d‚Äôing√©nieur - √âcole des Ponts ParisTech:
Formation √† l‚Äô√âcole des Ponts ParisTech : expertise en machine learning, optimisation de donn√©es et mod√©lisation avanc√©e.

Master 2 en Mathematical Engineering - Politecnico di Milano:
Formation en ing√©nierie math√©matique : comp√©tences avanc√©es en machine learning et finance computationnelle, essentielles pour le poste.

Classe pr√©paratoire scientifique - Coll√®ge Stanislas Paris:
Formation rigoureuse en classes pr√©paratoires, d√©veloppant comp√©tences analytiques et techniques essentielles pour le Machine Learning.


In [13]:
print("\n√âtat actuel:")
print(json.dumps(initial_state, indent=2, ensure_ascii=False))



√âtat actuel:
{
  "profile": {
    "head_raw": {
      "general_title": "Data Engineer / Data Scientist | Expert Cloud et Data. Alexis de Monts est un ing√©nieur des Ponts et Chauss√©es, sp√©cialis√© dans la transformation num√©rique des entreprises gr√¢ce √† ses comp√©tences en Data Science. Avec une formation scientifique g√©n√©raliste et une sp√©cialisation en Data Science au Politecnico di Milano, il se concentre sur l'int√©gration de solutions Cloud et d'algorithmes de Machine Learning dans des syst√®mes informatiques complexes. Son exp√©rience inclut la cr√©ation d'un Data Hub pour Renault et le d√©veloppement d'applications mobiles innovantes.",
      "email": "alexis.demonts.s@gmail.com",
      "phone": "07 81 37 86 80",
      "name": "Alexis de Monts"
    },
    "skills_raw": {
      "description": "Alexis poss√®de une expertise approfondie dans plusieurs domaines cl√©s. En tant que Data Engineer et Data Scientist, il ma√Ætrise les technologies Cloud, notamment Google Cloud P