In [None]:
# %% [markdown]
# # üé§ Simulation d'Entretien avec Groq (Llama 3.3 70B)
# 
# **Objectif** : Tester la g√©n√©ration de questions et l'√©valuation des r√©ponses
# 
# **Pipeline** :
# 1. Charger un CV et une offre
# 2. G√©n√©rer des questions personnalis√©es
# 3. Simuler des r√©ponses
# 4. √âvaluer les r√©ponses
# 5. G√©n√©rer feedback global

In [1]:
# %%
import sys
sys.path.append('..')

import json
import os
from pathlib import Path
from src.interview_simulator import InterviewSimulator
from src.skills_extractor import SkillsExtractor
from src.cv_parser import CVParser

In [3]:
# %%
# CONFIGURATION : Cl√© API Groq
from dotenv import load_dotenv
import os

# Charger les variables depuis .env
load_dotenv()

# V√©rifier que la cl√© est charg√©e
if not os.getenv("GROQ_API_KEY"):
    raise ValueError(
        "‚ùå GROQ_API_KEY non trouv√©e !\n"
        "1. Cr√©ez un fichier .env √† la racine\n"
        "2. Ajoutez : GROQ_API_KEY=votre_cl√©\n"
        "3. Obtenez une cl√© sur : https://console.groq.com/"
    )

print(f"‚úÖ Cl√© API charg√©e : {os.getenv('GROQ_API_KEY')[:20]}...")

# %%
# 1. INITIALISATION
print("="*60)
print("üöÄ INITIALISATION")
print("="*60)

try:
    simulator = InterviewSimulator()
    skills_extractor = SkillsExtractor()
    print("‚úÖ Tous les modules charg√©s")
except ValueError as e:
    print(f"‚ùå {e}")
    print("\nüí° Obtenez une cl√© gratuite sur : https://console.groq.com/")
    raise

‚úÖ Cl√© API charg√©e : gsk_dQ0Dt8JrxyLkGtT2...
üöÄ INITIALISATION
‚úÖ InterviewSimulator initialis√© avec llama-3.3-70b-versatile
‚úÖ Mod√®le spaCy charg√©
‚úÖ Base de comp√©tences charg√©e
   ‚Ä¢ Techniques : 171
   ‚Ä¢ Soft skills : 39
‚úÖ Tous les modules charg√©s


In [4]:
# %%
# 2. CHARGER UN CV ET UNE OFFRE
print("\n" + "="*60)
print("üìÇ CHARGEMENT DES DONN√âES")
print("="*60)

# Charger le CV
cv_path = Path("../data/RESUME Robert UNG.pdf")

if not cv_path.exists():
    print(f"‚ö†Ô∏è  CV introuvable : {cv_path}")
    print("Utilisez votre propre CV pour tester")
    # Simuler des comp√©tences
    cv_skills = ["Python", "Machine Learning", "TensorFlow", "Docker", "FastAPI", "Git"]
else:
    parser = CVParser()
    cv_text = parser.parse(str(cv_path))
    skills_result = skills_extractor.extract_from_cv(cv_text)
    cv_skills = skills_result['technical_skills']

print(f"\n‚úÖ Comp√©tences CV : {', '.join(cv_skills[:10])}")

# Charger une offre
with open('../data/jobs/jobs_dataset.json', 'r', encoding='utf-8') as f:
    dataset = json.load(f)
    job = dataset['jobs'][0]  # ML Engineer Junior

print(f"\n‚úÖ Offre s√©lectionn√©e")
print(f"   Titre : {job['title']}")
print(f"   Entreprise : {job['company']}")
print(f"   Requirements : {', '.join(job['requirements'][:5])}...")


üìÇ CHARGEMENT DES DONN√âES

‚úÖ Comp√©tences CV : artificial intelligence, big data, c, data analysis, data science, deep learning, docker, excel, git, java

‚úÖ Offre s√©lectionn√©e
   Titre : Junior ML Engineer
   Entreprise : AI Startup Paris
   Requirements : Python (numpy, pandas, scikit-learn), Machine Learning basics (supervised learning), Git et GitHub, Docker (notions de base), Anglais technique (lecture documentation)...


In [5]:
# %%
# 3. G√âN√âRATION DES QUESTIONS
print("\n" + "="*60)
print("‚ùì G√âN√âRATION DES QUESTIONS")
print("="*60)

try:
    questions = simulator.generate_questions(
        cv_skills=cv_skills,
        job_title=job['title'],
        job_description=job['description'],
        job_requirements=job['requirements'],
        num_questions=8
    )
    
    print(f"\n‚úÖ {len(questions['rh_questions'])} questions RH g√©n√©r√©es")
    print(f"‚úÖ {len(questions['technical_questions'])} questions techniques g√©n√©r√©es")
    
except Exception as e:
    print(f"\n‚ùå ERREUR lors de la g√©n√©ration des questions:")
    print(f"   {type(e).__name__}: {e}")
    print("\nüí° Causes possibles:")
    print("   ‚Ä¢ Rate limiting Groq (429)")
    print("   ‚Ä¢ Cl√© API invalide")
    print("   ‚Ä¢ Probl√®me de connexion")
    raise

print(f"\nüìã QUESTIONS RH ({len(questions['rh_questions'])}):")
for q in questions['rh_questions']:
    print(f"\n{q['id']}. [{q['type']}]")
    print(f"   {q['question']}")

print(f"\nüîß QUESTIONS TECHNIQUES ({len(questions['technical_questions'])}):")
for q in questions['technical_questions']:
    skill = q.get('skill', 'N/A')
    print(f"\n{q['id']}. [{q['type']} - {skill}]")
    print(f"   {q['question']}")


‚ùì G√âN√âRATION DES QUESTIONS
‚úÖ 4 questions RH g√©n√©r√©es
‚úÖ 4 questions techniques g√©n√©r√©es

‚úÖ 4 questions RH g√©n√©r√©es
‚úÖ 4 questions techniques g√©n√©r√©es

üìã QUESTIONS RH (4):

1. [motivation]
   Quels sont vos objectifs de carri√®re √† court et √† long terme ?

2. [adaptabilit√©]
   Pouvez-vous me parler d'un moment o√π vous avez d√ª apprendre quelque chose de nouveau ?

3. [soft_skills]
   Comment g√©rez-vous les feedbacks ou les critiques constructives ?

4. [attentes]
   Qu'est-ce que vous attendez de notre √©quipe et de notre entreprise ?

üîß QUESTIONS TECHNIQUES (4):

5. [comp√©tence_technique - Pandas]
   Comment utilisez-vous les biblioth√®ques Pandas et NumPy pour l'analyse de donn√©es ?

6. [concept - Machine Learning]
   Expliquez les principes de base du Machine Learning et comment vous les appliquez

7. [outil - Docker]
   D√©crivez votre exp√©rience avec Docker et comment vous d√©ployez des applications

8. [comp√©tence_technique - Scikit-learn]
   

In [6]:
# %%
# 4. SIMULATION DE R√âPONSES
print("\n" + "="*60)
print("üí¨ SIMULATION DE R√âPONSES")
print("="*60)

# Exemples de r√©ponses (bonnes, moyennes, mauvaises)
simulated_answers = {
    1: """Je suis dipl√¥m√© d'un Master en IA et j'ai d√©velopp√© plusieurs projets en Machine Learning pendant mes stages. 
    J'ai notamment travaill√© sur un syst√®me de recommandation avec TensorFlow qui a am√©lior√© l'engagement de 15%. 
    Je suis passionn√© par l'apprentissage automatique et cherche √† approfondir mes comp√©tences en production de mod√®les ML.""",
    
    2: """Je souhaite rejoindre votre entreprise car vous √™tes leaders dans l'IA. J'ai suivi vos publications techniques 
    et je suis impressionn√© par vos innovations. Cette position me permettrait d'apprendre aupr√®s d'experts tout en 
    contribuant √† des projets impactants.""",
    
    5: """En Python, j'utilise pandas pour la manipulation de donn√©es. Pour nettoyer un dataset, je commence par 
    df.dropna() pour les valeurs manquantes, puis df.drop_duplicates(). J'utilise aussi df.describe() pour les statistiques 
    et df.groupby() pour les agr√©gations. Pour l'optimisation, je pr√©f√®re les op√©rations vectoris√©es aux boucles.""",
    
    6: """Pour une API REST, je structurerais avec FastAPI : des endpoints clairs (/users, /posts), 
    validation Pydantic, gestion d'erreurs avec HTTPException, et documentation auto Swagger. 
    J'ajouterais aussi du rate limiting et de l'authentification JWT."""
}

print("‚úÖ 4 r√©ponses simul√©es pr√™tes pour √©valuation")


üí¨ SIMULATION DE R√âPONSES
‚úÖ 4 r√©ponses simul√©es pr√™tes pour √©valuation


In [7]:
# %%
# 5. √âVALUATION DES R√âPONSES
print("\n" + "="*60)
print("üìä √âVALUATION DES R√âPONSES")
print("="*60)

evaluations = []

# √âvaluer les 4 premi√®res questions
test_questions = questions['rh_questions'][:2] + questions['technical_questions'][:2]

for question in test_questions:
    q_id = question['id']
    
    if q_id not in simulated_answers:
        continue
    
    print(f"\n{'='*60}")
    print(f"‚ùì Question {q_id}: {question['question'][:80]}...")
    print(f"\nüí¨ R√©ponse candidat:")
    print(f"{simulated_answers[q_id][:150]}...")
    
    # √âvaluer avec Groq
    evaluation = simulator.evaluate_answer(
        question=question['question'],
        answer=simulated_answers[q_id],
        question_type=question['type'],
        target_skill=question.get('skill')
    )
    
    evaluations.append(evaluation)
    
    print(f"\nüìà R√âSULTAT:")
    print(f"   Score: {evaluation['score']:.0f}/100")
    print(f"   √âvaluation: {evaluation['evaluation'][:200]}...")
    
    print(f"\n‚úÖ Points forts:")
    for point in evaluation['points_forts'][:3]:
        print(f"   ‚Ä¢ {point}")
    
    print(f"\n‚ö†Ô∏è  √Ä am√©liorer:")
    for point in evaluation['points_amelioration'][:3]:
        print(f"   ‚Ä¢ {point}")


üìä √âVALUATION DES R√âPONSES

‚ùì Question 1: Quels sont vos objectifs de carri√®re √† court et √† long terme ?...

üí¨ R√©ponse candidat:
Je suis dipl√¥m√© d'un Master en IA et j'ai d√©velopp√© plusieurs projets en Machine Learning pendant mes stages. 
    J'ai notamment travaill√© sur un sys...
‚úÖ R√©ponse √©valu√©e : 70/100

üìà R√âSULTAT:
   Score: 70/100
   √âvaluation: R√©ponse claire et structur√©e, mais manque de d√©tails sur les objectifs de carri√®re √† court et long terme. Le candidat d√©montre une bonne compr√©hension de ses comp√©tences techniques et une passion pour...

‚úÖ Points forts:
   ‚Ä¢ Exemples concrets mentionn√©s, notamment le syst√®me de recommandation avec TensorFlow
   ‚Ä¢ Bonne structure de r√©ponse, facile √† suivre
   ‚Ä¢ D√©montre une passion pour l'apprentissage automatique et une volont√© d'approfondir ses comp√©tences

‚ö†Ô∏è  √Ä am√©liorer:
   ‚Ä¢ Manque de d√©tails sur les objectifs de carri√®re √† court et long terme, notamment en termes de p

In [8]:
# %%
# 6. FEEDBACK GLOBAL
print("\n" + "="*60)
print("üéØ FEEDBACK GLOBAL")
print("="*60)

global_feedback = simulator.generate_final_feedback(
    evaluations=evaluations,
    job_title=job['title']
)

print(f"\nüìä Score global: {global_feedback['global_score']:.1f}/100")
print(f"üéØ D√©cision: {global_feedback['decision']}")

print(f"\nüìù Synth√®se:")
print(f"{global_feedback['synthese']}")

print(f"\n‚úÖ Comp√©tences valid√©es:")
for comp in global_feedback.get('competences_validees', [])[:5]:
    print(f"   ‚Ä¢ {comp}")

print(f"\nüìà Axes de progression:")
for axe in global_feedback.get('axes_progression', [])[:5]:
    print(f"   ‚Ä¢ {axe}")

print(f"\nüöÄ Prochaines √©tapes:")
for etape in global_feedback.get('prochaines_etapes', [])[:5]:
    print(f"   ‚Ä¢ {etape}")


üéØ FEEDBACK GLOBAL
‚úÖ Feedback global g√©n√©r√©

üìä Score global: 52.5/100
üéØ D√©cision: Prometteur

üìù Synth√®se:
Le candidat a montr√© un int√©r√™t certain pour l'entreprise et le domaine du Machine Learning, avec des points forts notables tels que l'autonomie dans l'utilisation des biblioth√®ques et la motivation pour apprendre. Cependant, il y a des aspects qui n√©cessitent une am√©lioration, notamment en termes de d√©tails techniques et de profondeur dans les r√©ponses. Le candidat a √©galement d√©montr√© une bonne structure de r√©ponse et une passion pour l'apprentissage automatique.

‚úÖ Comp√©tences valid√©es:
   ‚Ä¢ Int√©r√™t pour l'entreprise et son domaine d'expertise
   ‚Ä¢ Autonomie dans l'utilisation des biblioth√®ques
   ‚Ä¢ Motivation pour apprendre et contribuer

üìà Axes de progression:
   ‚Ä¢ Approfondir les aspects techniques des r√©ponses
   ‚Ä¢ D√©velopper les comp√©tences non techniques telles que la communication et la gestion d'√©quipe
   ‚Ä¢ Fournir

In [None]:
# %% [markdown]
# ## ‚úÖ R√©sum√©
# 
# - ‚úÖ **Groq (Llama 3.3 70B)** : G√©n√©ration de questions ultra-rapide
# - ‚úÖ **Questions personnalis√©es** : Bas√©es sur CV + offre
# - ‚úÖ **√âvaluation automatique** : Scoring 0-100 avec feedback
# - ‚úÖ **Feedback global** : Synth√®se + recommandations
# 
# **Prochaine √©tape** : Int√©grer dans l'API et Streamlit