# üîÑ Modification des Sources de Candidatures

Ce notebook permet de modifier les sources des candidatures dans l'API.

## üéØ Objectif

Ce notebook permet de :
- R√©cup√©rer toutes les candidatures depuis l'API
- Analyser les diff√©rentes sources existantes
- Modifier les sources des candidatures selon vos crit√®res
- Sauvegarder les donn√©es avant et apr√®s modification

---

## üìã Guide d'utilisation sur Google Colab

### √âtape 1 : Ouvrir le notebook sur Google Colab

1. Allez sur [Google Colab](https://colab.research.google.com/)
2. T√©l√©versez ce fichier `.ipynb` dans Colab
3. Le notebook s'ouvrira automatiquement

### √âtape 2 : Configurer les param√®tres

1. Ex√©cutez la cellule de **configuration** (√âtape 3)
2. V√©rifiez que l'API URL et la cl√© API sont correctes
3. D√©finissez quelle source vous voulez changer

### √âtape 3 : Ex√©cuter toutes les cellules

**M√©thode rapide :**
- Menu **"Runtime"** ‚Üí **"Run all"** (Ex√©cuter tout)

**M√©thode manuelle :**
- Ex√©cutez chaque cellule dans l'ordre (Shift + Entr√©e)

### √âtape 4 : V√©rifier les r√©sultats

Les fichiers CSV seront g√©n√©r√©s dans le panneau de fichiers √† gauche.

---

## ‚ö†Ô∏è Attention

**Ce notebook modifie les donn√©es dans l'API !**

- Assurez-vous d'avoir sauvegard√© les donn√©es avant de modifier
- V√©rifiez bien les param√®tres de configuration
- Testez d'abord sur un petit √©chantillon si possible

## üíæ Syst√®me de Backup et Restauration

**‚úÖ Backup automatique :**
- Un backup complet est cr√©√© automatiquement avant toute modification
- Un fichier de mapping (ID ‚Üí source originale) est g√©n√©r√© pour faciliter la restauration
- Tous les fichiers sont sauvegard√©s avec un timestamp pour √©viter les √©crasements

**üîÑ Restauration possible :**
- Si le frontend ne peut pas afficher la nouvelle source "cibli", vous pouvez restaurer
- Une section compl√®te de restauration est disponible √† la fin du notebook
- La restauration remet toutes les sources √† leur valeur d'origine exacte

**üìÅ Fichiers de backup importants :**
- `all_applications_backup_YYYYMMDD_HHMMSS.csv` - Backup complet
- `restore_mapping_YYYYMMDD_HHMMSS.csv` - Mapping pour restauration (‚ö†Ô∏è GARDEZ-LE !)

---

**Pr√™t √† commencer ? Configurez d'abord les param√®tres ci-dessous ! üëá**


## üì¶ √âtape 1 : Installation des biblioth√®ques n√©cessaires

Cette cellule installe tous les outils n√©cessaires.

**‚ö†Ô∏è Important :** Ex√©cutez cette cellule en premier !

**Temps estim√© :** 10-30 secondes


In [1]:
%pip install pandas requests


Note: you may need to restart the kernel to use updated packages.


## üìö √âtape 2 : Importation des biblioth√®ques

Cette cellule charge les outils Python n√©cessaires.

**Aucune action requise** - Ex√©cutez simplement la cellule.


In [2]:
import requests
import pandas as pd
import json
import warnings
import os
from datetime import datetime

warnings.filterwarnings('ignore')


## ‚öôÔ∏è √âtape 3 : Configuration

**‚ö†Ô∏è IMPORTANT :** Modifiez ces param√®tres selon vos besoins !

- `API_URL` : L'URL de base de l'API
- `API_KEY` : Votre cl√© API (x-api-key)
- `SOURCE_TO_KEEP` : La source √† conserver (ne sera pas modifi√©e)
- `NEW_SOURCE` : La nouvelle source √† attribuer aux autres candidatures

**Exemple :** Si vous voulez garder "cabine cibli job" et changer toutes les autres en "cibli" :
- `SOURCE_TO_KEEP = "cabine cibli job"`
- `NEW_SOURCE = "cibli"`


In [6]:
# Configuration de l'API
API_URL = "https://api.smart-process-rh.com/v1"
API_KEY = "9TTaz70w8biMjvJ9Q5eIHZwVlQRNmjqAqiNzyGjfeI1S4nubpkSAL1h87FoNrlMv"

# Configuration des sources
SOURCE_TO_KEEP = "cabine cibli job"  # Cette source ne sera PAS modifi√©e
NEW_SOURCE = "cibli"  # Toutes les autres sources seront chang√©es en ceci

# Endpoint pour r√©cup√©rer toutes les candidatures
APPLICATIONS_ENDPOINT = f"{API_URL}/applications/all"

print("‚úÖ Configuration charg√©e :")
print(f"   API URL: {API_URL}")
print(f"   Source √† conserver: '{SOURCE_TO_KEEP}'")
print(f"   Nouvelle source: '{NEW_SOURCE}'")


‚úÖ Configuration charg√©e :
   API URL: https://api.smart-process-rh.com/v1
   Source √† conserver: 'cabine cibli job'
   Nouvelle source: 'cibli'


## üì• √âtape 4 : T√©l√©chargement de toutes les candidatures

Cette cellule :
- R√©cup√®re toutes les candidatures depuis l'API
- Sauvegarde les donn√©es brutes dans un fichier CSV
- Affiche un r√©sum√© des donn√©es r√©cup√©r√©es

**Temps estim√© :** 10-30 secondes selon le nombre de candidatures

**R√©sultat attendu :** Un message `<Response [200]>` si tout fonctionne correctement.


In [7]:
# R√©cup√©ration de toutes les candidatures
print("üì• R√©cup√©ration des candidatures depuis l'API...")

response = requests.get(
    APPLICATIONS_ENDPOINT,
    headers={"x-api-key": API_KEY}
)

print(f"R√©ponse API: {response}")

if response.status_code == 200:
    applications_data = response.json()
    applications_df = pd.DataFrame(applications_data)
    
    # Cr√©er le dossier si n√©cessaire
    if not os.path.exists('applications'):
        os.makedirs('applications')
    
    # Sauvegarder avec timestamp pour √©viter d'√©craser les anciennes donn√©es
    timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
    backup_filename = f'applications/all_applications_backup_{timestamp}.csv'
    applications_df.to_csv(backup_filename, index=False)
    
    # Cr√©er un mapping de restauration (ID -> source originale) pour faciliter la restauration
    if 'id' in applications_df.columns and 'source' in applications_df.columns:
        restore_mapping = applications_df[['id', 'source']].copy()
        restore_mapping.columns = ['application_id', 'original_source']
        restore_mapping_filename = f'applications/restore_mapping_{timestamp}.csv'
        restore_mapping.to_csv(restore_mapping_filename, index=False)
        print(f"\n‚úÖ Mapping de restauration sauvegard√© dans: {restore_mapping_filename}")
        print(f"   Ce fichier permet de restaurer toutes les sources originales facilement")
    
    print(f"\n‚úÖ {len(applications_df)} candidatures r√©cup√©r√©es")
    print(f"‚úÖ Backup complet sauvegard√© dans: {backup_filename}")
    print(f"\n‚ö†Ô∏è IMPORTANT: Gardez ce fichier de backup pour pouvoir restaurer si n√©cessaire !")
    print(f"\nüìä Aper√ßu des donn√©es:")
    print(applications_df.head())
    
    # Stocker le nom du fichier de mapping pour la restauration
    RESTORE_MAPPING_FILE = restore_mapping_filename if 'restore_mapping_filename' in locals() else None
    
else:
    print(f"‚ùå Erreur lors de la r√©cup√©ration: {response.status_code}")
    print(f"Message: {response.text}")
    applications_df = None
    RESTORE_MAPPING_FILE = None


üì• R√©cup√©ration des candidatures depuis l'API...
R√©ponse API: <Response [200]>

‚úÖ Mapping de restauration sauvegard√© dans: applications/restore_mapping_20251215_210249.csv
   Ce fichier permet de restaurer toutes les sources originales facilement

‚úÖ 5245 candidatures r√©cup√©r√©es
‚úÖ Backup complet sauvegard√© dans: applications/all_applications_backup_20251215_210249.csv

‚ö†Ô∏è IMPORTANT: Gardez ce fichier de backup pour pouvoir restaurer si n√©cessaire !

üìä Aper√ßu des donn√©es:
    id  status recordingUrl notes  tags                  slug     source  \
0   34  denied         None  None  [[]]  zCEueXCowngAtSZ9zJ0s  hellowork   
1   36     new         None  None    []  uQz6CnEvs0EWATAnmbum  hellowork   
2   53  denied         None  None    []  v9UWAGUjEdEx8rG53GxN  hellowork   
3   68     new         None  None    []  x7ffzApszM1IFRWxw4TU  hellowork   
4  223     new         None  None    []  MJEdSStQ1sKIgXhx7Msu  hellowork   

     campaign    applicant           cv   

## üìä √âtape 5 : Analyse des sources existantes

Cette cellule analyse toutes les sources diff√©rentes pr√©sentes dans les candidatures.

**R√©sultat :** Un tableau montrant :
- Toutes les sources uniques
- Le nombre de candidatures pour chaque source
- Quelles sources seront modifi√©es


In [8]:
if applications_df is not None and 'source' in applications_df.columns:
    print("üìä Analyse des sources existantes:\n")
    print("=" * 60)
    
    # Compter les sources
    source_counts = applications_df['source'].value_counts().sort_index()
    
    print(f"\nNombre total de sources diff√©rentes: {len(source_counts)}")
    print(f"\nR√©partition par source:")
    print("-" * 60)
    
    for source, count in source_counts.items():
        status = "‚úÖ CONSERV√âE" if source == SOURCE_TO_KEEP else "üîÑ SERA MODIFI√âE"
        print(f"{source:<30} : {count:>6} candidatures  {status}")
    
    # Calculer combien seront modifi√©es
    total_to_modify = len(applications_df[applications_df['source'] != SOURCE_TO_KEEP])
    total_to_keep = len(applications_df[applications_df['source'] == SOURCE_TO_KEEP])
    
    print("\n" + "=" * 60)
    print(f"\nüìà R√©sum√©:")
    print(f"   Total candidatures: {len(applications_df)}")
    print(f"   √Ä conserver ('{SOURCE_TO_KEEP}'): {total_to_keep}")
    print(f"   √Ä modifier ‚Üí '{NEW_SOURCE}': {total_to_modify}")
    print("\n" + "=" * 60)
    
    # Sauvegarder l'analyse
    source_analysis = pd.DataFrame({
        'source': source_counts.index,
        'count': source_counts.values,
        'will_be_modified': source_counts.index != SOURCE_TO_KEEP
    })
    source_analysis.to_csv('applications/source_analysis.csv', index=False)
    print("\n‚úÖ Analyse sauvegard√©e dans: applications/source_analysis.csv")
    
else:
    print("‚ùå Impossible d'analyser les sources. V√©rifiez que les candidatures ont √©t√© r√©cup√©r√©es.")


üìä Analyse des sources existantes:


Nombre total de sources diff√©rentes: 7

R√©partition par source:
------------------------------------------------------------
cabine cibli job               :   1046 candidatures  ‚úÖ CONSERV√âE
campaign_share                 :   1105 candidatures  üîÑ SERA MODIFI√âE
career_site                    :    154 candidatures  üîÑ SERA MODIFI√âE
hellowork                      :   2788 candidatures  üîÑ SERA MODIFI√âE
jobijoba                       :     95 candidatures  üîÑ SERA MODIFI√âE
recruiter_cvtheque             :      1 candidatures  üîÑ SERA MODIFI√âE
recruiter_manual               :      2 candidatures  üîÑ SERA MODIFI√âE


üìà R√©sum√©:
   Total candidatures: 5245
   √Ä conserver ('cabine cibli job'): 1046
   √Ä modifier ‚Üí 'cibli': 4199


‚úÖ Analyse sauvegard√©e dans: applications/source_analysis.csv


In [11]:
if applications_df is not None:
    # Filtrer les candidatures √† modifier
    applications_to_modify = applications_df[applications_df['source'] != SOURCE_TO_KEEP].copy()
    
    print(f"üîÑ Modification de {len(applications_to_modify)} candidatures...")
    print(f"   Source actuelle: toutes sauf '{SOURCE_TO_KEEP}'")
    print(f"   Nouvelle source: '{NEW_SOURCE}'")
    print("\n" + "=" * 60)
    
    # Pr√©parer le rapport
    modification_report = []
    success_count = 0
    error_count = 0
    
    # Modifier chaque candidature
    for idx, application in applications_to_modify.iterrows():
        application_id = application.get('id')
        old_source = application.get('source')
        
        if application_id is None:
            print(f"‚ö†Ô∏è Candidature sans ID √† l'index {idx}, ignor√©e")
            error_count += 1
            continue
        
        # Pr√©parer les donn√©es de mise √† jour
        update_data = {
            "source": NEW_SOURCE
        }
        
        # Endpoint pour mettre √† jour une candidature
        update_endpoint = f"{API_URL}/applications/{application_id}"
        
        try:
            # Faire la requ√™te PUT/PATCH
            update_response = requests.put(
                update_endpoint,
                headers={
                    "x-api-key": API_KEY,
                    "Content-Type": "application/json"
                },
                json=update_data
            )

            if update_response.status_code in [200, 204]:
                success_count += 1
                status = "‚úÖ"
            else:
                error_count += 1
                status = f"‚ùå ({update_response.status_code})"
            
            # Enregistrer dans le rapport
            modification_report.append({
                'application_id': application_id,
                'old_source': old_source,
                'new_source': NEW_SOURCE,
                'status_code': update_response.status_code,
                'success': update_response.status_code in [200, 204],
                'error_message': update_response.text if update_response.status_code not in [200, 204] else None
            })
            
            # Afficher le progr√®s tous les 50 √©l√©ments
            if (success_count + error_count) % 50 == 0:
                print(f"   Progression: {success_count + error_count}/{len(applications_to_modify)} ({status})")
                
        except Exception as e:
            error_count += 1
            modification_report.append({
                'application_id': application_id,
                'old_source': old_source,
                'new_source': NEW_SOURCE,
                'status_code': None,
                'success': False,
                'error_message': str(e)
            })
            print(f"‚ùå Erreur pour candidature {application_id}: {e}")
    
    # Cr√©er le DataFrame du rapport
    report_df = pd.DataFrame(modification_report)
    
    # Sauvegarder le rapport
    timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
    report_filename = f'applications/modification_report_{timestamp}.csv'
    report_df.to_csv(report_filename, index=False)
    
    # Afficher le r√©sum√©
    print("\n" + "=" * 60)
    print("üìä R√âSUM√â DES MODIFICATIONS")
    print("=" * 60)
    print(f"‚úÖ Succ√®s: {success_count}")
    print(f"‚ùå Erreurs: {error_count}")
    print(f"üìù Total trait√©: {len(modification_report)}")
    print(f"\n‚úÖ Rapport sauvegard√© dans: {report_filename}")
    
    # Afficher les erreurs s'il y en a
    if error_count > 0:
        print("\n‚ö†Ô∏è Erreurs rencontr√©es:")
        errors_df = report_df[report_df['success'] == False]
        print(errors_df.head(10))
        
else:
    print("‚ùå Impossible de modifier les candidatures. V√©rifiez que les donn√©es ont √©t√© r√©cup√©r√©es.")


üîÑ Modification de 4199 candidatures...
   Source actuelle: toutes sauf 'cabine cibli job'
   Nouvelle source: 'cibli'

   Progression: 50/4199 (‚úÖ)
   Progression: 100/4199 (‚úÖ)
   Progression: 150/4199 (‚úÖ)
   Progression: 200/4199 (‚úÖ)
   Progression: 250/4199 (‚úÖ)
   Progression: 300/4199 (‚úÖ)
   Progression: 350/4199 (‚úÖ)
   Progression: 400/4199 (‚úÖ)
   Progression: 450/4199 (‚úÖ)
   Progression: 500/4199 (‚úÖ)
   Progression: 550/4199 (‚úÖ)
   Progression: 600/4199 (‚úÖ)
   Progression: 650/4199 (‚úÖ)
   Progression: 700/4199 (‚úÖ)
   Progression: 750/4199 (‚úÖ)
   Progression: 800/4199 (‚úÖ)
   Progression: 850/4199 (‚úÖ)
   Progression: 900/4199 (‚úÖ)


KeyboardInterrupt: 

In [None]:
print("üîç V√©rification des modifications...")
print("=" * 60)

# R√©cup√©rer les donn√©es mises √† jour
verification_response = requests.get(
    APPLICATIONS_ENDPOINT,
    headers={"x-api-key": API_KEY}
)

if verification_response.status_code == 200:
    updated_applications = verification_response.json()
    updated_df = pd.DataFrame(updated_applications)
    
    # Sauvegarder les donn√©es mises √† jour
    timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
    updated_filename = f'applications/all_applications_updated_{timestamp}.csv'
    updated_df.to_csv(updated_filename, index=False)
    
    print(f"‚úÖ {len(updated_df)} candidatures r√©cup√©r√©es apr√®s modification")
    
    # Analyser les sources apr√®s modification
    if 'source' in updated_df.columns:
        updated_source_counts = updated_df['source'].value_counts()
        
        print("\nüìä Sources apr√®s modification:")
        print("-" * 60)
        for source, count in updated_source_counts.items():
            print(f"{source:<30} : {count:>6} candidatures")
        
        # V√©rifier que les modifications ont bien √©t√© appliqu√©es
        expected_sources = {SOURCE_TO_KEEP, NEW_SOURCE}
        actual_sources = set(updated_source_counts.index)
        
        print("\n" + "=" * 60)
        if actual_sources == expected_sources:
            print("‚úÖ V√©rification r√©ussie ! Les sources sont correctes.")
        else:
            print("‚ö†Ô∏è Attention: Des sources inattendues ont √©t√© trouv√©es:")
            unexpected = actual_sources - expected_sources
            for source in unexpected:
                print(f"   - {source}: {updated_source_counts[source]} candidatures")
        
        print(f"\n‚úÖ Donn√©es mises √† jour sauvegard√©es dans: {updated_filename}")
    
else:
    print(f"‚ùå Erreur lors de la v√©rification: {verification_response.status_code}")


---

## ‚úÖ C'est termin√© !

### üìÅ Fichiers g√©n√©r√©s :

1. **Backup initial** : `applications/all_applications_backup_YYYYMMDD_HHMMSS.csv`
   - ‚ö†Ô∏è **IMPORTANT :** Gardez ce fichier pour pouvoir restaurer !
2. **Mapping de restauration** : `applications/restore_mapping_YYYYMMDD_HHMMSS.csv`
   - Mapping ID ‚Üí source originale pour restauration facile
3. **Analyse des sources** : `applications/source_analysis.csv`
4. **Rapport de modification** : `applications/modification_report_YYYYMMDD_HHMMSS.csv`
5. **Donn√©es finales** : `applications/all_applications_updated_YYYYMMDD_HHMMSS.csv`

### üì• Pour t√©l√©charger les fichiers :

1. Cliquez sur l'ic√¥ne **üìÅ "Fichiers"** dans la barre lat√©rale gauche
2. Faites un **clic droit** sur chaque fichier
3. S√©lectionnez **"T√©l√©charger"** (Download)

### üîÑ Pour restaurer les donn√©es (si n√©cessaire) :

Si le frontend ne peut pas afficher la nouvelle source "cibli", utilisez la cellule de restauration ci-dessous.

---

**Merci d'avoir utilis√© ce notebook ! üéâ**


---

# üîÑ RESTAURATION DES SOURCES ORIGINALES

**‚ö†Ô∏è UTILISEZ CETTE SECTION UNIQUEMENT SI VOUS VOULEZ RESTAURER LES SOURCES ORIGINALES**

Cette section permet de restaurer toutes les sources √† leur valeur d'origine depuis le backup.

**Quand utiliser cette section :**
- Le frontend ne peut pas afficher la nouvelle source "cibli"
- Vous voulez annuler les modifications
- Vous avez besoin de revenir √† l'√©tat pr√©c√©dent

**‚ö†Ô∏è ATTENTION :** Cette op√©ration va modifier toutes les candidatures qui ont √©t√© chang√©es !


## üîô √âtape de Restauration 1 : Configuration

**‚ö†Ô∏è IMPORTANT :** Sp√©cifiez le nom du fichier de mapping de restauration cr√©√© lors du backup.

Le fichier devrait s'appeler : `applications/restore_mapping_YYYYMMDD_HHMMSS.csv`

**Si vous ne connaissez pas le nom exact :**
1. Regardez dans le panneau de fichiers √† gauche
2. Cherchez les fichiers commen√ßant par `restore_mapping_`
3. Utilisez le plus r√©cent (celui cr√©√© juste avant les modifications)


In [None]:
# Configuration pour la restauration
# ‚ö†Ô∏è MODIFIEZ CE NOM DE FICHIER avec le nom exact de votre fichier de mapping
RESTORE_MAPPING_FILE = "applications/restore_mapping_20251215_210249.csv"  # ‚Üê MODIFIEZ ICI

# V√©rifier que le fichier existe
if os.path.exists(RESTORE_MAPPING_FILE):
    print(f"‚úÖ Fichier de mapping trouv√©: {RESTORE_MAPPING_FILE}")
    restore_df = pd.read_csv(RESTORE_MAPPING_FILE)
    print(f"‚úÖ {len(restore_df)} candidatures √† restaurer")
    print(f"\nüìä Aper√ßu du mapping:")
    print(restore_df.head(10))
    print(f"\nüìä Sources √† restaurer:")
    source_counts = restore_df['original_source'].value_counts()
    for source, count in source_counts.items():
        print(f"   {source}: {count} candidatures")
else:
    print(f"‚ùå Fichier non trouv√©: {RESTORE_MAPPING_FILE}")
    print(f"\nüìÅ Fichiers disponibles dans 'applications/':")
    if os.path.exists('applications'):
        files = [f for f in os.listdir('applications') if f.startswith('restore_mapping_')]
        if files:
            print("   Fichiers de mapping trouv√©s:")
            for f in sorted(files, reverse=True):  # Plus r√©cent en premier
                print(f"   - {f}")
        else:
            print("   Aucun fichier de mapping trouv√©")
    restore_df = None


‚úÖ Fichier de mapping trouv√©: applications/restore_mapping_20251215_210249.csv
‚úÖ 5245 candidatures √† restaurer

üìä Aper√ßu du mapping:
   application_id original_source
0              34       hellowork
1              36       hellowork
2              53       hellowork
3              68       hellowork
4             223       hellowork
5             241       hellowork
6             242       hellowork
7             257       hellowork
8             259             NaN
9             274       hellowork

üìä Sources √† restaurer:
   hellowork: 2788 candidatures
   campaign_share: 1105 candidatures
   cabine cibli job: 1046 candidatures
   career_site: 154 candidatures
   jobijoba: 95 candidatures
   recruiter_manual: 2 candidatures
   recruiter_cvtheque: 1 candidatures


## üîô √âtape de Restauration 2 : Restauration des sources

**‚ö†Ô∏è ATTENTION : Cette cellule va restaurer toutes les sources originales dans l'API !**

Cette cellule :
- Lit le mapping de restauration
- Restaure chaque candidature √† sa source originale
- G√©n√®re un rapport de restauration

**Temps estim√© :** 1-5 minutes selon le nombre de candidatures


In [16]:
if restore_df is not None:
    print("üîÑ Restauration des sources originales...")
    print("=" * 60)
    
    # Pr√©parer le rapport
    restore_report = []
    success_count = 0
    error_count = 0
    
    # Restaurer chaque candidature
    for idx, row in restore_df.iterrows():
        application_id = row['application_id']
        original_source = row['original_source']

        if pd.isna(original_source):
            print(f" Fallback to hellowork")
            original_source = "hellowork"
        if pd.isna(application_id):
            print(f"‚ö†Ô∏è Ligne {idx} ignor√©e (donn√©es manquantes)")
            error_count += 1
            continue
        
        # Pr√©parer les donn√©es de restauration
        restore_data = {
            "source": original_source
        }
        
        # Endpoint pour mettre √† jour une candidature
        update_endpoint = f"{API_URL}/applications/{application_id}"
        
        try:
            # Faire la requ√™te PATCH
            restore_response = requests.put(
                update_endpoint,
                headers={
                    "x-api-key": API_KEY,
                    "Content-Type": "application/json"
                },
                json=restore_data
            )
            
            if restore_response.status_code in [200, 204]:
                success_count += 1
                status = "‚úÖ"
            else:
                error_count += 1
                status = f"‚ùå ({restore_response.status_code})"
            
            # Enregistrer dans le rapport
            restore_report.append({
                'application_id': application_id,
                'restored_source': original_source,
                'status_code': restore_response.status_code,
                'success': restore_response.status_code in [200, 204],
                'error_message': restore_response.text if restore_response.status_code not in [200, 204] else None
            })
            
            # Afficher le progr√®s tous les 50 √©l√©ments
            if (success_count + error_count) % 50 == 0:
                print(f"   Progression: {success_count + error_count}/{len(restore_df)} ({status})")
                
        except Exception as e:
            error_count += 1
            restore_report.append({
                'application_id': application_id,
                'restored_source': original_source,
                'status_code': None,
                'success': False,
                'error_message': str(e)
            })
            print(f"‚ùå Erreur pour candidature {application_id}: {e}")
    
    # Cr√©er le DataFrame du rapport
    restore_report_df = pd.DataFrame(restore_report)
    
    # Sauvegarder le rapport
    timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
    restore_report_filename = f'applications/restore_report_{timestamp}.csv'
    restore_report_df.to_csv(restore_report_filename, index=False)
    
    # Afficher le r√©sum√©
    print("\n" + "=" * 60)
    print("üìä R√âSUM√â DE LA RESTAURATION")
    print("=" * 60)
    print(f"‚úÖ Succ√®s: {success_count}")
    print(f"‚ùå Erreurs: {error_count}")
    print(f"üìù Total trait√©: {len(restore_report)}")
    print(f"\n‚úÖ Rapport sauvegard√© dans: {restore_report_filename}")
    
    # Afficher les erreurs s'il y en a
    if error_count > 0:
        print("\n‚ö†Ô∏è Erreurs rencontr√©es:")
        errors_df = restore_report_df[restore_report_df['success'] == False]
        print(errors_df.head(10))
    else:
        print("\nüéâ Toutes les sources ont √©t√© restaur√©es avec succ√®s !")
        
else:
    print("‚ùå Impossible de restaurer. V√©rifiez que le fichier de mapping a √©t√© charg√©.")


üîÑ Restauration des sources originales...
 Fallback to hellowork
 Fallback to hellowork
 Fallback to hellowork
 Fallback to hellowork
 Fallback to hellowork
 Fallback to hellowork
 Fallback to hellowork
 Fallback to hellowork
 Fallback to hellowork
 Fallback to hellowork
 Fallback to hellowork
 Fallback to hellowork
 Fallback to hellowork
 Fallback to hellowork
 Fallback to hellowork
 Fallback to hellowork
 Fallback to hellowork
 Fallback to hellowork
 Fallback to hellowork
 Fallback to hellowork
 Fallback to hellowork
 Fallback to hellowork
 Fallback to hellowork
 Fallback to hellowork
   Progression: 50/5245 (‚úÖ)
 Fallback to hellowork
 Fallback to hellowork
 Fallback to hellowork
 Fallback to hellowork
 Fallback to hellowork
 Fallback to hellowork
   Progression: 100/5245 (‚úÖ)
 Fallback to hellowork
 Fallback to hellowork
 Fallback to hellowork
 Fallback to hellowork
 Fallback to hellowork
   Progression: 150/5245 (‚úÖ)
 Fallback to hellowork
   Progression: 200/5245 (‚úÖ)
 Fall

KeyboardInterrupt: 

## üîô √âtape de Restauration 3 : V√©rification de la restauration

Cette cellule v√©rifie que les sources ont bien √©t√© restaur√©es.


In [17]:
print("üîç V√©rification de la restauration...")
print("=" * 60)

# R√©cup√©rer les donn√©es apr√®s restauration
verification_response = requests.get(
    APPLICATIONS_ENDPOINT,
    headers={"x-api-key": API_KEY}
)

if verification_response.status_code == 200:
    restored_applications = verification_response.json()
    restored_df = pd.DataFrame(restored_applications)
    
    # Sauvegarder les donn√©es restaur√©es
    timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
    restored_filename = f'applications/all_applications_restored_{timestamp}.csv'
    restored_df.to_csv(restored_filename, index=False)
    
    print(f"‚úÖ {len(restored_df)} candidatures r√©cup√©r√©es apr√®s restauration")
    
    # Analyser les sources apr√®s restauration
    if 'source' in restored_df.columns and restore_df is not None:
        restored_source_counts = restored_df['source'].value_counts()
        original_source_counts = restore_df['original_source'].value_counts()
        
        print("\nüìä Sources apr√®s restauration:")
        print("-" * 60)
        for source, count in restored_source_counts.items():
            original_count = original_source_counts.get(source, 0)
            match = "‚úÖ" if count == original_count else "‚ö†Ô∏è"
            print(f"{source:<30} : {count:>6} candidatures  {match} (original: {original_count})")
        
        # Comparer avec les sources originales
        print("\n" + "=" * 60)
        print("üìä Comparaison avec les sources originales:")
        
        all_sources = set(restored_source_counts.index) | set(original_source_counts.index)
        all_match = True
        
        for source in sorted(all_sources):
            restored_count = restored_source_counts.get(source, 0)
            original_count = original_source_counts.get(source, 0)
            if restored_count == original_count:
                print(f"‚úÖ {source}: {restored_count} candidatures (identique)")
            else:
                print(f"‚ö†Ô∏è {source}: {restored_count} restaur√©es vs {original_count} originales")
                all_match = False
        
        if all_match:
            print("\nüéâ RESTAURATION R√âUSSIE ! Toutes les sources correspondent aux originales.")
        else:
            print("\n‚ö†Ô∏è Certaines sources ne correspondent pas exactement. V√©rifiez le rapport.")
        
        print(f"\n‚úÖ Donn√©es restaur√©es sauvegard√©es dans: {restored_filename}")
    
else:
    print(f"‚ùå Erreur lors de la v√©rification: {verification_response.status_code}")


üîç V√©rification de la restauration...
‚úÖ 5245 candidatures r√©cup√©r√©es apr√®s restauration

üìä Sources apr√®s restauration:
------------------------------------------------------------
hellowork                      :   2837 candidatures  ‚ö†Ô∏è (original: 2788)
campaign_share                 :   1105 candidatures  ‚úÖ (original: 1105)
cabine cibli job               :   1046 candidatures  ‚úÖ (original: 1046)
career_site                    :    154 candidatures  ‚úÖ (original: 154)
jobijoba                       :     95 candidatures  ‚úÖ (original: 95)
recruiter_manual               :      2 candidatures  ‚úÖ (original: 2)
recruiter_cvtheque             :      1 candidatures  ‚úÖ (original: 1)

üìä Comparaison avec les sources originales:
‚úÖ cabine cibli job: 1046 candidatures (identique)
‚úÖ campaign_share: 1105 candidatures (identique)
‚úÖ career_site: 154 candidatures (identique)
‚ö†Ô∏è hellowork: 2837 restaur√©es vs 2788 originales
‚úÖ jobijoba: 95 candidatures (identiqu

---

## ‚úÖ Restauration termin√©e !

Les sources ont √©t√© restaur√©es √† leur valeur d'origine.

**üìÅ Fichiers g√©n√©r√©s :**
- `applications/restore_report_YYYYMMDD_HHMMSS.csv` - Rapport de restauration
- `applications/all_applications_restored_YYYYMMDD_HHMMSS.csv` - Donn√©es apr√®s restauration

**üí° Astuce :** Comparez les fichiers de backup et de restauration pour v√©rifier que tout correspond.
