# üîå Test des APIs - Job Market

Ce notebook teste la connexion aux 3 APIs principales du projet :
1. **The Muse** - Offres internationales
2. **Adzuna** - Offres France + donn√©es salariales
3. **France Travail** - Offres officielles France

**Objectifs :**
- V√©rifier que les cl√©s API fonctionnent
- Collecter 10 offres de test de chaque source
- Explorer la structure des donn√©es retourn√©es
- Identifier les champs utiles pour notre projet

---

## üì¶ Installation des d√©pendances

Si vous √™tes sur **Google Colab**, ex√©cutez cette cellule :

In [None]:
# D√©commenter si sur Google Colab
# !pip install requests python-dotenv pandas

## üîë Configuration des cl√©s API

**Option A : Depuis un fichier .env (local)**
```python
from dotenv import load_dotenv
load_dotenv('../config/.env')
```

**Option B : Directement dans le code (Colab)**
```python
import os
os.environ['THEMUSE_API_KEY'] = 'votre_cle_ici'
```

In [None]:
import requests
import json
import os
from datetime import datetime
import pandas as pd

# Option A : Charger depuis .env (si local)
# from dotenv import load_dotenv
# load_dotenv('../config/.env')

# Option B : D√©finir directement (si Colab)
# Remplacez par vos vraies cl√©s apr√®s les avoir obtenues
THEMUSE_API_KEY = os.getenv('THEMUSE_API_KEY', 'YOUR_KEY_HERE')
ADZUNA_APP_ID = os.getenv('ADZUNA_APP_ID', 'YOUR_APP_ID')
ADZUNA_APP_KEY = os.getenv('ADZUNA_APP_KEY', 'YOUR_APP_KEY')
FRANCETRAVAIL_CLIENT_ID = os.getenv('FRANCETRAVAIL_CLIENT_ID', 'YOUR_CLIENT_ID')
FRANCETRAVAIL_CLIENT_SECRET = os.getenv('FRANCETRAVAIL_CLIENT_SECRET', 'YOUR_CLIENT_SECRET')

print("‚úÖ Configuration charg√©e")

---
## 1Ô∏è‚É£ Test de The Muse API

**Documentation :** https://www.themuse.com/developers/api/v2

**Endpoint :** `GET https://www.themuse.com/api/public/jobs`

In [None]:
def test_themuse():
    """Teste la connexion √† The Muse API et r√©cup√®re 10 offres"""
    
    print("üîç Test de The Muse API...")
    
    url = "https://www.themuse.com/api/public/jobs"
    params = {
        'api_key': THEMUSE_API_KEY,
        'page': 1,
        'descending': True
    }
    
    try:
        response = requests.get(url, params=params, timeout=10)
        response.raise_for_status()
        
        data = response.json()
        jobs = data.get('results', [])
        
        print(f"‚úÖ Connexion r√©ussie !")
        print(f"üìä Nombre d'offres r√©cup√©r√©es : {len(jobs)}")
        print(f"üìÑ Total disponible : {data.get('page_count', 'N/A')} pages")
        
        # Afficher un exemple
        if jobs:
            print("\nüìù Exemple d'offre :")
            job = jobs[0]
            print(f"  - Titre : {job.get('name', 'N/A')}")
            print(f"  - Entreprise : {job.get('company', {}).get('name', 'N/A')}")
            print(f"  - Localisation : {', '.join([loc.get('name', '') for loc in job.get('locations', [])])}")
            print(f"  - Niveau : {', '.join(job.get('levels', []))}")
            
        return jobs
        
    except requests.exceptions.RequestException as e:
        print(f"‚ùå Erreur : {e}")
        return []

# Ex√©cuter le test
themuse_jobs = test_themuse()

---
## 2Ô∏è‚É£ Test de Adzuna API

**Documentation :** https://developer.adzuna.com/

**Endpoint :** `GET https://api.adzuna.com/v1/api/jobs/fr/search/1`

In [None]:
def test_adzuna():
    """Teste la connexion √† Adzuna API et r√©cup√®re 10 offres fran√ßaises"""
    
    print("üîç Test de Adzuna API...")
    
    url = f"https://api.adzuna.com/v1/api/jobs/fr/search/1"
    params = {
        'app_id': ADZUNA_APP_ID,
        'app_key': ADZUNA_APP_KEY,
        'results_per_page': 10,
        'what': 'data',  # Recherche exemple
        'content-type': 'application/json'
    }
    
    try:
        response = requests.get(url, params=params, timeout=10)
        response.raise_for_status()
        
        data = response.json()
        jobs = data.get('results', [])
        
        print(f"‚úÖ Connexion r√©ussie !")
        print(f"üìä Nombre d'offres r√©cup√©r√©es : {len(jobs)}")
        print(f"üìÑ Total disponible : {data.get('count', 'N/A')} offres")
        
        # Afficher un exemple
        if jobs:
            print("\nüìù Exemple d'offre :")
            job = jobs[0]
            print(f"  - Titre : {job.get('title', 'N/A')}")
            print(f"  - Entreprise : {job.get('company', {}).get('display_name', 'N/A')}")
            print(f"  - Localisation : {job.get('location', {}).get('display_name', 'N/A')}")
            print(f"  - Salaire : {job.get('salary_min', 'N/A')} - {job.get('salary_max', 'N/A')} ‚Ç¨")
            
        return jobs
        
    except requests.exceptions.RequestException as e:
        print(f"‚ùå Erreur : {e}")
        return []

# Ex√©cuter le test
adzuna_jobs = test_adzuna()

---
## 3Ô∏è‚É£ Test de France Travail API (OAuth 2.0)

**Documentation :** https://francetravail.io/data/api

**Note :** Cette API n√©cessite une authentification OAuth 2.0 en 2 √©tapes :
1. Obtenir un access token
2. Utiliser le token pour faire des requ√™tes

In [None]:
def get_francetravail_token():
    """Obtient un access token OAuth 2.0 pour France Travail API"""
    
    url = "https://entreprise.francetravail.fr/connexion/oauth2/access_token"
    params = {
        'realm': '/partenaire'
    }
    data = {
        'grant_type': 'client_credentials',
        'client_id': FRANCETRAVAIL_CLIENT_ID,
        'client_secret': FRANCETRAVAIL_CLIENT_SECRET,
        'scope': 'api_offresdemploiv2 o2dsoffre'
    }
    
    try:
        response = requests.post(url, params=params, data=data, timeout=10)
        response.raise_for_status()
        
        token_data = response.json()
        return token_data.get('access_token')
        
    except requests.exceptions.RequestException as e:
        print(f"‚ùå Erreur lors de l'obtention du token : {e}")
        return None

def test_francetravail():
    """Teste la connexion √† France Travail API et r√©cup√®re 10 offres"""
    
    print("üîç Test de France Travail API...")
    
    # √âtape 1 : Obtenir le token
    print("  üîê Obtention du token OAuth...")
    token = get_francetravail_token()
    
    if not token:
        print("‚ùå Impossible d'obtenir le token")
        return []
    
    print("  ‚úÖ Token obtenu")
    
    # √âtape 2 : Faire la requ√™te
    url = "https://api.francetravail.io/partenaire/offresdemploi/v2/offres/search"
    headers = {
        'Authorization': f'Bearer {token}',
        'Content-Type': 'application/json'
    }
    params = {
        'motsCles': 'data',
        'range': '0-9'
    }
    
    try:
        response = requests.get(url, headers=headers, params=params, timeout=10)
        response.raise_for_status()
        
        data = response.json()
        jobs = data.get('resultats', [])
        
        print(f"‚úÖ Connexion r√©ussie !")
        print(f"üìä Nombre d'offres r√©cup√©r√©es : {len(jobs)}")
        
        # Afficher un exemple
        if jobs:
            print("\nüìù Exemple d'offre :")
            job = jobs[0]
            print(f"  - Titre : {job.get('intitule', 'N/A')}")
            print(f"  - Entreprise : {job.get('entreprise', {}).get('nom', 'N/A')}")
            print(f"  - Localisation : {job.get('lieuTravail', {}).get('libelle', 'N/A')}")
            print(f"  - Type contrat : {job.get('typeContrat', 'N/A')}")
            
        return jobs
        
    except requests.exceptions.RequestException as e:
        print(f"‚ùå Erreur : {e}")
        return []

# Ex√©cuter le test
francetravail_jobs = test_francetravail()

---
## üìä R√©sum√© des tests

Affichons un tableau r√©capitulatif :

In [None]:
import pandas as pd

# Cr√©er un DataFrame r√©capitulatif
summary = pd.DataFrame({
    'API': ['The Muse', 'Adzuna', 'France Travail'],
    'Offres collect√©es': [len(themuse_jobs), len(adzuna_jobs), len(francetravail_jobs)],
    'Statut': [
        '‚úÖ OK' if themuse_jobs else '‚ùå √âchec',
        '‚úÖ OK' if adzuna_jobs else '‚ùå √âchec',
        '‚úÖ OK' if francetravail_jobs else '‚ùå √âchec'
    ]
})

print("\n" + "="*50)
print("üìä R√âSUM√â DES TESTS")
print("="*50)
print(summary.to_string(index=False))
print("\n")

total = len(themuse_jobs) + len(adzuna_jobs) + len(francetravail_jobs)
print(f"üìà Total d'offres collect√©es : {total}")

if total > 0:
    print("\nüéâ F√©licitations ! Les APIs fonctionnent correctement.")
    print("‚û°Ô∏è  Prochaine √©tape : Cr√©er les scripts de collecte complets")
else:
    print("\n‚ö†Ô∏è  Aucune offre collect√©e. V√©rifiez vos cl√©s API.")

---
## üíæ Sauvegarder les donn√©es de test

Sauvegardons ces premi√®res donn√©es en JSON :

In [None]:
# Cr√©er le dossier data/raw s'il n'existe pas
import os
os.makedirs('../data/raw', exist_ok=True)

# Sauvegarder
timestamp = datetime.now().strftime('%Y%m%d_%H%M%S')

if themuse_jobs:
    with open(f'../data/raw/themuse_test_{timestamp}.json', 'w', encoding='utf-8') as f:
        json.dump(themuse_jobs, f, ensure_ascii=False, indent=2)
    print(f"‚úÖ The Muse : {len(themuse_jobs)} offres sauvegard√©es")

if adzuna_jobs:
    with open(f'../data/raw/adzuna_test_{timestamp}.json', 'w', encoding='utf-8') as f:
        json.dump(adzuna_jobs, f, ensure_ascii=False, indent=2)
    print(f"‚úÖ Adzuna : {len(adzuna_jobs)} offres sauvegard√©es")

if francetravail_jobs:
    with open(f'../data/raw/francetravail_test_{timestamp}.json', 'w', encoding='utf-8') as f:
        json.dump(francetravail_jobs, f, ensure_ascii=False, indent=2)
    print(f"‚úÖ France Travail : {len(francetravail_jobs)} offres sauvegard√©es")

print(f"\nüìÅ Fichiers sauvegard√©s dans : data/raw/")

---
## ‚úÖ Prochaines √©tapes

Maintenant que les APIs fonctionnent, voici ce qu'on va faire :

1. **Cr√©er les scripts de collecte complets** (`src/collectors/`)
2. **Automatiser la collecte** de 1000+ offres
3. **Cr√©er la base de donn√©es** PostgreSQL
4. **D√©velopper le pipeline ETL** pour nettoyer les donn√©es

**Rendez-vous dans le prochain notebook !** üöÄ