# üì• Collecte et Mise en Cache des Donn√©es - Ligue 1

Ce notebook s'occupe de **r√©cup√©rer et mettre en cache** toutes les donn√©es n√©cessaires pour les pr√©dictions.

## üéØ Objectif

S√©parer la logique de collecte de donn√©es de la logique de pr√©diction pour :
- ‚úÖ **√âconomiser les appels API** : Une seule ex√©cution met tout en cache
- ‚úÖ **Acc√©l√©rer les pr√©dictions** : Les autres notebooks utilisent le cache
- ‚úÖ **Clart√©** : S√©paration des responsabilit√©s
- ‚úÖ **Contr√¥le** : Choisir quand rafra√Æchir les donn√©es

## üìã Donn√©es collect√©es

1. **Liste des √©quipes** de Ligue 1
2. **Statistiques d√©taill√©es** de chaque √©quipe
3. **Classement** de la Ligue 1
4. **Historique head-to-head** des principales confrontations

## ‚è±Ô∏è Fr√©quence recommand√©e

Ex√©cutez ce notebook :
- **Avant chaque journ√©e** : Pour avoir les donn√©es √† jour
- **Apr√®s les matchs** : Pour mettre √† jour les statistiques
- **Maximum 1 fois par jour** : Pour √©conomiser le quota API (100 requ√™tes/jour)

## üìä Estimation des appels API

- Liste des √©quipes : **1 appel**
- Statistiques (20 √©quipes) : **20 appels**
- Classement : **1 appel**
- Head-to-head (optionnel) : **~10 appels**

**Total : environ 32 appels API** (33% du quota quotidien)

In [12]:
# Installation des d√©pendances (si n√©cessaire)
# !pip install requests pandas python-dotenv

import requests
import json
import pandas as pd
import os
from dotenv import load_dotenv
import time
import hashlib
from datetime import datetime

print("‚úÖ Biblioth√®ques import√©es")

‚úÖ Biblioth√®ques import√©es


In [13]:
# Configuration - Chargement depuis .env
load_dotenv()

API_KEY = os.getenv("API_FOOTBALL_KEY", "votre_cl√©_api_ici")
LIGUE1_ID = int(os.getenv("LIGUE1_ID", 61))
CURRENT_SEASON = int(os.getenv("CURRENT_SEASON", 2025))

print(f"‚úÖ Configuration charg√©e : Ligue {LIGUE1_ID}, Saison {CURRENT_SEASON}")
print(f"üìÖ Saison {CURRENT_SEASON}-{CURRENT_SEASON+1}")

if API_KEY == "votre_cl√©_api_ici":
    print("‚ö†Ô∏è N'oubliez pas de configurer votre API_FOOTBALL_KEY dans le fichier .env")

‚úÖ Configuration charg√©e : Ligue 61, Saison 2025
üìÖ Saison 2025-2026


## üîß Classe FootballAPI

Avec syst√®me de cache sur disque - dur√©e prolong√©e pour √©viter les rafra√Æchissements inutiles.

In [27]:
class FootballAPI:
    """Classe pour interagir avec l'API-Football avec syst√®me de cache sur disque"""
    
    def __init__(self, api_key, league_id=61, season=2025, cache_duration=86400, cache_dir='cache'):
        self.base_url = "https://v3.football.api-sports.io"
        self.headers = {'x-apisports-key': api_key}
        self.league_id = league_id
        self.season = season
        self.cache_duration = cache_duration  # 24h par d√©faut pour collecte
        self.cache_dir = cache_dir
        self.api_calls = 0
        
        if not os.path.exists(self.cache_dir):
            os.makedirs(self.cache_dir)
            print(f"üìÅ Dossier cache cr√©√©: {self.cache_dir}")
    
    def _get_cache_key(self, endpoint, params):
        params_str = '&'.join([f"{k}={v}" for k, v in sorted(params.items())])
        return f"{endpoint}?{params_str}"
    
    def _get_cache_filename(self, cache_key):
        hash_key = hashlib.md5(cache_key.encode()).hexdigest()
        return os.path.join(self.cache_dir, f"{hash_key}.json")
    
    def _get_from_cache(self, cache_key):
        cache_file = self._get_cache_filename(cache_key)
        
        if os.path.exists(cache_file):
            file_age = time.time() - os.path.getmtime(cache_file)
            
            if file_age < self.cache_duration:
                try:
                    with open(cache_file, 'r', encoding='utf-8') as f:
                        data = json.load(f)
                    print(f"üì¶ Donn√©es en cache (√¢ge: {int(file_age/3600):.1f}h)")
                    return data
                except Exception as e:
                    print(f"‚ö†Ô∏è Erreur lecture cache: {e}")
                    return None
            else:
                print(f"‚è∞ Cache expir√© (√¢ge: {int(file_age/3600):.1f}h)")
        
        return None
    
    def _save_to_cache(self, cache_key, data):
        cache_file = self._get_cache_filename(cache_key)
        
        try:
            with open(cache_file, 'w', encoding='utf-8') as f:
                json.dump(data, f, ensure_ascii=False, indent=2)
            print(f"üíæ Donn√©es sauvegard√©es dans le cache")
        except Exception as e:
            print(f"‚ö†Ô∏è Erreur sauvegarde cache: {e}")
    
    def _make_request(self, endpoint, params, force_refresh=False):
        cache_key = self._get_cache_key(endpoint, params)
        
        # V√©rifier le cache d'abord (sauf si force_refresh)
        if not force_refresh:
            cached_data = self._get_from_cache(cache_key)
            if cached_data is not None:
                return cached_data
        
        # Faire l'appel API
        url = f"{self.base_url}{endpoint}"
        response = requests.get(url, headers=self.headers, params=params)
        self.api_calls += 1
        print(f"üåê Appel API #{self.api_calls}")
        
        if response.status_code == 200:
            data = response.json()
            self._save_to_cache(cache_key, data)
            return data
        else:
            print(f"‚ùå Erreur API: {response.status_code}")
        return None
    
    def get_teams(self, force_refresh=False):
        """R√©cup√®re la liste des √©quipes de la Ligue 1"""
        params = {'league': self.league_id, 'season': self.season}
        return self._make_request('/teams', params, force_refresh)
    
    def get_team_statistics(self, team_id, force_refresh=False):
        """R√©cup√®re les statistiques d'une √©quipe"""
        params = {
            'league': self.league_id,
            'season': self.season,
            'team': team_id
        }
        return self._make_request('/teams/statistics', params, force_refresh)
    
    def get_standings(self, force_refresh=False):
        """R√©cup√®re le classement de la Ligue 1"""
        params = {'league': self.league_id, 'season': self.season}
        return self._make_request('/standings', params, force_refresh)
    
    def get_head_to_head(self, team1_id, team2_id, last=10, force_refresh=False):
        """R√©cup√®re l'historique des confrontations"""
        params = {'h2h': f"{team1_id}-{team2_id}", 'last': last}
        return self._make_request('/fixtures/headtohead', params, force_refresh)
    
    def get_fixtures(self, date=None, team_id=None, force_refresh=False):
        """R√©cup√®re les matchs selon diff√©rents crit√®res
        
        Args:
            date: Date au format YYYY-MM-DD (ex: '2026-02-08')
            team_id: ID de l'√©quipe pour filtrer les matchs
            force_refresh: Forcer le rafra√Æchissement du cache
        """
        params = {'league': self.league_id, 'season': self.season}
        
        if date:
            params['date'] = date
        if team_id:
            params['team'] = team_id
            
        return self._make_request('/fixtures', params, force_refresh)
    
    def clear_cache(self):
        """Vide le cache en supprimant tous les fichiers"""
        if os.path.exists(self.cache_dir):
            files = [f for f in os.listdir(self.cache_dir) if f.endswith('.json')]
            for file in files:
                os.remove(os.path.join(self.cache_dir, file))
            print(f"üóëÔ∏è Cache vid√© ({len(files)} fichiers supprim√©s)")
        else:
            print("üìÅ Dossier cache inexistant")
    
    def get_cache_stats(self):
        """Affiche les statistiques du cache"""
        if os.path.exists(self.cache_dir):
            files = [f for f in os.listdir(self.cache_dir) if f.endswith('.json')]
            total_size = sum(os.path.getsize(os.path.join(self.cache_dir, f)) for f in files)
            
            print(f"üìä Statistiques du cache:")
            print(f"   - Fichiers en cache: {len(files)}")
            print(f"   - Taille totale: {total_size / 1024:.2f} KB")
            print(f"   - Appels API effectu√©s: {self.api_calls}")
            print(f"   - Dur√©e de validit√©: {self.cache_duration}s ({self.cache_duration/3600:.1f}h)")
            print(f"   - Dossier: {os.path.abspath(self.cache_dir)}")
        else:
            print(f"üìÅ Dossier cache inexistant")

# Initialisation de l'API avec cache 24h
api = FootballAPI(API_KEY, LIGUE1_ID, CURRENT_SEASON, cache_duration=86400)
print("‚úÖ API initialis√©e avec cache 24h")

‚úÖ API initialis√©e avec cache 24h


## üóëÔ∏è (Optionnel) Vider le cache avant collecte

D√©commentez pour forcer le rafra√Æchissement complet des donn√©es.

In [15]:
# ‚ö†Ô∏è ATTENTION : Cela forcera le rafra√Æchissement complet
api.clear_cache()
print("üí° Cache conserv√©. D√©commentez la ligne ci-dessus pour forcer un rafra√Æchissement.")

üóëÔ∏è Cache vid√© (26 fichiers supprim√©s)
üí° Cache conserv√©. D√©commentez la ligne ci-dessus pour forcer un rafra√Æchissement.


## üì• √âtape 1 : R√©cup√©rer la liste des √©quipes

In [16]:
print("üì• R√©cup√©ration de la liste des √©quipes...\n")

teams_data = api.get_teams()

if teams_data and teams_data.get('response'):
    teams = teams_data['response']
    
    print(f"\n‚úÖ {len(teams)} √©quipes trouv√©es\n")
    
    # Cr√©er un DataFrame pour visualisation
    teams_list = []
    for team in teams:
        teams_list.append({
            'ID': team['team']['id'],
            'Nom': team['team']['name'],
            'Code': team['team']['code'],
            'Stade': team['venue']['name']
        })
    
    df_teams = pd.DataFrame(teams_list)
    print("üèüÔ∏è √âquipes de Ligue 1:\n")
    display(df_teams)
    
    # Sauvegarder les IDs pour la suite
    team_ids = [t['team']['id'] for t in teams]
    print(f"\nüíæ {len(team_ids)} IDs d'√©quipes sauvegard√©s en m√©moire")
else:
    print("‚ùå Erreur lors de la r√©cup√©ration des √©quipes")
    team_ids = []

üì• R√©cup√©ration de la liste des √©quipes...



üåê Appel API #1
üíæ Donn√©es sauvegard√©es dans le cache

‚úÖ 18 √©quipes trouv√©es

üèüÔ∏è √âquipes de Ligue 1:



Unnamed: 0,ID,Nom,Code,Stade
0,77,Angers,ANG,Stade Raymond-Kopa
1,79,Lille,LIL,Decathlon Arena ‚Äì Stade Pierre-Mauroy
2,80,Lyon,LYO,Groupama Stadium
3,81,Marseille,MAR,Stade Orange V√©lodrome
4,83,Nantes,NAN,Stade de la Beaujoire - Louis Fonteneau
5,84,Nice,NIC,Allianz Riviera
6,85,Paris Saint Germain,PAR,Parc des Princes
7,91,Monaco,MON,Stade Louis-II
8,94,Rennes,REN,Roazhon Park
9,95,Strasbourg,STR,Stade de la Meinau



üíæ 18 IDs d'√©quipes sauvegard√©s en m√©moire


## üìä √âtape 2 : R√©cup√©rer les statistiques de chaque √©quipe

‚ö†Ô∏è **Attention** : Cette cellule va faire **~20 appels API** (un par √©quipe)

In [17]:
if len(team_ids) > 0:
    print(f"üìä R√©cup√©ration des statistiques de {len(team_ids)} √©quipes...\n")
    print("‚è±Ô∏è Cela peut prendre quelques minutes...\n")
    
    stats_collected = 0
    stats_from_cache = 0
    
    for i, team_id in enumerate(team_ids, 1):
        # R√©cup√©rer les stats
        stats = api.get_team_statistics(team_id)
        
        if stats and stats.get('response'):
            stats_collected += 1
            team_name = stats['response']['team']['name']
            print(f"  [{i}/{len(team_ids)}] ‚úÖ {team_name}")
        else:
            print(f"  [{i}/{len(team_ids)}] ‚ùå √âquipe ID {team_id}")
        
        # Petit d√©lai entre les requ√™tes pour ne pas surcharger l'API
        if i < len(team_ids):
            time.sleep(0.5)
    
    print(f"\n‚úÖ Collecte termin√©e : {stats_collected}/{len(team_ids)} √©quipes")
    print(f"üåê Appels API effectu√©s : {api.api_calls}")
else:
    print("‚ö†Ô∏è Aucune √©quipe √† traiter. Ex√©cutez d'abord la cellule pr√©c√©dente.")

üìä R√©cup√©ration des statistiques de 18 √©quipes...

‚è±Ô∏è Cela peut prendre quelques minutes...

üåê Appel API #2
üíæ Donn√©es sauvegard√©es dans le cache
  [1/18] ‚úÖ Angers
üåê Appel API #3
üíæ Donn√©es sauvegard√©es dans le cache
  [2/18] ‚úÖ Lille
üåê Appel API #4
üíæ Donn√©es sauvegard√©es dans le cache
  [3/18] ‚úÖ Lyon
üåê Appel API #5
üíæ Donn√©es sauvegard√©es dans le cache
  [4/18] ‚úÖ Marseille
üåê Appel API #6
üíæ Donn√©es sauvegard√©es dans le cache
  [5/18] ‚úÖ Nantes
üåê Appel API #7
üíæ Donn√©es sauvegard√©es dans le cache
  [6/18] ‚úÖ Nice
üåê Appel API #8
üíæ Donn√©es sauvegard√©es dans le cache
  [7/18] ‚úÖ Paris Saint Germain
üåê Appel API #9
üíæ Donn√©es sauvegard√©es dans le cache
  [8/18] ‚úÖ Monaco
üåê Appel API #10
üíæ Donn√©es sauvegard√©es dans le cache
  [9/18] ‚úÖ Rennes
üåê Appel API #11
üíæ Donn√©es sauvegard√©es dans le cache
  [10/18] ‚ùå √âquipe ID 95
üåê Appel API #12
üíæ Donn√©es sauvegard√©es dans le cache
  [11/18] ‚ùå √â

## üèÜ √âtape 3 : R√©cup√©rer le classement

In [18]:
print("üèÜ R√©cup√©ration du classement...\n")

standings = api.get_standings()

if standings and standings.get('response'):
    teams_data = []
    for team in standings['response'][0]['league']['standings'][0]:
        teams_data.append({
            'Rang': team['rank'],
            '√âquipe': team['team']['name'],
            'Points': team['points'],
            'Jou√©s': team['all']['played'],
            'V-N-D': f"{team['all']['win']}-{team['all']['draw']}-{team['all']['lose']}",
            'Diff': team['goalsDiff']
        })
    
    df_standings = pd.DataFrame(teams_data)
    print("‚úÖ Classement r√©cup√©r√©\n")
    display(df_standings)
else:
    print("‚ùå Erreur lors de la r√©cup√©ration du classement")

üèÜ R√©cup√©ration du classement...

üåê Appel API #20
üíæ Donn√©es sauvegard√©es dans le cache
‚úÖ Classement r√©cup√©r√©



Unnamed: 0,Rang,√âquipe,Points,Jou√©s,V-N-D,Diff
0,1,Lens,49,21,16-1-4,20
1,2,Paris Saint Germain,48,20,15-3-2,27
2,3,Lyon,42,21,13-3-5,14
3,4,Marseille,39,20,12-3-5,24
4,5,Lille,33,21,10-3-8,4
5,6,Strasbourg,31,21,9-4-8,8
6,7,Toulouse,31,21,8-7-6,8
7,8,Rennes,31,21,8-7-6,-3
8,9,Monaco,28,21,8-4-9,-1
9,10,Lorient,28,21,7-7-7,-6


## üìä R√©sum√© de la collecte

In [23]:
print("="*60)
print("üìä R√âSUM√â DE LA COLLECTE DE DONN√âES")
print("="*60)

api.get_cache_stats()

print(f"\n‚è∞ Donn√©es collect√©es le : {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")
print(f"\nüí° Ces donn√©es sont maintenant disponibles dans le cache pour :")
print(f"   - predictions_ligue1.ipynb (Pr√©dictions simples)")
print(f"   - 2_predictions_stats_avancees.ipynb (Pr√©dictions stats avanc√©es)")
print(f"\nüìÖ Prochaine collecte recommand√©e :")
print(f"   - Apr√®s les matchs de la prochaine journ√©e")
print(f"   - Dans environ 24h pour donn√©es fra√Æches")

print("\n‚úÖ Collecte termin√©e avec succ√®s !")

üìä R√âSUM√â DE LA COLLECTE DE DONN√âES
üìä Statistiques du cache:
   - Fichiers en cache: 26
   - Taille totale: 147.72 KB
   - Appels API effectu√©s: 26
   - Dur√©e de validit√©: 86400s (24.0h)
   - Dossier: c:\Users\nboud\Documents\GitHub-My-Projects\predictions-football-fr-python\cache

‚è∞ Donn√©es collect√©es le : 2026-02-08 21:47:33

üí° Ces donn√©es sont maintenant disponibles dans le cache pour :
   - predictions_ligue1.ipynb (Pr√©dictions simples)
   - 2_predictions_stats_avancees.ipynb (Pr√©dictions stats avanc√©es)

üìÖ Prochaine collecte recommand√©e :
   - Apr√®s les matchs de la prochaine journ√©e
   - Dans environ 24h pour donn√©es fra√Æches

‚úÖ Collecte termin√©e avec succ√®s !


## üîç V√©rification du cache

Lister tous les fichiers du cache.

In [21]:
import glob

cache_files = glob.glob('cache/*.json')

print(f"üìÅ Fichiers dans le cache : {len(cache_files)}\n")

if cache_files:
    # Trier par date de modification (plus r√©cent d'abord)
    cache_files.sort(key=os.path.getmtime, reverse=True)
    
    print("üïê Derniers fichiers modifi√©s :\n")
    for i, filepath in enumerate(cache_files[:10], 1):
        filename = os.path.basename(filepath)
        size = os.path.getsize(filepath) / 1024
        mod_time = datetime.fromtimestamp(os.path.getmtime(filepath))
        age_hours = (datetime.now() - mod_time).total_seconds() / 3600
        
        print(f"  {i}. {filename[:16]}... ({size:.1f} KB) - {age_hours:.1f}h")
    
    if len(cache_files) > 10:
        print(f"\n  ... et {len(cache_files) - 10} autres fichiers")
else:
    print("‚ö†Ô∏è Aucun fichier dans le cache")

üìÅ Fichiers dans le cache : 26

üïê Derniers fichiers modifi√©s :

  1. 8f163737c4f2ebdb... (8.6 KB) - 0.0h
  2. 0f8d17dd84b06ebe... (8.6 KB) - 0.0h
  3. fdb9c9b093deaa35... (8.6 KB) - 0.0h
  4. 97097004f8436d52... (8.7 KB) - 0.0h
  5. 1ac1d51a6b7feb72... (8.6 KB) - 0.0h
  6. 9a1f8cba129482b0... (8.6 KB) - 0.0h
  7. 717a4249268326e3... (23.4 KB) - 0.0h
  8. 13f7063be1fa22ac... (0.3 KB) - 0.0h
  9. d7fc7a90082e982d... (0.3 KB) - 0.0h
  10. 8639c41c0f404fb6... (0.3 KB) - 0.0h

  ... et 16 autres fichiers


---

## üí° Notes d'utilisation

### ‚úÖ Quand ex√©cuter ce notebook ?

1. **Premi√®re utilisation** : Collecter toutes les donn√©es initiales
2. **Avant chaque journ√©e** : Rafra√Æchir les statistiques
3. **Apr√®s les matchs** : Mettre √† jour avec les derniers r√©sultats

### üîÑ Gestion du cache

- **Dur√©e** : 24h par d√©faut
- **Persistence** : Les donn√©es restent disponibles m√™me apr√®s fermeture
- **Rafra√Æchissement** : D√©commentez `api.clear_cache()` pour forcer

### üìä Consommation API

**Premi√®re ex√©cution compl√®te** :
- Liste √©quipes : 1 appel
- Statistiques : ~20 appels
- Classement : 1 appel
- Head-to-head : ~6 appels
- **Total : ~28 appels** (28% du quota quotidien)

**Ex√©cutions suivantes** :
- Si cache valide : 0 appel API ! üéâ
- Si cache expir√© : Rafra√Æchissement automatique

### üéØ Prochaines √©tapes

1. ‚úÖ Donn√©es collect√©es et en cache
2. ‚û°Ô∏è Allez dans `predictions_ligue1.ipynb` ou `2_predictions_stats_avancees.ipynb`
3. üöÄ Ex√©cutez les pr√©dictions (sans appels API suppl√©mentaires !)

---

**Auteur** : Syst√®me de pr√©diction Ligue 1  
**Version** : 1.0  
**Date** : F√©vrier 2026

## ‚öΩ R√©cup√©rer les prochains matchs
# R√©cup√©rer les matchs du jour

In [28]:
today = datetime.now().strftime("%Y-%m-%d")
fixtures = api.get_fixtures(date=today)

if fixtures and fixtures['response']:
    print(f"üìÖ Matchs du {today}\n")
    for match in fixtures['response']:
        home = match['teams']['home']['name']
        away = match['teams']['away']['name']
        date_time = match['fixture']['date']
        status = match['fixture']['status']['long']
        
        print(f"üèüÔ∏è  {home} vs {away}")
        print(f"   ‚è∞ {date_time} - {status}\n")
else:
    print(f"Aucun match pr√©vu le {today}")
    print("\nüí° Astuce: Modifiez la date pour voir d'autres matchs")

üåê Appel API #1
üíæ Donn√©es sauvegard√©es dans le cache
üìÖ Matchs du 2026-02-08

üèüÔ∏è  Paris Saint Germain vs Marseille
   ‚è∞ 2026-02-08T19:45:00+00:00 - Halftime

üèüÔ∏è  Nice vs Monaco
   ‚è∞ 2026-02-08T14:00:00+00:00 - Match Finished

üèüÔ∏è  Angers vs Toulouse
   ‚è∞ 2026-02-08T16:15:00+00:00 - Match Finished

üèüÔ∏è  Auxerre vs Paris FC
   ‚è∞ 2026-02-08T16:15:00+00:00 - Match Finished

üèüÔ∏è  Le Havre vs Strasbourg
   ‚è∞ 2026-02-08T16:15:00+00:00 - Match Finished



## üìä R√©cup√©rer le classement de la Ligue 1
# R√©cup√©rer le classement

In [29]:
standings = api.get_standings()

if standings and standings['response']:
    teams_data = []
    for team in standings['response'][0]['league']['standings'][0]:
        teams_data.append({
            'Rang': team['rank'],
            '√âquipe': team['team']['name'],
            'Points': team['points'],
            'Jou√©s': team['all']['played'],
            'Victoires': team['all']['win'],
            'Nuls': team['all']['draw'],
            'D√©faites': team['all']['lose'],
            'BP': team['all']['goals']['for'],
            'BC': team['all']['goals']['against'],
            'Diff': team['goalsDiff'],
            'Forme': team.get('form', '-')  # Utiliser '-' si la forme n'est pas disponible
        })
    
    df_standings = pd.DataFrame(teams_data)
    print("üèÜ Classement Ligue 1")
    display(df_standings)
else:
    print("‚ùå Impossible de r√©cup√©rer le classement")
# Confrontations PSG (85) vs Marseille (81)
team1_id = 85  # PSG
team2_id = 81  # Marseille

h2h = api.get_head_to_head(team1_id, team2_id, last=5)

if h2h and h2h['response']:
    print(f"üîÑ Derni√®res confrontations\n")
    
    for match in h2h['response']:
        home = match['teams']['home']['name']
        away = match['teams']['away']['name']
        score_home = match['goals']['home']
        score_away = match['goals']['away']
        date = match['fixture']['date'][:10]
        
        print(f"üìÖ {date}: {home} {score_home} - {score_away} {away}")
    
    # Statistiques globales
    team1_wins = sum(1 for m in h2h['response'] if 
                     (m['teams']['home']['id'] == team1_id and m['goals']['home'] > m['goals']['away']) or
                     (m['teams']['away']['id'] == team1_id and m['goals']['away'] > m['goals']['home']))
    
    team2_wins = sum(1 for m in h2h['response'] if 
                     (m['teams']['home']['id'] == team2_id and m['goals']['home'] > m['goals']['away']) or
                     (m['teams']['away']['id'] == team2_id and m['goals']['away'] > m['goals']['home']))
    
    draws = len(h2h['response']) - team1_wins - team2_wins
    
    print(f"\nüìä Bilan: {team1_wins} victoires - {draws} nuls - {team2_wins} d√©faites")
else:
    print("‚ùå Impossible de r√©cup√©rer l'historique")

üì¶ Donn√©es en cache (√¢ge: 0.0h)
üèÜ Classement Ligue 1


Unnamed: 0,Rang,√âquipe,Points,Jou√©s,Victoires,Nuls,D√©faites,BP,BC,Diff,Forme
0,1,Lens,49,21,16,1,4,37,17,20,WWLWW
1,2,Paris Saint Germain,48,20,15,3,2,43,16,27,WWWWW
2,3,Lyon,42,21,13,3,5,34,20,14,WWWWW
3,4,Marseille,39,20,12,3,5,46,22,24,DWWLW
4,5,Lille,33,21,10,3,8,34,30,4,DLLLL
5,6,Strasbourg,31,21,9,4,8,34,26,8,LWWDD
6,7,Toulouse,31,21,8,7,6,31,23,8,DWWLW
7,8,Rennes,31,21,8,7,6,31,34,-3,LLLDW
8,9,Monaco,28,21,8,4,9,32,33,-1,DWDLL
9,10,Lorient,28,21,7,7,7,27,33,-6,LWWWD


üì¶ Donn√©es en cache (√¢ge: 0.0h)
üîÑ Derni√®res confrontations

üìÖ 2026-02-08: Paris Saint Germain 2 - 0 Marseille
üìÖ 2026-01-08: Paris Saint Germain 2 - 2 Marseille
üìÖ 2025-09-22: Marseille 1 - 0 Paris Saint Germain
üìÖ 2025-03-16: Paris Saint Germain 3 - 1 Marseille
üìÖ 2024-10-27: Marseille 0 - 3 Paris Saint Germain

üìä Bilan: 3 victoires - 1 nuls - 1 d√©faites


## üöÄ Prochaines √©tapes

Pour am√©liorer les pr√©dictions, vous pouvez :

1. **Collecter plus de donn√©es** : xG (expected goals), possession, tirs cadr√©s, etc.
2. **Machine Learning** : Utiliser scikit-learn pour entra√Æner un mod√®le
3. **Facteurs suppl√©mentaires** : 
   - Avantage du terrain (domicile/ext√©rieur)
   - Blessures et suspensions
   - M√©t√©o
   - Cotes des bookmakers
4. **Validation** : Tester les pr√©dictions sur des donn√©es historiques

### üìö IDs d'√©quipes principales de Ligue 1

- PSG: 85
- Marseille: 81
- Monaco: 91
- Lyon: 80
- Lille: 79
- Rennes: 94
- Nice: 33
- Lens: 116

## üìä Comparaison des Approches

Le projet propose 3 approches de pr√©diction :

| Crit√®re | Simple (ce notebook) | Stats Avanc√©es | ML |
|---------|---------------------|----------------|----|
| **Fichier** | `1_predictions_simples.ipynb` | `2_predictions_stats_avancees.ipynb` | `3_predictions_ml.ipynb` |
| **Entra√Ænement** | ‚ùå Non | ‚ùå Non | ‚úÖ Oui |
| **Domicile/Ext** | ‚ùå Non | ‚úÖ Oui | ‚úÖ Oui |
| **Head-to-head** | ‚ùå Non | ‚úÖ Oui | ‚úÖ Possible |
| **Transparence** | ‚úÖ Totale | ‚úÖ Totale | ‚ùå Bo√Æte noire |
| **Facteurs** | 3 | 6 | 20+ |
| **Temps calcul** | <1s | <5s | 10-15min |
| **Pr√©cision** | ~55-60% | ~60-65% | ~65-70% |

## üìö Documentation

- üìñ [M√©thodologie de l'approche simple](docs/prediction-simple.md)
- üìä [Documentation du projet](docs/README.md)
- üîó [API-Football](https://www.api-football.com/)

---

**Auteur** : Syst√®me de pr√©diction Ligue 1  
**Version** : 1.0 - Pr√©dictions Simples  
**Date** : F√©vrier 2026