# üéØ Pr√©dictions Ligue 1 - Approche Simple

Ce notebook utilise une m√©thode de pr√©diction **simple et transparente** bas√©e sur un score composite.

## ‚ö†Ô∏è Pr√©requis Important

**Avant d'utiliser ce notebook**, vous devez d'abord ex√©cuter :

### üì• `0_collecte_donnees.ipynb`

Ce notebook collecte et met en cache toutes les donn√©es n√©cessaires (statistiques, classement, etc.).

**Sans cette √©tape**, ce notebook ne pourra pas fonctionner car il utilise **uniquement les donn√©es du cache** (aucun appel API direct).

---

## üéØ M√©thodologie

### Score Composite

$$\text{Score} = \text{Forme} + (\text{Buts marqu√©s} - \text{Buts encaiss√©s}) \times 0.5$$

**Composantes :**
- **Forme r√©cente** : W=3, D=1, L=0 (maximum 15 points pour 5 matchs)
- **Diff√©rence de buts pond√©r√©e** : Coefficient 0.5 pour √©quilibrer

### Seuil de D√©cision

- Diff√©rence > 2 points ‚Üí Victoire probable
- Diff√©rence ‚â§ 2 points ‚Üí Match serr√©

### Caract√©ristiques

‚úÖ **Simple** : Formule transparente  
‚úÖ **Rapide** : Calcul instantan√©  
‚úÖ **Sans API** : Pas d'appels API dans ce notebook  
‚ùå **Limites** : Ne prend pas en compte domicile/ext√©rieur  

üìñ **[Documentation compl√®te de la m√©thode](docs/prediction-simple.md)**

## üìã Pr√©requis

1. Obtenir une cl√© API gratuite sur [API-Football](https://www.api-football.com/) (100 requ√™tes/jour)
2. Installer les d√©pendances n√©cessaires

In [1]:
# Installation des d√©pendances (√† ex√©cuter une seule fois)
# !pip install requests pandas numpy scikit-learn python-dotenv

import requests
import json
from datetime import datetime, timedelta
import pandas as pd
import numpy as np

In [2]:
# Configuration - Chargement depuis .env
import os
from dotenv import load_dotenv

# Charger les variables d'environnement depuis le fichier .env
load_dotenv()

API_KEY = os.getenv("API_FOOTBALL_KEY", "votre_cl√©_api_ici")  # ‚ö†Ô∏è Configurez dans .env
LIGUE1_ID = int(os.getenv("LIGUE1_ID", 61))
CURRENT_SEASON = int(os.getenv("CURRENT_SEASON", 2025))

print(f"‚úÖ Configuration charg√©e : Ligue {LIGUE1_ID}, Saison {CURRENT_SEASON}")
print(f"üìÖ Saison {CURRENT_SEASON}-{CURRENT_SEASON+1}")
if API_KEY == "votre_cl√©_api_ici":
    print("‚ö†Ô∏è N'oubliez pas de configurer votre API_FOOTBALL_KEY dans le fichier .env")

‚úÖ Configuration charg√©e : Ligue 61, Saison 2025
üìÖ Saison 2025-2026


### üìÖ Note sur les saisons

L'API-Football utilise l'**ann√©e de d√©but** de saison :
- Saison 2025-2026 (en cours) ‚Üí `CURRENT_SEASON = 2025`
- Saison 2024-2025 (termin√©e) ‚Üí `CURRENT_SEASON = 2024`

En Ligue 1, la saison va d'ao√ªt √† mai de l'ann√©e suivante.

## üîß Classe FootballAPI

Classe pour interagir facilement avec l'API-Football. La cl√© API est charg√©e automatiquement depuis le fichier `.env`.

In [3]:
import time
import os
import hashlib

class FootballAPI:
    """Classe pour interagir avec l'API-Football avec syst√®me de cache sur disque"""
    
    def __init__(self, api_key, league_id=61, season=2026, cache_duration=3600, cache_dir='cache'):
        self.base_url = "https://v3.football.api-sports.io"
        self.headers = {'x-apisports-key': api_key}
        self.league_id = league_id
        self.season = season
        self.cache_duration = cache_duration  # Dur√©e du cache en secondes (1h par d√©faut)
        self.cache_dir = cache_dir
        self.api_calls = 0  # Compteur d'appels API
        
        # Cr√©er le dossier cache s'il n'existe pas
        if not os.path.exists(self.cache_dir):
            os.makedirs(self.cache_dir)
            print(f"üìÅ Dossier cache cr√©√©: {self.cache_dir}")
    
    def _get_cache_key(self, endpoint, params):
        """G√©n√®re une cl√© unique pour le cache"""
        params_str = '&'.join([f"{k}={v}" for k, v in sorted(params.items())])
        return f"{endpoint}?{params_str}"
    
    def _get_cache_filename(self, cache_key):
        """G√©n√®re un nom de fichier s√©curis√© √† partir de la cl√© de cache"""
        # Utiliser un hash MD5 pour cr√©er un nom de fichier unique et s√ªr
        hash_key = hashlib.md5(cache_key.encode()).hexdigest()
        return os.path.join(self.cache_dir, f"{hash_key}.json")
    
    def _get_from_cache(self, cache_key):
        """R√©cup√®re les donn√©es du cache fichier si elles sont encore valides"""
        cache_file = self._get_cache_filename(cache_key)
        
        if os.path.exists(cache_file):
            # V√©rifier l'√¢ge du fichier
            file_age = time.time() - os.path.getmtime(cache_file)
            
            if file_age < self.cache_duration:
                try:
                    with open(cache_file, 'r', encoding='utf-8') as f:
                        data = json.load(f)
                    print(f"üì¶ Donn√©es r√©cup√©r√©es du cache fichier (√¢ge: {int(file_age/60)}min)")
                    return data
                except Exception as e:
                    print(f"‚ö†Ô∏è Erreur lecture cache: {e}")
                    return None
            else:
                print(f"‚è∞ Cache expir√© (√¢ge: {int(file_age/3600):.1f}h)")
        
        return None
    
    def _save_to_cache(self, cache_key, data):
        """Sauvegarde les donn√©es dans un fichier cache"""
        cache_file = self._get_cache_filename(cache_key)
        
        try:
            with open(cache_file, 'w', encoding='utf-8') as f:
                json.dump(data, f, ensure_ascii=False, indent=2)
            print(f"üíæ Donn√©es sauvegard√©es dans le cache")
        except Exception as e:
            print(f"‚ö†Ô∏è Erreur sauvegarde cache: {e}")
    
    def _make_request(self, endpoint, params):
        """Fait une requ√™te API avec gestion du cache fichier"""
        cache_key = self._get_cache_key(endpoint, params)
        
        # V√©rifier le cache d'abord
        cached_data = self._get_from_cache(cache_key)
        if cached_data is not None:
            return cached_data
        
        # Si pas en cache, faire l'appel API
        url = f"{self.base_url}{endpoint}"
        response = requests.get(url, headers=self.headers, params=params)
        self.api_calls += 1
        print(f"üåê Appel API #{self.api_calls}")
        
        if response.status_code == 200:
            data = response.json()
            self._save_to_cache(cache_key, data)
            return data
        else:
            print(f"‚ùå Erreur API: {response.status_code}")
        return None
    
    def get_fixtures(self, date=None, team_id=None):
        """R√©cup√®re les matchs de la Ligue 1"""
        params = {'league': self.league_id, 'season': self.season}
        
        if date:
            params['date'] = date  # Format: YYYY-MM-DD
        if team_id:
            params['team'] = team_id
        
        return self._make_request('/fixtures', params)
    
    def get_team_statistics(self, team_id):
        """R√©cup√®re les statistiques d'une √©quipe"""
        params = {
            'league': self.league_id,
            'season': self.season,
            'team': team_id
        }
        return self._make_request('/teams/statistics', params)
    
    def get_head_to_head(self, team1_id, team2_id, last=10):
        """R√©cup√®re l'historique des confrontations"""
        params = {'h2h': f"{team1_id}-{team2_id}", 'last': last}
        return self._make_request('/fixtures/headtohead', params)
    
    def get_standings(self):
        """R√©cup√®re le classement de la Ligue 1"""
        params = {'league': self.league_id, 'season': self.season}
        return self._make_request('/standings', params)
    
    def get_teams(self):
        """R√©cup√®re la liste des √©quipes de la Ligue 1"""
        params = {'league': self.league_id, 'season': self.season}
        return self._make_request('/teams', params)
    
    def clear_cache(self):
        """Vide le cache en supprimant tous les fichiers"""
        if os.path.exists(self.cache_dir):
            files = os.listdir(self.cache_dir)
            for file in files:
                if file.endswith('.json'):
                    os.remove(os.path.join(self.cache_dir, file))
            print(f"üóëÔ∏è Cache vid√© ({len(files)} fichiers supprim√©s)")
        else:
            print("üìÅ Dossier cache inexistant")
    
    def get_cache_stats(self):
        """Affiche les statistiques du cache"""
        if os.path.exists(self.cache_dir):
            files = [f for f in os.listdir(self.cache_dir) if f.endswith('.json')]
            total_size = sum(os.path.getsize(os.path.join(self.cache_dir, f)) for f in files)
            
            print(f"üìä Statistiques du cache:")
            print(f"   - Fichiers en cache: {len(files)}")
            print(f"   - Taille totale: {total_size / 1024:.2f} KB")
            print(f"   - Appels API effectu√©s: {self.api_calls}")
            print(f"   - Dur√©e de validit√©: {self.cache_duration}s ({self.cache_duration/3600:.1f}h)")
            print(f"   - Dossier: {os.path.abspath(self.cache_dir)}")
        else:
            print(f"üìÅ Dossier cache inexistant")

# Initialisation de l'API avec cache (1 heure par d√©faut)
api = FootballAPI(API_KEY, LIGUE1_ID, CURRENT_SEASON, cache_duration=3600)
print("‚úÖ API initialis√©e avec syst√®me de cache sur disque")

‚úÖ API initialis√©e avec syst√®me de cache sur disque


## üíæ Gestion du cache

Le syst√®me de cache permet d'√©conomiser les appels API en sauvegardant les donn√©es dans le dossier `cache/` :
- Les donn√©es sont stock√©es dans des fichiers JSON pendant 1 heure par d√©faut
- Affichage de l'origine des donn√©es (cache üì¶ ou API üåê)
- Compteur d'appels API r√©els
- Cache persistant entre les sessions du notebook

In [4]:
# Afficher les statistiques du cache
api.get_cache_stats()

üìä Statistiques du cache:
   - Fichiers en cache: 27
   - Taille totale: 156.38 KB
   - Appels API effectu√©s: 0
   - Dur√©e de validit√©: 3600s (1.0h)
   - Dossier: c:\Users\nboud\Documents\GitHub-My-Projects\predictions-football-fr-python\cache


In [5]:
# Vider le cache pour forcer une mise √† jour depuis l'API
# api.clear_cache()
print("\nüí° Relancez maintenant les cellules de donn√©es (statistiques, classement, etc.)")


üí° Relancez maintenant les cellules de donn√©es (statistiques, classement, etc.)


## üìà Statistiques d'une √©quipe

Exemple avec le PSG (ID: 85), Monaco (ID: 91), Marseille (ID: 81)

In [6]:
# Statistiques d'une √©quipe (exemple: PSG = 85)
team_id = 85  # Changez l'ID pour une autre √©quipe

team_stats = api.get_team_statistics(team_id)

if team_stats and team_stats['response']:
    stats = team_stats['response']
    team_name = stats['team']['name']
    
    print(f"üìä Statistiques de {team_name}\n")
    print(f"üéØ Buts marqu√©s: {stats['goals']['for']['total']['total']}")
    print(f"ü•Ö Buts encaiss√©s: {stats['goals']['against']['total']['total']}")
    
    # V√©rifier si la forme est disponible
    form = stats.get('form')
    if form:
        print(f"üìç Forme r√©cente: {form}")
    else:
        print(f"üìç Forme r√©cente: Non disponible")
    
    print(f"üè† Victoires √† domicile: {stats['fixtures']['wins']['home']}")
    print(f"‚úàÔ∏è Victoires √† l'ext√©rieur: {stats['fixtures']['wins']['away']}")
    print(f"ü§ù Matchs nuls: {stats['fixtures']['draws']['total']}")
    
    # Analyse de la forme (si disponible)
    if form:
        wins = form.count('W')
        draws = form.count('D')
        losses = form.count('L')
        print(f"\nüìâ Derniers {len(form)} matchs: {wins}V - {draws}N - {losses}D")
else:
    print("‚ùå Impossible de r√©cup√©rer les statistiques")

üì¶ Donn√©es r√©cup√©r√©es du cache fichier (√¢ge: 9min)
üìä Statistiques de Paris Saint Germain

üéØ Buts marqu√©s: 43
ü•Ö Buts encaiss√©s: 16
üìç Forme r√©cente: WWWWLWDDWDWWWLWWWWWW
üè† Victoires √† domicile: 8
‚úàÔ∏è Victoires √† l'ext√©rieur: 7
ü§ù Matchs nuls: 3

üìâ Derniers 20 matchs: 15V - 3N - 2D


In [7]:
# Test rapide: V√©rifier la configuration
print("‚úÖ Notebook pr√™t √† l'emploi!")
print("\nüí° N'oubliez pas:")
print("   1. Configurer votre API_FOOTBALL_KEY dans le fichier .env")
print("   2. Vous avez 100 requ√™tes/jour avec le plan gratuit")
print("   3. Le syst√®me de cache √©conomise automatiquement vos appels API")
print("   4. Ex√©cutez les cellules dans l'ordre pour d√©couvrir les fonctionnalit√©s")

‚úÖ Notebook pr√™t √† l'emploi!

üí° N'oubliez pas:
   1. Configurer votre API_FOOTBALL_KEY dans le fichier .env
   2. Vous avez 100 requ√™tes/jour avec le plan gratuit
   3. Le syst√®me de cache √©conomise automatiquement vos appels API
   4. Ex√©cutez les cellules dans l'ordre pour d√©couvrir les fonctionnalit√©s


## üéØ Pr√©diction Simple bas√©e sur les statistiques

Exemple de fonction de pr√©diction basique utilisant la forme r√©cente et les statistiques

In [8]:
def calculate_form_score(form_string):
    """Calcule un score bas√© sur la forme r√©cente (W=3, D=1, L=0)"""
    if not form_string:
        return 0
    score = 0
    for result in form_string:
        if result == 'W':
            score += 3
        elif result == 'D':
            score += 1
    return score

def simple_prediction(team1_id, team2_id):
    """Pr√©diction simple bas√©e sur les statistiques"""
    
    # R√©cup√©rer les statistiques des deux √©quipes
    stats1 = api.get_team_statistics(team1_id)
    stats2 = api.get_team_statistics(team2_id)
    
    if not stats1 or not stats2:
        return "‚ùå Impossible de faire une pr√©diction"
    
    team1 = stats1['response']
    team2 = stats2['response']
    
    # Calcul des scores (utiliser .get() pour g√©rer les valeurs None)
    form1 = calculate_form_score(team1.get('form'))
    form2 = calculate_form_score(team2.get('form'))
    
    goals1 = team1['goals']['for']['total']['total']
    goals2 = team2['goals']['for']['total']['total']
    
    conceded1 = team1['goals']['against']['total']['total']
    conceded2 = team2['goals']['against']['total']['total']
    
    # Score composite (forme + buts marqu√©s - buts encaiss√©s)
    score1 = form1 + (goals1 - conceded1) * 0.5
    score2 = form2 + (goals2 - conceded2) * 0.5
    
    # Affichage
    print(f"‚öîÔ∏è  {team1['team']['name']} vs {team2['team']['name']}\n")
    print(f"üìä Analyse:")
    print(f"   {team1['team']['name']}: Forme={form1}, Buts={goals1}, Encaiss√©s={conceded1}")
    print(f"   {team2['team']['name']}: Forme={form2}, Buts={goals2}, Encaiss√©s={conceded2}")
    print(f"\nüíØ Scores de pr√©diction:")
    print(f"   {team1['team']['name']}: {score1:.1f}")
    print(f"   {team2['team']['name']}: {score2:.1f}")
    
    # Pr√©diction
    if score1 > score2 + 2:
        prediction = f"üèÜ Victoire probable de {team1['team']['name']}"
    elif score2 > score1 + 2:
        prediction = f"üèÜ Victoire probable de {team2['team']['name']}"
    else:
        prediction = "ü§ù Match serr√©, r√©sultat incertain"
    
    print(f"\n{prediction}")
    
    return prediction

# Exemple de pr√©diction: PSG vs Marseille
simple_prediction(85, 81)

üì¶ Donn√©es r√©cup√©r√©es du cache fichier (√¢ge: 9min)
üì¶ Donn√©es r√©cup√©r√©es du cache fichier (√¢ge: 9min)
‚öîÔ∏è  Paris Saint Germain vs Marseille

üìä Analyse:
   Paris Saint Germain: Forme=48, Buts=43, Encaiss√©s=16
   Marseille: Forme=39, Buts=46, Encaiss√©s=22

üíØ Scores de pr√©diction:
   Paris Saint Germain: 61.5
   Marseille: 51.0

üèÜ Victoire probable de Paris Saint Germain


'üèÜ Victoire probable de Paris Saint Germain'

## üîÑ Confrontations directes (Head-to-Head)

Analyser l'historique entre deux √©quipes