# ‚öΩ Simulation Ligue des Champions ‚Äì Mod√®le simple de pr√©diction

Ce notebook propose une simulation simplifi√©e de la Ligue des Champions, inspir√©e de ton projet.

**Objectifs :**
- Cr√©er un dataset d'√©quipes avec un indice de performance
- Simuler des confrontations √† √©limination directe
- Estimer la probabilit√© pour chaque club d‚Äôatteindre les diff√©rentes phases
- Identifier les favoris et les outsiders

> üîÅ Les donn√©es sont simul√©es mais structur√©es comme un vrai cas d‚Äô√©tude.


## 1. Import des biblioth√®ques

In [None]:
import numpy as np
import pandas as pd
import random

import matplotlib.pyplot as plt
import seaborn as sns

%matplotlib inline

## 2. Cr√©ation d'un dataset d'√©quipes

On cr√©e une liste d‚Äô√©quipes avec :
- un coefficient de performance (inspir√© de l'historique LDC),
- une conf√©d√©ration (pour varier),
- un statut de "top club" ou non.


In [None]:
teams = [
    "Real Madrid", "FC Barcelona", "Bayern Munich", "Manchester City",
    "Liverpool", "Chelsea", "Paris Saint-Germain", "Juventus",
    "Atletico Madrid", "Borussia Dortmund", "Inter Milan", "AC Milan",
    "Arsenal", "Napoli", "RB Leipzig", "Tottenham"
]

# Indice de performance arbitraire (plus √©lev√© = plus fort)
performance_index = [
    95, 92, 93, 94,
    90, 88, 91, 87,
    86, 85, 84, 83,
    82, 81, 80, 79
]

clubs = pd.DataFrame({
    "Team": teams,
    "PerfIndex": performance_index
})

clubs

## 3. Fonction de simulation de match

On suppose que :
- la probabilit√© de victoire d√©pend du rapport des indices de performance,
- un match se joue sur un r√©sultat binaire (pas de match nul ici pour simplifier).

In [None]:
def simulate_match(team_a, team_b, df_clubs):
    """Simule un match entre deux √©quipes selon leur indice de performance.

    Retourne le nom de l'√©quipe gagnante.
    """
    perf_a = df_clubs.loc[df_clubs['Team'] == team_a, 'PerfIndex'].values[0]
    perf_b = df_clubs.loc[df_clubs['Team'] == team_b, 'PerfIndex'].values[0]
    
    # Probabilit√© de victoire pour A
    p_a = perf_a / (perf_a + perf_b)
    
    if random.random() < p_a:
        return team_a
    else:
        return team_b

## 4. Simulation d'une phase √† √©limination directe

On peut simuler :
- les huiti√®mes de finale
- les quarts
- les demies
- la finale

On part ici de 16 √©quipes directement en phase finale.

In [None]:
def simulate_round(teams_list, clubs_df, round_name="Round"):
    """Simule un tour (8e, quart, etc.) et renvoie les qualifi√©s."""
    random.shuffle(teams_list)
    winners = []
    print(f"\n=== {round_name} ===")
    for i in range(0, len(teams_list), 2):
        team_a = teams_list[i]
        team_b = teams_list[i+1]
        winner = simulate_match(team_a, team_b, clubs_df)
        print(f"{team_a} vs {team_b} ‚Üí {winner}")
        winners.append(winner)
    return winners

In [None]:
def simulate_knockout(clubs_df):
    """Simule une phase finale compl√®te et renvoie le vainqueur."""
    teams_round = clubs_df['Team'].tolist()
    
    r16 = simulate_round(teams_round, clubs_df, "Huiti√®mes de finale")
    qf = simulate_round(r16, clubs_df, "Quarts de finale")
    sf = simulate_round(qf, clubs_df, "Demi-finales")
    final = simulate_round(sf, clubs_df, "Finale")
    
    winner = final[0]
    print(f"\nüèÜ Vainqueur : {winner}\n")
    return winner

## 5. Exemple : une simulation compl√®te

In [None]:
winner_example = simulate_knockout(clubs)

## 6. Simulation Monte Carlo (1000 comp√©titions)

On r√©p√®te la simulation plusieurs fois pour estimer :
- la probabilit√© pour chaque club de remporter la comp√©tition.


In [None]:
N_SIM = 1000
winners = []

for _ in range(N_SIM):
    winners.append(simulate_knockout(clubs))

winners_series = pd.Series(winners)
win_counts = winners_series.value_counts().reindex(clubs['Team']).fillna(0)
win_probs = win_counts / N_SIM

win_probs

### Visualisation des probabilit√©s de victoire

In [None]:
plt.figure(figsize=(10,5))
sns.barplot(x=win_probs.index, y=win_probs.values)
plt.xticks(rotation=45)
plt.ylabel("Probabilit√© de remporter la LDC")
plt.title("Probabilit√©s de victoire (simulation Monte Carlo)")
plt.show()

## 7. Synth√®se par club

In [None]:
clubs_results = clubs.copy()
clubs_results['WinProb'] = win_probs.values
clubs_results.sort_values('WinProb', ascending=False)

## 8. Insights & Interpr√©tation

- Les clubs poss√©dant le plus fort indice de performance (ex : Real Madrid, Manchester City, Bayern) ont une probabilit√© de victoire nettement sup√©rieure.
- La simulation montre l'effet de la variabilit√© : m√™me un club moins bien class√© peut parfois gagner.
- On peut enrichir ce mod√®le en ajoutant :
  - la forme r√©cente,
  - des donn√©es de buts marqu√©s/encaiss√©s,
  - l'avantage domicile/ext√©rieur,
  - des blessures ou suspensions.

Ce notebook sert de base √† une d√©monstration de **simulation de tournoi** pour un poste de Marketing/Data Analyst.