In [8]:
import pandas as pd

In [9]:
match_data = pd.read_csv('./match.csv')

In [10]:
def analyze_team_performance(match_data):
    """
    Analyse les performances des équipes dans chaque ligue.
    
    Args:
        match_data (DataFrame): Données des matchs.
    
    Returns:
        DataFrame: Résumé des performances des équipes par ligue.
    """
    # Initialiser une liste pour stocker les performances des équipes
    performance_data = []
    
    # Parcourir les données et calculer les résultats
    for _, row in match_data.iterrows():
        # Extraction des informations nécessaires
        league = row['league_name']
        home_team = row['HomeTeam_long_name']
        away_team = row['AwayTeam_long_name']
        home_goals = row['home_team_goal']
        away_goals = row['away_team_goal']
        
        # Calcul des résultats
        if home_goals > away_goals:
            performance_data.append((league, home_team, 'Win'))
            performance_data.append((league, away_team, 'Loss'))
        elif home_goals < away_goals:
            performance_data.append((league, home_team, 'Loss'))
            performance_data.append((league, away_team, 'Win'))
        else:
            performance_data.append((league, home_team, 'Draw'))
            performance_data.append((league, away_team, 'Draw'))
    
    # Conversion en DataFrame
    performance_df = pd.DataFrame(performance_data, columns=['League', 'Team', 'Result'])
    
    # Résumer les performances
    team_summary = (
        performance_df.groupby(['League', 'Team', 'Result'])
        .size()
        .unstack(fill_value=0)
        .reset_index()
    )
    
    # Ajouter une colonne pour le total des victoires
    team_summary['Total_Effective'] = team_summary.get('Win', 0) - team_summary.get('Loss', 0)
    
    return team_summary.sort_values(by=['League', 'Total_Effective'], ascending=[True, False])


# Exécuter la fonction et afficher un aperçu des performances
team_performance = analyze_team_performance(match_data)
team_performance.sort_values(by='Total_Effective',ascending=False)

Result,League,Team,Draw,Loss,Win,Total_Effective
255,Spain LIGA BBVA,FC Barcelona,43,27,234,207
269,Spain LIGA BBVA,Real Madrid CF,36,40,228,188
232,Scotland Premier League,Celtic,50,36,218,182
212,Portugal Liga ZON Sagres,FC Porto,42,23,183,160
223,Portugal Liga ZON Sagres,SL Benfica,36,27,185,158
...,...,...,...,...,...,...
50,England Premier League,Sunderland,92,134,78,-56
241,Scotland Premier League,Kilmarnock,76,142,86,-56
230,Portugal Liga ZON Sagres,Vitória Setúbal,65,125,58,-67
247,Scotland Premier League,St. Mirren,74,131,61,-70


In [11]:
def get_top_3_teams_per_league(team_performance):
    """
    Identifie les 3 équipes les plus dominantes dans chaque ligue.
    
    Args:
        team_performance (DataFrame): Résumé des performances des équipes.
    
    Returns:
        DataFrame: Les 3 meilleures équipes par ligue.
    """
    # Trier par Ligue et par Efficacité Totale (décroissant)
    sorted_performance = team_performance.sort_values(
        by=['League', 'Total_Effective'], ascending=[True, False]
    )
    
    # Sélectionner les 3 meilleures équipes par ligue
    top_teams = sorted_performance.groupby('League').head(3)
    
    return top_teams

# Identifier les 3 équipes les plus dominantes dans chaque ligue
top_3_teams = get_top_3_teams_per_league(team_performance)
top_3_teams


Result,League,Team,Draw,Loss,Win,Total_Effective
15,Belgium Jupiler League,RSC Anderlecht,49,27,136,109
1,Belgium Jupiler League,Club Brugge KV,40,49,123,74
3,Belgium Jupiler League,KAA Gent,55,54,109,55
41,England Premier League,Manchester United,57,55,192,137
33,England Premier League,Chelsea,70,58,176,118
24,England Premier League,Arsenal,73,61,170,109
82,France Ligue 1,Paris Saint-Germain,76,53,175,122
75,France Ligue 1,LOSC Lille,92,65,147,82
80,France Ligue 1,Olympique Lyonnais,80,71,153,82
104,Germany 1. Bundesliga,FC Bayern Munich,44,35,193,158
