## Imports et Chargment des donn√©es 

In [1]:
import pandas as pd
from pathlib import Path

In [2]:
match_final_kpi = pd.read_csv(Path("../data/clean/matches_final_kpi.csv"))
dim_teams = pd.read_csv(Path("../data/clean/dim_teams.csv"))
home_stats_normalized = pd.read_csv(Path("../data/clean/home_stats_normalized.csv"))
away_stats_normalized = pd.read_csv(Path("../data/clean/away_stats_normalized.csv"))
matches_normalized = pd.read_csv(Path("../data/clean/matches_normalized.csv"))
teams_reference_normalized = pd.read_csv(Path("../data/clean/teams_reference_normalized.csv"))

print(match_final_kpi.shape, dim_teams.shape, home_stats_normalized.shape, away_stats_normalized.shape, matches_normalized.shape, teams_reference_normalized.shape)

(6814, 11) (228, 6) (6814, 4) (6814, 4) (6814, 7) (228, 2)


# Visualisation de la donn√©e 

In [3]:
display(dim_teams.head(),
        match_final_kpi.head(),
        home_stats_normalized.head(),
        away_stats_normalized.head(),
        matches_normalized.head(),
        teams_reference_normalized.head())

Unnamed: 0,team_canonical,team_clean_example,canonical_key,iso2,iso3,team_id
0,Afghanistan,Afghanistan,afghanistan,,,1
1,Albania,Albania,albania,,,2
2,Algeria,Algeria,algeria,,,3
3,American Samoa,American Samoa,americansamoa,,,4
4,Andorra,Andorra,andorra,,,5


Unnamed: 0,id_match,home_team,away_team,home_result,away_result,result,date,round,city,edition,is_final
0,1,France,Mexico,4,1,France,1930-07-13,Group,Montevideo,1930,True
1,2,Romania,Peru,3,1,Romania,1930-07-14,Group,Montevideo,1930,True
2,3,Yugoslavia,Brazil,2,1,Yugoslavia,1930-07-14,Group,Montevideo,1930,True
3,4,Argentina,France,1,0,Argentina,1930-07-15,Group,Montevideo,1930,True
4,5,Chile,Mexico,3,0,Chile,1930-07-16,Group,Montevideo,1930,True


Unnamed: 0,id_match,id_team,Number_of_goals_scored,Number_of_goals_conceded
0,1,77,4,1
1,2,164,3,1
2,3,226,2,1
3,4,10,1,0
4,5,41,3,0


Unnamed: 0,id_match,id_team,Number_of_goals_scored,Number_of_goals_conceded
0,1,131,1,4
1,2,157,1,3
2,3,28,1,2
3,4,77,0,1
4,5,131,0,3


Unnamed: 0,id_match,result,date,round,city,edition,is_final
0,1,77,1930-07-13,Group,Montevideo,1930,False
1,2,164,1930-07-14,Group,Montevideo,1930,False
2,3,226,1930-07-14,Group,Montevideo,1930,False
3,4,10,1930-07-15,Group,Montevideo,1930,False
4,5,41,1930-07-16,Group,Montevideo,1930,False


Unnamed: 0,id_team,Team_name
0,1,Afghanistan
1,2,Albania
2,3,Algeria
3,4,American Samoa
4,5,Andorra


# üìä ANALYSE EXPLORATOIRE & DATA STORY FIFA WORLD CUP
## Histoire des Coupes du Monde √† travers les donn√©es (1930-2022)

Cette analyse r√©v√®le **92 ans d'histoire footballistique** √† travers les matchs, buts, et performances des √©quipes nationales.

In [4]:
# Import des biblioth√®ques de visualisation
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots
import numpy as np

# Configuration globale des graphiques
plt.style.use('default')
sns.set_palette("husl")
px.defaults.template = "plotly_white"

print("‚úÖ Biblioth√®ques de visualisation charg√©es")

‚úÖ Biblioth√®ques de visualisation charg√©es


## üåç CHAPITRE 1 : Vue d'ensemble - L'√©volution du football mondial
### Combien de matchs, de buts, d'√©quipes ? Que nous disent les chiffres globaux ?

In [36]:
matches_normalized[(matches_normalized["is_final"]== True)]["round"].value_counts()

round
Quarter-finals    82
Semi-finals       62
Final             44
Name: count, dtype: int64

In [38]:
match_final_kpi[match_final_kpi["edition"]== 2018].shape

(16, 11)

In [37]:
match_final_kpi[match_final_kpi["is_final"]== True].groupby('edition').size().reset_index(name='nb_matches').tail()

Unnamed: 0,edition,nb_matches
17,2006,74
18,2010,62
19,2014,65
20,2018,16
21,2022,64


In [34]:
# üìà VISUALISATION 1 : √âvolution du nombre de matchs par Coupe du Monde
matches_by_edition = match_final_kpi[match_final_kpi["is_final"]== True].groupby('edition').size().reset_index(name='nb_matches')
matches_by_edition['edition'] = matches_by_edition['edition'].astype(int)

fig = px.bar(matches_by_edition.sort_values('edition'), 
             x='edition', y='nb_matches',
             title="üèÜ √âvolution du nombre de matchs par Coupe du Monde (1930-2022)",
             labels={'edition': 'Ann√©e de la Coupe du Monde', 'nb_matches': 'Nombre de matchs'},
             color='nb_matches',
             color_continuous_scale='viridis')

fig.update_layout(height=500)
fig.show()

print(f"üìä Insight: De {matches_by_edition['nb_matches'].min()} matchs en 1930 √† {matches_by_edition['nb_matches'].max()} matchs au maximum")

üìä Insight: De 15 matchs en 1930 √† 74 matchs au maximum


In [45]:
# üéØ VISUALISATION 2 : Total des buts par √©dition - L'explosion offensive
# Calcul des buts totaux par match puis par √©dition
goals_by_match = pd.merge(matches_normalized[matches_normalized["is_final"]==True], home_stats_normalized, on='id_match', how='inner')
goals_by_match = pd.merge(goals_by_match, away_stats_normalized, on='id_match', suffixes=('_home', '_away'), how='inner')
goals_by_match['total_goals'] = goals_by_match['Number_of_goals_scored_home'] + goals_by_match['Number_of_goals_scored_away']

goals_by_edition = goals_by_match.groupby('edition').agg({
    'total_goals': 'sum',
    'id_match': 'count'
}).reset_index()
goals_by_edition['avg_goals_per_match'] = goals_by_edition['total_goals'] / goals_by_edition['id_match']
goals_by_edition['edition'] = goals_by_edition['edition'].astype(int)

# Graphique double axe
fig = make_subplots(specs=[[{"secondary_y": True}]])

fig.add_trace(go.Bar(x=goals_by_edition['edition'], y=goals_by_edition['total_goals'], 
                     name="Total buts", marker_color='lightblue'), secondary_y=False)

fig.add_trace(go.Scatter(x=goals_by_edition['edition'], y=goals_by_edition['avg_goals_per_match'], 
                         mode='lines+markers', name="Moyenne buts/match", 
                         line=dict(color='red', width=3)), secondary_y=True)

fig.update_xaxes(title_text="Ann√©e")
fig.update_yaxes(title_text="Total buts", secondary_y=False)
fig.update_yaxes(title_text="Buts par match", secondary_y=True)
fig.update_layout(title="‚öΩ √âvolution des buts : Total vs Moyenne par match")
fig.show()

print(f"üéØ L'√©dition la plus prolifique: {goals_by_edition.loc[goals_by_edition['total_goals'].idxmax(), 'edition']} avec {goals_by_edition['total_goals'].max()} buts")

üéØ L'√©dition la plus prolifique: 1938 avec 78 buts


In [75]:
goals_by_match["total_goals"].sum()

620

In [76]:
# üá´üá∑ ANALYSE SP√âCIALE : Performance de l'√©quipe de France
print("üá´üá∑ ANALYSE √âQUIPE DE FRANCE - COUPE DU MONDE")
print("=" * 55)

# Filtrer les donn√©es pour la France uniquement
france_stats = combined_stats[(combined_stats['Team_name'] == 'France')].copy()

if len(france_stats) > 0:
    # Statistiques g√©n√©rales
    total_matches_france = len(france_stats)
    total_goals_scored = france_stats['Number_of_goals_scored'].sum()
    total_goals_conceded = france_stats['Number_of_goals_conceded'].sum()
    goal_difference = total_goals_scored - total_goals_conceded
    
    # Calcul des victoires, nuls, d√©faites
    # On r√©cup√®re les matchs avec r√©sultats d√©taill√©s
    france_detailed = []
    for _, match in france_stats.iterrows():
        match_id = match['id_match']
        # R√©cup√©rer le score du match
        home_stat = home_stats_normalized[home_stats_normalized['id_match'] == match_id]
        away_stat = away_stats_normalized[away_stats_normalized['id_match'] == match_id]
        
        if not home_stat.empty and not away_stat.empty:
            home_goals = home_stat['Number_of_goals_scored'].iloc[0]
            away_goals = away_stat['Number_of_goals_scored'].iloc[0]
            
            # D√©terminer si la France √©tait √† domicile ou ext√©rieur
            if match['location'] == 'home':
                france_goals = home_goals
                opponent_goals = away_goals
            else:
                france_goals = away_goals
                opponent_goals = home_goals
            
            if france_goals > opponent_goals:
                result = 'Victoire'
            elif france_goals < opponent_goals:
                result = 'D√©faite'
            else:
                result = 'Match Nul'
                
            france_detailed.append({
                'result': result,
                'france_goals': france_goals,
                'opponent_goals': opponent_goals
            })
    
    # Compter les r√©sultats
    france_results = pd.DataFrame(france_detailed)
    if not france_results.empty:
        victories = len(france_results[france_results['result'] == 'Victoire'])
        draws = len(france_results[france_results['result'] == 'Match Nul'])
        defeats = len(france_results[france_results['result'] == 'D√©faite'])
        
        # Pourcentage de r√©ussite (victoires + nuls)
        success_rate = ((victories + draws) / total_matches_france) * 100
        victory_rate = (victories / total_matches_france) * 100
    else:
        victories = draws = defeats = 0
        success_rate = victory_rate = 0
    
    print(f"üìä STATISTIQUES G√âN√âRALES")
    print(f"   ‚Ä¢ Nombre total de matchs jou√©s : {total_matches_france}")
    print(f"   ‚Ä¢ Participations en Coupe du Monde analys√©es")
    
    print(f"\nüèÜ BILAN SPORTIF")
    print(f"   ‚Ä¢ Victoires : {victories} ({victory_rate:.1f}%)")
    print(f"   ‚Ä¢ Matchs nuls : {draws} ({(draws/total_matches_france)*100 if total_matches_france > 0 else 0:.1f}%)")
    print(f"   ‚Ä¢ D√©faites : {defeats} ({(defeats/total_matches_france)*100 if total_matches_france > 0 else 0:.1f}%)")
    
    print(f"\n‚öΩ STATISTIQUES OFFENSIVES/D√âFENSIVES")
    print(f"   ‚Ä¢ Buts marqu√©s : {total_goals_scored}")
    print(f"   ‚Ä¢ Buts encaiss√©s : {total_goals_conceded}")
    print(f"   ‚Ä¢ Diff√©rence de buts : {goal_difference:+d}")
    print(f"   ‚Ä¢ Moyenne buts marqu√©s/match : {total_goals_scored/total_matches_france:.2f}")
    print(f"   ‚Ä¢ Moyenne buts encaiss√©s/match : {total_goals_conceded/total_matches_france:.2f}")
    
    print(f"\nüéØ TAUX DE R√âUSSITE")
    print(f"   ‚Ä¢ Pourcentage de victoires : {victory_rate:.1f}%")
    print(f"   ‚Ä¢ Pourcentage de r√©ussite (V+N) : {success_rate:.1f}%")
    
    # Conclusion dynamique
    print(f"\nüí° CONCLUSION")
    if goal_difference > 0:
        offensive_performance = "solide attaque"
    elif goal_difference == 0:
        offensive_performance = "√©quilibre offensif-d√©fensif"
    else:
        offensive_performance = "d√©fense √† am√©liorer"
    
    if victory_rate > 50:
        overall_performance = "excellente performance"
    elif victory_rate > 33:
        overall_performance = "performance honorable"
    else:
        overall_performance = "marge de progression importante"
    
    print(f"   üá´üá∑ La France affiche une {overall_performance} en Coupe du Monde")
    print(f"   üìà Avec {total_matches_france} matchs et une {offensive_performance}")
    print(f"   üèÜ Taux de r√©ussite de {success_rate:.1f}% (victoires + nuls)")
    
    if goal_difference > 10:
        print(f"   ‚≠ê Diff√©rentiel de +{goal_difference} buts t√©moigne d'une grande efficacit√©")
    elif goal_difference > 0:
        print(f"   ‚úÖ Diff√©rentiel positif de +{goal_difference} buts, signe d'une √©quipe comp√©titive")
    elif goal_difference == 0:
        print(f"   ‚öñÔ∏è √âquilibre parfait entre attaque et d√©fense")
    else:
        print(f"   ‚ö†Ô∏è Diff√©rentiel n√©gatif de {goal_difference} buts, axes d'am√©lioration identifi√©s")

else:
    print("‚ùå Aucune donn√©e trouv√©e pour l'√©quipe de France")
    print("   V√©rifier l'orthographe : 'France' dans les donn√©es")

üá´üá∑ ANALYSE √âQUIPE DE FRANCE - COUPE DU MONDE
üìä STATISTIQUES G√âN√âRALES
   ‚Ä¢ Nombre total de matchs jou√©s : 8
   ‚Ä¢ Participations en Coupe du Monde analys√©es

üèÜ BILAN SPORTIF
   ‚Ä¢ Victoires : 7 (87.5%)
   ‚Ä¢ Matchs nuls : 0 (0.0%)
   ‚Ä¢ D√©faites : 1 (12.5%)

‚öΩ STATISTIQUES OFFENSIVES/D√âFENSIVES
   ‚Ä¢ Buts marqu√©s : 20
   ‚Ä¢ Buts encaiss√©s : 6
   ‚Ä¢ Diff√©rence de buts : +14
   ‚Ä¢ Moyenne buts marqu√©s/match : 2.50
   ‚Ä¢ Moyenne buts encaiss√©s/match : 0.75

üéØ TAUX DE R√âUSSITE
   ‚Ä¢ Pourcentage de victoires : 87.5%
   ‚Ä¢ Pourcentage de r√©ussite (V+N) : 87.5%

üí° CONCLUSION
   üá´üá∑ La France affiche une excellente performance en Coupe du Monde
   üìà Avec 8 matchs et une solide attaque
   üèÜ Taux de r√©ussite de 87.5% (victoires + nuls)
   ‚≠ê Diff√©rentiel de +14 buts t√©moigne d'une grande efficacit√©


## üèüÔ∏è CHAPITRE 2 : Avantage du terrain - Home vs Away
### Le mythe de l'avantage √† domicile r√©siste-t-il √† l'analyse des Coupes du Monde ?

In [None]:
matches_normalized

In [None]:
# üè† VISUALISATION 3 : Performance Home vs Away - Le verdict des donn√©es
# Comparaison des performances domicile vs ext√©rieur
home_away_comparison = pd.merge(home_stats_normalized, away_stats_normalized, on='id_match', suffixes=('_home', '_away'))

# Classification des r√©sultats
def classify_result(row):
    if row['number_of_goals_scored_home'] > row['number_of_goals_scored_away']:
        return 'Victoire Domicile'
    elif row['number_of_goals_scored_home'] < row['number_of_goals_scored_away']:
        return 'Victoire Ext√©rieur'
    else:
        return 'Match Nul'

home_away_comparison['result_type'] = home_away_comparison.apply(classify_result, axis=1)
result_counts = home_away_comparison['result_type'].value_counts()

# Graphique en camembert avec style moderne
fig = px.pie(values=result_counts.values, names=result_counts.index,
             title="üèüÔ∏è R√©partition des r√©sultats : Domicile vs Ext√©rieur vs Nul",
             color_discrete_sequence=['#FF6B6B', '#4ECDC4', '#45B7D1'])

fig.update_traces(textposition='inside', textinfo='percent+label', textfont_size=12)
fig.update_layout(height=500)
fig.show()

print("üìä Statistiques d√©taill√©es:")
for result_type, count in result_counts.items():
    percentage = (count / len(home_away_comparison)) * 100
    print(f"   {result_type}: {count} matchs ({percentage:.1f}%)")

## üëë CHAPITRE 3 : Les l√©gendes du football - Top √©quipes
### Qui sont les vrais ma√Ætres des Coupes du Monde ? Analyse des performances par √©quipe

In [50]:
matches_normalized.columns

Index(['id_match', 'result', 'date', 'round', 'city', 'edition', 'is_final'], dtype='object')

In [70]:
# üëë VISUALISATION 4 : TOP 15 des √©quipes les plus actives
# Calcul des statistiques par √©quipe
all_team_stats = []

# Statistiques domicile
home_team_stats = home_stats_normalized.merge(teams_reference_normalized, 
                                            left_on='id_team', right_on='id_team')
home_team_stats['location'] = 'home'

# Statistiques ext√©rieur  
away_team_stats = away_stats_normalized.merge(teams_reference_normalized,
                                            left_on='id_team', right_on='id_team')
away_team_stats['location'] = 'away'

# Combinaison des statistiques
combined_stats = pd.concat([
    home_team_stats[['Team_name', 'Number_of_goals_scored', 'Number_of_goals_conceded', 'location','id_match']],
    away_team_stats[['Team_name', 'Number_of_goals_scored', 'Number_of_goals_conceded', 'location']]
])
combined_stats = pd.merge(
    combined_stats,
    matches_normalized[matches_normalized["is_final"]==True], 
    on='id_match',
    how='inner'
)
team_summary = combined_stats.groupby('Team_name').agg({
    'Number_of_goals_scored': 'sum',
    'Number_of_goals_conceded': 'sum',
    'Team_name': 'count'  # Nombre de matchs
}).rename(columns={'Team_name': 'total_matches'})

team_summary['goal_difference'] = team_summary['Number_of_goals_scored'] - team_summary['Number_of_goals_conceded']
team_summary = team_summary.sort_values('total_matches', ascending=False).head(15)

# Graphique horizontal moderne
fig = px.bar(team_summary.reset_index().head(15), 
             x='total_matches', y='Team_name', 
             orientation='h',
             title="üèÜ Top 15 des √©quipes les plus actives en Coupe du Monde",
             labels={'total_matches': 'Nombre de matchs jou√©s', 'Team_name': '√âquipe'},
             color='goal_difference',
             color_continuous_scale='RdYlGn',
             text='total_matches')

fig.update_traces(texttemplate='%{text}', textposition='inside')
fig.update_layout(height=600, yaxis={'categoryorder':'total ascending'})
fig.show()

print("üéØ Top 3 des √©quipes les plus actives:")
for i, (team, data) in enumerate(team_summary.head(3).iterrows()):
    print(f"   {i+1}. {team}: {data['total_matches']} matchs, {data['Number_of_goals_scored']} buts marqu√©s")

üéØ Top 3 des √©quipes les plus actives:
   1. Brazil: 25 matchs, 70 buts marqu√©s
   2. Italy: 18 matchs, 34 buts marqu√©s
   3. Netherlands: 15 matchs, 33 buts marqu√©s


In [71]:
# ‚öîÔ∏è VISUALISATION 5 : Scatter Plot - Efficacit√© offensive vs d√©fensive
# Analyse de l'efficacit√© des √©quipes (top 20)
top_teams = team_summary.head(20).reset_index()

fig = px.scatter(top_teams, 
                x='Number_of_goals_scored', 
                y='Number_of_goals_conceded',
                size='total_matches',
                color='goal_difference',
                hover_name='Team_name',
                title="‚öîÔ∏è Efficacit√© des √©quipes : Attaque vs D√©fense",
                labels={
                    'Number_of_goals_scored': 'Buts marqu√©s', 
                    'Number_of_goals_conceded': 'Buts encaiss√©s',
                    'goal_difference': 'Diff√©rence de buts'
                },
                color_continuous_scale='RdYlGn',
                size_max=60)

# Ligne de r√©f√©rence (performance √©quilibr√©e)
fig.add_shape(type="line", x0=0, y0=0, 
              x1=top_teams['Number_of_goals_scored'].max(), 
              y1=top_teams['Number_of_goals_scored'].max(),
              line=dict(color="gray", dash="dash", width=2))

fig.update_layout(height=600)
fig.show()

print("üí° Lecture du graphique:")
print("   üü¢ √âquipes en vert (au-dessus de la ligne): Plus de buts marqu√©s qu'encaiss√©s")
print("   üî¥ √âquipes en rouge (en-dessous de la ligne): Plus de buts encaiss√©s que marqu√©s")
print("   üìä Taille des bulles = Nombre de matchs jou√©s")

üí° Lecture du graphique:
   üü¢ √âquipes en vert (au-dessus de la ligne): Plus de buts marqu√©s qu'encaiss√©s
   üî¥ √âquipes en rouge (en-dessous de la ligne): Plus de buts encaiss√©s que marqu√©s
   üìä Taille des bulles = Nombre de matchs jou√©s


## üé≠ CHAPITRE 4 : Data Story - Les r√©v√©lations cach√©es
### Synth√®se narrative : Que nous r√©v√®lent vraiment 92 ans de Coupes du Monde ?

In [69]:
# üìä DATA STORY - Synth√®se des insights cl√©s
print("üèÜ DATA STORY FIFA WORLD CUP (1930-2022)")
print("=" * 50)

# Calculs pour la story
total_matches = len(matches_normalized[matches_normalized["is_final"]==True])
total_teams = len(teams_reference_normalized)
total_goals = combined_stats['Number_of_goals_scored'].sum()
avg_goals_per_match = total_goals / total_matches

# Most active team
most_active_team = team_summary.index[0]
most_active_matches = team_summary.iloc[0]['total_matches']

# # Home advantage calculation
# home_wins = len(home_away_comparison[home_away_comparison['result_type'] == 'Victoire Domicile'])
# away_wins = len(home_away_comparison[home_away_comparison['result_type'] == 'Victoire Ext√©rieur'])
# draws = len(home_away_comparison[home_away_comparison['result_type'] == 'Match Nul'])

print(f"üìà CROISSANCE DU TOURNOI:")
print(f"   ‚Ä¢ {total_matches} matchs disput√©s au total")
print(f"   ‚Ä¢ {total_teams} √©quipes diff√©rentes ont particip√©")
# print(f"   ‚Ä¢ √âvolution: de ~15 matchs en 1930 √† 64+ matchs aujourd'hui")

print(f"\n‚öΩ EXPLOSION OFFENSIVE:")
print(f"   ‚Ä¢ {total_goals} buts marqu√©s au total")
print(f"   ‚Ä¢ Moyenne: {avg_goals_per_match:.2f} buts par match")
print(f"   ‚Ä¢ Le football devient de plus en plus spectaculaire!")

# print(f"\nüèüÔ∏è MYTHE DE L'AVANTAGE √Ä DOMICILE:")
# print(f"   ‚Ä¢ Victoires domicile: {home_wins} ({(home_wins/total_matches)*100:.1f}%)")
# print(f"   ‚Ä¢ Victoires ext√©rieur: {away_wins} ({(away_wins/total_matches)*100:.1f}%)")
# print(f"   ‚Ä¢ Matchs nuls: {draws} ({(draws/total_matches)*100:.1f}%)")
# if home_wins > away_wins:
#     print("   ‚úÖ L'avantage domicile existe bel et bien en Coupe du Monde!")
# else:
#     print("   ‚ùå Pas d'avantage domicile significatif en Coupe du Monde!")

print(f"\nüëë HI√âRARCHIE DES NATIONS:")
print(f"   ‚Ä¢ √âquipe la plus active: {most_active_team} ({most_active_matches} matchs)")
print(f"   ‚Ä¢ Les grandes nations dominent par leur r√©gularit√©")
print(f"   ‚Ä¢ La diff√©rence de buts r√©v√®le les vraies hi√©rarchies")

üèÜ DATA STORY FIFA WORLD CUP (1930-2022)
üìà CROISSANCE DU TOURNOI:
   ‚Ä¢ 188 matchs disput√©s au total
   ‚Ä¢ 228 √©quipes diff√©rentes ont particip√©

‚öΩ EXPLOSION OFFENSIVE:
   ‚Ä¢ 406 buts marqu√©s au total
   ‚Ä¢ Moyenne: 2.16 buts par match
   ‚Ä¢ Le football devient de plus en plus spectaculaire!

üëë HI√âRARCHIE DES NATIONS:
   ‚Ä¢ √âquipe la plus active: Brazil (25 matchs)
   ‚Ä¢ Les grandes nations dominent par leur r√©gularit√©
   ‚Ä¢ La diff√©rence de buts r√©v√®le les vraies hi√©rarchies


## üöÄ BONUS : Visualisations suppl√©mentaires 
### Explorez d'autres angles d'analyse int√©ressants

In [None]:
# üå°Ô∏è VISUALISATION BONUS : Heatmap des performances par d√©cennie
# Analyse temporelle des performances
matches_with_goals = goals_by_match.copy()
matches_with_goals['decade'] = (matches_with_goals['edition'].astype(int) // 10) * 10

decade_stats = matches_with_goals.groupby(['decade']).agg({
    'total_goals': ['mean', 'sum', 'count']
}).round(2)

decade_stats.columns = ['Moyenne_buts_match', 'Total_buts', 'Nombre_matchs']
decade_stats = decade_stats.reset_index()

# Heatmap avec Plotly
fig = px.imshow(decade_stats.set_index('decade').T, 
                aspect="auto",
                title="üå°Ô∏è √âvolution des performances par d√©cennie",
                labels=dict(x="D√©cennie", y="M√©trique", color="Valeur"),
                color_continuous_scale="viridis")

fig.update_layout(height=400)
fig.show()

print("üìä Analyse par d√©cennie:")
for _, row in decade_stats.iterrows():
    print(f"   {row['decade']}s: {row['Moyenne_buts_match']:.2f} buts/match, {row['Nombre_matchs']} matchs")