In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from matplotlib.colors import Normalize
from matplotlib.cm import viridis

In [None]:
# Charger les données depuis le fichier Excel
excel_file_path = '../DataSet/data_fifa_clean.xlsx'
df = pd.read_excel(excel_file_path)

In [None]:
# Graphique 1 : Moyenne d'âge des joueurs par poste
def age_moyen_par_poste():
    age_moyen_par_poste = df.groupby('Position')['Age'].mean().sort_values(ascending=False)
    plt.figure(figsize=(12, 10))
    ax = sns.boxplot(x='Position', y='Age', data=df, palette='Set2')
    ax.set_title('Moyenne d\'âge des joueurs par poste')
    ax.set_xlabel('Poste')
    ax.set_ylabel('Âge')
    plt.yticks(range(int(df['Age'].min()), int(df['Age'].max()) + 1))
    plt.xticks(rotation=45, ha='right')
    plt.tight_layout()
    plt.show()

In [None]:
# Graphique 2 : Évolution moyenne des salaires en fonction de l'ancienneté
def evolution_salaire_anciennete():
    plt.figure(figsize=(12, 6))
    sns.lineplot(x='Age', y='Wage', data=df, ci=None, color='purple', marker='o')
    plt.title('Évolution Moyenne des Salaires en Fonction de l\'Ancienneté')
    plt.xlabel('Âge du Joueur')
    plt.ylabel('Salaire Moyen (Wage)')
    plt.yticks(range(0, 20001, 500))
    plt.tight_layout()
    plt.show()

In [None]:
# Graphique 3 : Répartition des joueurs par pied préféré
def repartition_pied_prefere():
    pied_counts = df['Preferred Foot'].value_counts()
    colors = ['#FF9999', '#66B2FF']
    explode = (0.1, 0)
    plt.figure(figsize=(10, 8))
    plt.pie(pied_counts, labels=pied_counts.index, autopct='%1.1f%%', startangle=140, colors=colors, explode=explode, shadow=True)
    centre_cercle = plt.Circle((0, 0), 0.70, fc='white')
    fig = plt.gcf()
    fig.gca().add_artist(centre_cercle)
    plt.title('Répartition des Joueurs par Pied Préféré', fontsize=16)
    plt.show()

In [None]:
# Graphique 4 : Corrélation entre Nationalité et Somme des Compétences des Joueurs
def correlation_nationalite_competences():
    competences = ['Crossing', 'Finishing', 'HeadingAccuracy', 'ShortPassing', 'Volleys', 'Dribbling',
                   'Curve', 'FKAccuracy', 'LongPassing', 'BallControl', 'Acceleration', 'SprintSpeed',
                   'Agility', 'Reactions', 'Balance', 'ShotPower', 'Jumping', 'Stamina', 'Strength',
                   'LongShots', 'Aggression', 'Interceptions', 'Positioning', 'Vision', 'Penalties',
                   'Composure', 'Marking', 'StandingTackle', 'SlidingTackle']
    df['TotalCompetences'] = df[competences].sum(axis=1)
    top_20_nationalites = df['Nationality'].value_counts().head(20).index
    df_top_20 = df[df['Nationality'].isin(top_20_nationalites)]
    norm = Normalize(vmin=df_top_20['TotalCompetences'].min(), vmax=df_top_20['TotalCompetences'].max())
    colors = viridis(norm(df_top_20['TotalCompetences']))
    plt.figure(figsize=(16, 10))
    plt.scatter(df_top_20['Nationality'], df_top_20['TotalCompetences'], alpha=0.5, c=colors, edgecolors='w', linewidth=0.5)
    plt.xlabel('Nationalité', fontsize=14)
    plt.ylabel('Somme des Compétences', fontsize=14)
    plt.title('Corrélation entre Nationalité et Somme des Compétences des Joueurs (Top 20 Nationalités)', fontsize=16)
    plt.xticks(rotation=45, ha='right')
    plt.tight_layout()
    plt.show()

In [None]:
# Graphique 5 : Répartition des joueurs par nationalité (Top 10)
def repartition_joueurs_par_nationalite():
    nationalite_counts = df['Nationality'].value_counts().head(10)
    plt.figure(figsize=(10, 10))
    plt.pie(nationalite_counts, labels=nationalite_counts.index, autopct='%1.1f%%', startangle=140, colors=plt.cm.Paired.colors)
    plt.title('Répartition des Joueurs par Nationalité (Top 10)')
    plt.show()

In [None]:
# Graphique 6 : Classement des 20 joueurs les plus populaires par pays
def classement_joueurs_populaires():
    df_sorted = df.sort_values('International Reputation', ascending=False)
    top_players_by_nationality = df_sorted.groupby('Nationality').head(1).head(20)
    plt.figure(figsize=(12, 6))
    plt.bar(top_players_by_nationality['Name'] + ' (' + top_players_by_nationality['Nationality'] + ')',
            top_players_by_nationality['International Reputation'], color='orange')
    plt.title('Classement des 20 Joueurs les Plus Populaires par Pays')
    plt.xlabel('Joueur')
    plt.ylabel('Popularité (International Reputation)')
    plt.xticks(rotation=45, ha='right')
    plt.tight_layout()
    plt.show()

In [None]:
# Graphique 7 : Vue globale du nombre de joueurs par poste
def vue_globale_nombre_joueurs_par_poste():
    poste_counts = df['Position'].value_counts()
    plt.figure(figsize=(10, 6))
    poste_counts.plot(kind='bar', color='firebrick')
    plt.title('Vue globale du nombre de joueurs par poste')
    plt.xlabel('Poste')
    plt.ylabel('Nombre de Joueurs')
    plt.xticks(rotation=45, ha='right')
    plt.tight_layout()
    plt.show()

In [None]:
# Graphique 8 : Les 11 joueurs les plus légers par pays - Diagramme de Barres Horizontal
def joueurs_plus_leger_par_pays():
    df_taille_poids = df[['Nationality', 'Name', 'Height', 'Weight']]
    df_taille_poids = df_taille_poids.sort_values(by=['Nationality', 'Weight'])
    df_top_leger_par_pays = df_taille_poids.groupby('Nationality').head(11)
    plt.figure(figsize=(12, 25))
    sns.barplot(x='Weight', y='Nationality', data=df_top_leger_par_pays, palette='viridis', ci=None)
    plt.xlabel('Poids (kg)', fontsize=14)
    plt.ylabel('Nationalité', fontsize=14)
    plt.title('Les 11 Joueurs les Plus Légers par Pays - Diagramme de Barres Horizontal', fontsize=16)
    plt.tight_layout()
    plt.show()

In [None]:
# Graphique 9 : Compétences moyennes par poste - Diagramme en Barres Groupées
def competences_moyennes_par_poste():
    competences = ['Crossing', 'Finishing', 'HeadingAccuracy', 'ShortPassing', 'Volleys', 'Dribbling', 'Curve',
                   'FKAccuracy', 'LongPassing', 'BallControl', 'Acceleration', 'SprintSpeed', 'Agility', 'Reactions',
                   'Balance', 'ShotPower', 'Jumping', 'Stamina', 'Strength', 'LongShots']
    df_comp_par_poste = df.groupby('Position')[competences].mean().reset_index()
    bar_width = 0.15
    bar_positions = range(len(df_comp_par_poste))
    plt.figure(figsize=(30, 8))
    for i, competence in enumerate(competences):
        plt.bar(
            [pos + i * bar_width for pos in bar_positions],
            df_comp_par_poste[competence],
            width=bar_width,
            label=competence
        )
    plt.xlabel('Poste')
    plt.ylabel('Compétences Moyennes')
    plt.title('Compétences Moyennes par Poste - Diagramme en Barres Groupées')
    plt.xticks([pos + (len(competences) - 1) * bar_width / 2 for pos in bar_positions], df_comp_par_poste['Position'])
    plt.legend()
    plt.show()

In [None]:
# Graphique 10 : Top 10 des meilleurs buteurs
def top_buteurs():
    top_10_buteurs = df.nlargest(20, 'Finishing')
    plt.figure(figsize=(10, 6))
    bars = plt.bar(top_10_buteurs['Name'], top_10_buteurs['Finishing'], color='darkseagreen')
    for bar, buts in zip(bars, top_10_buteurs['Finishing']):
        plt.text(bar.get_x() + bar.get_width() / 2, bar.get_height() + 0.2,
                 f'({buts})', ha='center', va='bottom')
    plt.xlabel('Joueurs')
    plt.ylabel('Nombre de buts')
    plt.title('Top 10 des Meilleurs Buteurs')
    plt.xticks(rotation=45, ha='right')
    plt.show()

In [None]:
# Appeler les fonctions restantes dans l'ordre souhaité
age_moyen_par_poste()
evolution_salaire_anciennete()
repartition_pied_prefere()
correlation_nationalite_competences()
repartition_joueurs_par_nationalite()
classement_joueurs_populaires()
vue_globale_nombre_joueurs_par_poste()
joueurs_plus_leger_par_pays()
competences_moyennes_par_poste()
top_buteurs()