## Projet – Créer l’équipe de foot idéale 
# Par Mélissa Tchamdja

# Livrables attendus  
1. Deux équipes complètes (une masculine et une féminine) composées chacune 
de 11 titulaires (1 gardien, 4 défenseurs, 4 milieux, 2 attaquants) et 5 remplaçants. 
2. Un rapport d’analyse détaillant les raisons de vos choix, incluant : 
o Les  critères  utilisés  pour  sélectionner  les  joueurs  (attributs  clés,  stratégie 
d’équipe). 
o Les comparaisons entre plusieurs joueurs pour un même poste. 
o L’impact potentiel de la constitution de votre équipe sur les performances 
globales. 
 
Les données disponibles : https://www.kaggle.com/datasets/nyagami/ea-sports-fc-25-database-ratings-and-stats 
 

In [24]:
#Importer les bibliotheque

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

In [25]:
##Importer les données :

all_data = pd.read_csv("../sport eda/data/all_players.csv")
female_data = pd.read_csv("../sport eda/data/female_players.csv")
male_data = pd.read_csv("../sport eda/data/male_players.csv")


## 1- Exploration des données : 
# supprimer les colonnes 

J'ai choisi de n'utiliser que les données (female_data et male_data) pour cette étude.

Certaines colonnes n'ont pas été utilisées dans les critères de sélection :

Unnamed: 0.1, Unnamed: 0 : Colonnes sans importance (index)
Rank, url, Nation, League, Team, Play style, Preferred foot : pas importante pour moi
Alternative positions : Pas utilisé

In [None]:
#explorations des données masculines
print(male_data.shape) # nb_ligne, nb colonne
print(male_data.dtypes) #type des données
print(male_data.describe()) #statistiques descriptives
print(male_data.isnull().sum()) #Verifiez les valeurs manquantes
print(male_data.duplicated().sum()) #verification des doublons

#explorations des données féminines
print(female_data.shape) # nb_ligne, nb colonne
print(female_data.dtypes) #type des données
print(female_data.describe()) #statistiques descriptives
print(female_data.isnull().sum()) #Verifiez les valeurs manquantes
print(female_data.duplicated().sum()) #verification des doublons

In [42]:
# colonnes à supprimer
columns_to_drop = ['Unnamed: 0.1', 'Unnamed: 0', 'url', 'Nation', 'League', 'Team', 'Height', 'Weight','play style', 'Preferred foot', 'Alternative positions']

# Suppression des colonnes 
male_data_cleaned = male_data.drop(columns=columns_to_drop)
female_data_cleaned = female_data.drop(columns=columns_to_drop)
all_data_cleaned = all_data.drop(columns=columns_to_drop)


In [None]:
## Attribution des positions aux joueurs en se basant sur : 

def assign_position(row):
    if row['GK Reflexes'] > 80 and row['GK Diving'] > 75 and row['GK Positioning'] > 75:  
        return 'Gardien'
    elif row['Interceptions'] > 75 and row['DEF'] > 70 and row['Stamina'] > 70: 
        return 'Défenseur'
    elif row['Long Passing'] > 75 and row['Vision'] > 75 and row['Dribbling'] > 70:  
        return 'Milieu'
    elif row['Sprint Speed'] > 80 and row['Finishing'] > 75 and row['Dribbling'] > 75:  
        return 'Attaquant'
    else:
        return 'Inconnu'  # Si aucun critère n'est satisfait

# Attribution des positions aux joueurs
male_data_cleaned['Position_attribuée'] = male_data_cleaned.apply(assign_position, axis=1)
female_data_cleaned['Position_attribuée'] = female_data_cleaned.apply(assign_position, axis=1)

# Vérification des positions
male_data_cleaned[['Name', 'Position_attribuée']].head()

## 2- Analyse et visualisation :
comparer les joueurs selon leurs positions et compétences. 

In [None]:
# Visualisation des joueurs
plt.figure(figsize=(16, 12))

# gardiens masculins
plt.subplot(2, 2, 1)
sns.boxplot(x='Position_attribuée', y='GK Reflexes', data=male_data_cleaned[male_data_cleaned['Position_attribuée'] == 'Gardien'])
plt.title('Réflexes des Gardiens Masculins')

# défenseurs masculins
plt.subplot(2, 2, 2)
sns.boxplot(x='Position_attribuée', y='Interceptions', data=male_data_cleaned[male_data_cleaned['Position_attribuée'] == 'Défenseur'])
plt.title('Interceptions des Défenseurs Masculins')

# milieux masculins
plt.subplot(2, 2, 3)
sns.boxplot(x='Position_attribuée', y='Long Passing', data=male_data_cleaned[male_data_cleaned['Position_attribuée'] == 'Milieu'])
plt.title('Longues Passes des Milieux Masculins')

# attaquants masculins
plt.subplot(2, 2, 4)
sns.boxplot(x='Position_attribuée', y='Finishing', data=male_data_cleaned[male_data_cleaned['Position_attribuée'] == 'Attaquant'])
plt.title('Finitions des Attaquants Masculins')

plt.tight_layout()
plt.show()

In [None]:

# Visualisation des joueuses féminines
plt.figure(figsize=(16, 12))

# attributs des gardiennes féminines
plt.subplot(2, 2, 1)
sns.boxplot(x='Position_attribuée', y='GK Reflexes', data=female_data_cleaned[female_data_cleaned['Position_attribuée'] == 'Gardien'])
plt.title('Réflexes des Gardiennes Féminines')

# défenseurs féminins
plt.subplot(2, 2, 2)
sns.boxplot(x='Position_attribuée', y='Interceptions', data=female_data_cleaned[female_data_cleaned['Position_attribuée'] == 'Défenseur'])
plt.title('Interceptions des Défenseuses Féminines')

# milieux féminins
plt.subplot(2, 2, 3)
sns.boxplot(x='Position_attribuée', y='Long Passing', data=female_data_cleaned[female_data_cleaned['Position_attribuée'] == 'Milieu'])
plt.title('Longues passes des Milieux Féminines')

# attaquantes féminines
plt.subplot(2, 2, 4)
sns.boxplot(x='Position_attribuée', y='Finishing', data=female_data_cleaned[female_data_cleaned['Position_attribuée'] == 'Attaquant'])
plt.title('Finition des des Attaquantes Féminines')

plt.tight_layout()
plt.show()

## 3- Modélisation des équipes

# comparaison des joueurs à chaque poste :
# choix des attributs à evaluer

Gardien : réflexes, plongeon, positionnement
Défenseurs : interceptions, défense, endurance
Milieux : passes longues, dribbles, vision du jeu
Attaquants : vitesse, finition, dribbles

In [None]:
# LES TITULAIRES

# Equipe masculine
# Gardien
male_gardien = male_data_cleaned[male_data_cleaned['Position_attribuée'] == 'Gardien'].sort_values(by=['GK Reflexes', 'GK Diving', 'GK Positioning'], ascending=False).head(1)

# Défenseurs (4)
male_defenseurs = male_data_cleaned[male_data_cleaned['Position_attribuée'] == 'Défenseur'].sort_values(by=['Interceptions', 'DEF', 'Stamina'], ascending=False).head(4)

# Milieux (4)
male_milieu = male_data_cleaned[male_data_cleaned['Position_attribuée'] == 'Milieu'].sort_values(by=['Long Passing', 'Vision', 'Dribbling'], ascending=False).head(4)

# Attaquants (2)
male_attaquants = male_data_cleaned[male_data_cleaned['Position_attribuée'] == 'Attaquant'].sort_values(by=['Sprint Speed', 'Finishing', 'Dribbling'], ascending=False).head(2)

# Création de l'équipe masculine des 11 titulaires
male_team = pd.concat([male_gardien, male_defenseurs, male_milieu, male_attaquants])


# Euipe féminine
# Gardien
female_gardien = female_data_cleaned[female_data_cleaned['Position_attribuée'] == 'Gardien'].sort_values(by=['GK Reflexes', 'GK Diving', 'GK Positioning'], ascending=False).head(1)

# Défenseurs (4)
female_defenseurs = female_data_cleaned[female_data_cleaned['Position_attribuée'] == 'Défenseur'].sort_values(by=['Interceptions', 'DEF', 'Stamina'], ascending=False).head(4)

# Milieux (4)
female_milieu = female_data_cleaned[female_data_cleaned['Position_attribuée'] == 'Milieu'].sort_values(by=['Long Passing', 'Vision', 'Dribbling'], ascending=False).head(4)

# Attaquants (2)
female_attaquants = female_data_cleaned[female_data_cleaned['Position_attribuée'] == 'Attaquant'].sort_values(by=['Sprint Speed', 'Finishing', 'Dribbling'], ascending=False).head(2)

# Création de l'équipe féminine des 11 titulaires
female_team = pd.concat([female_gardien, female_defenseurs, female_milieu, female_attaquants])

# Affichage des équipes:

print("Équipe masculine - 11 titulaires :")
print(male_team[['Name', 'Position_attribuée']])

print("\nÉquipe féminine - 11 titulaires :")
print(female_team[['Name', 'Position_attribuée']])

In [None]:
# LES REMPLACANTS

# Equipe masculine
# 1 Gardien
male_remp_gardien = male_data_cleaned[(male_data_cleaned['Position_attribuée'] == 'Gardien') &  (~male_data_cleaned['Name'].isin(male_team['Name']))].sort_values(by=['GK Reflexes', 'GK Diving'], ascending=False).head(1)

# 1 Défenseur
male_remp_defenseur = male_data_cleaned[(male_data_cleaned['Position_attribuée'] == 'Défenseur') & (~male_data_cleaned['Name'].isin(male_team['Name']))].sort_values(by=['Interceptions', 'DEF', 'Stamina'], ascending=False).head(1)

# 1 Milieu
male_remp_milieu = male_data_cleaned[(male_data_cleaned['Position_attribuée'] == 'Milieu') & (~male_data_cleaned['Name'].isin(male_team['Name']))].sort_values(by=['Long Passing', 'Vision'], ascending=False).head(1)

# 1 Attaquant
male_remp_attaquant = male_data_cleaned[(male_data_cleaned['Position_attribuée'] == 'Attaquant') & (~male_data_cleaned['Name'].isin(male_team['Name']))].sort_values(by=['Sprint Speed', 'Finishing'], ascending=False).head(1)

# 2 Inconnus
male_remp_inconnu = male_data_cleaned[(male_data_cleaned['Position_attribuée'] == 'Inconnu') & (~male_data_cleaned['Name'].isin(male_team['Name']))].sort_values(by=['Sprint Speed', 'Finishing'], ascending=False).head(1)

male_remp = pd.concat([male_remp_gardien, male_remp_defenseur, male_remp_milieu, male_remp_attaquant, male_remp_inconnu])


# Equipe féminine

# 1 Gardienne
female_remp_gardien = female_data_cleaned[(female_data_cleaned['Position_attribuée'] == 'Gardien') &  (~female_data_cleaned['Name'].isin(female_team['Name']))].sort_values(by=['GK Reflexes', 'GK Diving'], ascending=False).head(1)

# 1 Défenseuse
female_remp_defenseur = female_data_cleaned[(female_data_cleaned['Position_attribuée'] == 'Défenseur') &  (~female_data_cleaned['Name'].isin(female_team['Name']))].sort_values(by=['Interceptions', 'DEF', 'Stamina'], ascending=False).head(1)

# 1 Milieu
female_remp_milieu = female_data_cleaned[(female_data_cleaned['Position_attribuée'] == 'Milieu') &  (~female_data_cleaned['Name'].isin(female_team['Name']))].sort_values(by=['Long Passing', 'Vision'], ascending=False).head(1)

# 1 Attaquante
female_remp_attaquant = female_data_cleaned[(female_data_cleaned['Position_attribuée'] == 'Attaquant') & (~female_data_cleaned['Name'].isin(female_team['Name']))].sort_values(by=['Sprint Speed', 'Finishing'], ascending=False).head(1)

# 2 Inconnu
female_remp_inconnu = female_data_cleaned[(female_data_cleaned['Position_attribuée'] == 'Inconnu') &  (~female_data_cleaned['Name'].isin(female_team['Name']))].sort_values(by=['Sprint Speed', 'Finishing'], ascending=False).head(1)


female_remp = pd.concat([female_remp_gardien, female_remp_defenseur, female_remp_milieu, female_remp_attaquant, female_remp_inconnu])

# Affichage des remplaçants 
print("Remplaçants masculins :")
print(male_remp[['Name', 'Position_attribuée']])

print("\nRemplaçantes féminines :")
print(female_remp[['Name', 'Position_attribuée']])



## Voici mes équipes finales :

# 1- Titulaires masculins:

      Name                   Position_attribuée
13   Marc-André ter Stegen            Gardien
39              Marquinhos          Défenseur
12         Virgil van Dijk          Défenseur
40      Alessandro Bastoni          Défenseur
71            N'Golo Kanté          Défenseur
5          Kevin De Bruyne             Milieu
37         Bruno Fernandes             Milieu
7          Martin Ødegaard             Milieu
219         Enzo Fernández             Milieu
0            Kylian Mbappé          Attaquant
140           Moussa Diaby          Attaquant


# 2- Remplaçants masculins: 

          Name                Position_attribuée
8     Gianluigi Donnarumma            Gardien
1012           Anton Stach          Défenseur
346           Joey Veerman             Milieu
2           Erling Haaland          Attaquant
462          Karim Adeyemi            Inconnu


# 3- Titulaires féminines:
Équipe féminine - 11 titulaires :
     Name                     Position_attribuée
15  Christiane Endler            Gardien
6           Mapi León          Défenseur
12      Wendie Renard          Défenseur
14      Irene Paredes          Défenseur
29       Grace Geyoro          Défenseur
31      Lindsey Horan             Milieu
8             Debinha             Milieu
19       Rose Lavelle             Milieu
71  Manuela Giugliano             Milieu
65   Tabitha Chawinga          Attaquant
83     Trinity Rodman          Attaquant


# 4- Remplançantes féminines :

             Name           Position_attribuée
97           Cata Coll            Gardien
0       Aitana Bonmatí          Défenseur
129              Luana             Milieu
254  Rosemonde Kouassi          Attaquant
413       Barbra Banda            Inconnu

## 4- Justification des choix

Pour chaque joueur sélectionné, voici quelques raisons de leurs choix basées:

-Gardien : j'ai choisis les meilleurs en termes de réflexes et de plongeons pour une défense solide.
-Défenseurs : j'ai sélectionnés les joueurs ayant les meilleures compétences en défense et interceptions pour bloquer efficacement les attaquants adverses.
-Milieux : Ceux avec une vision du jeu et des compétences de passes longues ont été choisis pour leur capacité à créer des opportunités de jeu et distribuer le ballon.
-Attaquants : Les joueurs les plus rapides et les plus précis en finition ont été sélectionnés pour maximiser les chances de marquer.



# Pour les remplaçants :

j'ai choisi d'avoir pour chaque équipe : 1 gardien, 1 attackant, 1 défenseur 1 milieu et 1 inconnus pour avoir une large possibilité de choix au moment de faire des remplacements.