# Analyse et comparaison des statistiques des joueurs
Ce notebook interactif permet de choisir une date, sélectionner un match, et analyser les statistiques des joueurs à travers des visualisations interactives.

In [None]:
# Importer les bibliothèques
import requests
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px

# Partie 1 : Focus sur ton joueur préféré
Cette partie nous permettra de séléctionner une date, puis un match, puis un joueur, récupérer et visualiser les statistiques de ce joueur pendant ce match

## Étape 1 : Sélectionner une date et récupérer les matchs

In [None]:
# Saisir une date pour récupérer les données des matchs
# Vous pouvez choisir une date pour trouver un match qui vous anime si vous suivez les matchs de basket
date = input('Entrez une date (YYYY-MM-DD) : ')

# Construire l'URL de l'API
url_events = f'https://api.sofascore.com/api/v1/sport/basketball/scheduled-events/{date}'

# Faire une requête GET
response = requests.get(url_events)

# Vérifier la réponse et récupérer les informations sur les matches
if response.status_code == 200:
    data = response.json()
    matches = data.get('events', [])
else:
    print(f"Erreur: {response.status_code}")

# L'objet qu'on retourne est sous forme JSON, explorez un peu comment il est structuré
matches

Entrez une date (YYYY-MM-DD) : 2024-10-11


[{'officials': [],
  'tournament': {'name': 'NBA Preseason',
   'slug': 'nba-preseason',
   'category': {'name': 'USA',
    'slug': 'usa',
    'sport': {'name': 'Basketball', 'slug': 'basketball', 'id': 2},
    'id': 15,
    'country': {'alpha2': 'US', 'alpha3': 'USA', 'name': 'USA', 'slug': 'usa'},
    'flag': 'usa',
    'alpha2': 'US'},
   'uniqueTournament': {'name': 'NBA Preseason',
    'slug': 'nba-preseason',
    'category': {'name': 'USA',
     'slug': 'usa',
     'sport': {'name': 'Basketball', 'slug': 'basketball', 'id': 2},
     'id': 15,
     'country': {'alpha2': 'US',
      'alpha3': 'USA',
      'name': 'USA',
      'slug': 'usa'},
     'flag': 'usa',
     'alpha2': 'US'},
    'userCount': 34624,
    'hasPerformanceGraphFeature': True,
    'id': 2329,
    'hasEventPlayerStatistics': True,
    'hasBoxScore': False,
    'displayInverseHomeAwayTeams': True},
   'priority': 131,
   'id': 9154},
  'season': {'name': 'NBA Preseason 2024',
   'year': '2024',
   'editor': False,


In [None]:
type(matches)

list

In [None]:
# Ce qui nous intéresse ce sont les matchs disponible pour lesquels on a les informations importantes
# Pour continuer ce DOJO, vous aurez besoin de l'ID du match que vous allez choisir pour analyser
# ICI on vous donne la façon d'accéder aux matchs et trouver les noms des équipes
print("Matchs disponibles :")
for match in matches:
    print(f"Match ID: {match['id']}, {match['homeTeam']['name']} vs {match['awayTeam']['name']}")

Matchs disponibles :
Match ID: 12731839, Cleveland Cavaliers vs Indiana Pacers
Match ID: 12731844, Dallas Mavericks vs Utah Jazz
Match ID: 12731842, Memphis Grizzlies vs Charlotte Hornets
Match ID: 12731845, Milwaukee Bucks vs Los Angeles Lakers
Match ID: 12731843, Oklahoma City Thunder vs New Zealand Breakers
Match ID: 12731848, Minnesota Timberwolves vs Philadelphia 76ers
Match ID: 12731846, Orlando Magic vs New Orleans Pelicans
Match ID: 12731847, Washington Wizards vs Toronto Raptors
Match ID: 12731852, Golden State Warriors vs Sacramento Kings
Match ID: 12731849, Phoenix Suns vs Detroit Pistons
Match ID: 12731851, Los Angeles Clippers vs Portland Trail Blazers
Match ID: 12544777, Anadolu Efes vs Fenerbahçe Beko
Match ID: 12544773, LDLC ASVEL Lyon-Villeurbanne vs Virtus Segafredo Bologna
Match ID: 12544778, Panathinaikos BC vs Bayern München
Match ID: 12544775, Real Madrid vs KK Partizan Mozzart Bet
Match ID: 12544772, Olympiacos BC vs Kauno Žalgiris
Match ID: 12544769, Barça Baske

## Étape 2 : Sélectionner un match et récupérer les id et noms des joueurs

In [None]:
# Saisir un ID au hasard ou un match qui est intéressant pour vous
match_id = input("Entrez l'ID du match : ")

# On construit l'URL pour les compositions
url_lineups = f'https://api.sofascore.com/api/v1/event/{match_id}/lineups'

# Fais une requête GET
response = requests.get(url_lineups)

# Récupére les données des joueurs des deux équipes
data = response.json()
data

Entrez l'ID du match : 12731845


{'confirmed': False,
 'home': {'players': [{'player': {'name': 'Bobby Portis',
     'firstName': 'Bobby',
     'lastName': 'Portis',
     'slug': 'portis-bobby',
     'shortName': 'B. Portis',
     'position': 'F',
     'jerseyNumber': '9',
     'height': 208,
     'userCount': 1574,
     'id': 817329,
     'country': {'alpha2': 'US',
      'alpha3': 'USA',
      'name': 'USA',
      'slug': 'usa'},
     'marketValueCurrency': 'EUR',
     'dateOfBirthTimestamp': 792374400,
     'fieldTranslations': {'nameTranslation': {'ar': 'بوبي بورتيس'},
      'shortNameTranslation': {'ar': 'ب. بورتيس'}}},
    'teamId': 3410,
    'shirtNumber': 9,
    'jerseyNumber': '9',
    'position': 'F',
    'substitute': True,
    'statistics': {'secondsPlayed': 1430,
     'points': 4,
     'twoPointsMade': 2,
     'twoPointAttempts': 6,
     'threePointsMade': 6,
     'threePointAttempts': 4,
     'freeThrowsMade': 2,
     'freeThrowAttempts': 0,
     'fieldGoalsMade': 14,
     'fieldGoalAttempts': 8,
     'r

In [None]:
# Sachant que :
              # - data.get('home', {}) : Récupère les données liées à l'équipe à domicile.
              # - .get('players', []) : Récupère la liste des joueurs, ou une liste vide si elle n'existe pas.

# Regarde comment fonctionne la fonction get  dans l'exemple suivant


# Extrais les joueurs de l'équipe à domicile à partir des données récupérées
home_players = data.get('home', {}).get('players', [])

type(home_players)

# Utilise la fonction get pour récupérer les informations qu'on te demande dans la cellule suivante

list

In [None]:
home_players[0]

{'player': {'name': 'Bobby Portis',
  'firstName': 'Bobby',
  'lastName': 'Portis',
  'slug': 'portis-bobby',
  'shortName': 'B. Portis',
  'position': 'F',
  'jerseyNumber': '9',
  'height': 208,
  'userCount': 1574,
  'id': 817329,
  'country': {'alpha2': 'US', 'alpha3': 'USA', 'name': 'USA', 'slug': 'usa'},
  'marketValueCurrency': 'EUR',
  'dateOfBirthTimestamp': 792374400,
  'fieldTranslations': {'nameTranslation': {'ar': 'بوبي بورتيس'},
   'shortNameTranslation': {'ar': 'ب. بورتيس'}}},
 'teamId': 3410,
 'shirtNumber': 9,
 'jerseyNumber': '9',
 'position': 'F',
 'substitute': True,
 'statistics': {'secondsPlayed': 1430,
  'points': 4,
  'twoPointsMade': 2,
  'twoPointAttempts': 6,
  'threePointsMade': 6,
  'threePointAttempts': 4,
  'freeThrowsMade': 2,
  'freeThrowAttempts': 0,
  'fieldGoalsMade': 14,
  'fieldGoalAttempts': 8,
  'rebounds': 0,
  'defensiveRebounds': 0,
  'offensiveRebounds': 0,
  'turnovers': 0,
  'blocks': 0,
  'personalFouls': 0,
  'assists': 0,
  'steals': 0,


In [None]:
# Extrais les joueurs de l'équipe à l'extérieur de manière similaire

away_players = data.get('away', {}).get('players', [])

type(away_players)

list

In [None]:
# Afficher les joueurs de l'équipe à domicile
# - Utilisez une boucle pour parcourir la liste des joueurs(away_players).
# - Accédez à chaque joueur pour afficher son ID et son nom.

# Indice : Essaye de faire pour un seul joueur avant de faire ta boucle

print("Joueurs de l'équipe à domicile :")

for player in home_players:
    # f-string pour afficher clairement l'ID et le nom de chaque joueur
    print(f"ID: {player['player']['id']}, Nom: {player['player']['name']}")


Joueurs de l'équipe à domicile :
ID: 817329, Nom: Bobby Portis
ID: 817039, Nom: Pat Connaughton
ID: 1540637, Nom: AJ Johnson
ID: 1179862, Nom: AJ Green
ID: 1206073, Nom: MarJon Beauchamp
ID: 1178570, Nom: Stanley Umude
ID: 1629480, Nom: Tyler Smith
ID: 846893, Nom: Taurean Prince
ID: 817232, Nom: Damian Lillard


In [None]:
# Afficher les joueurs de l'équipe à l'exterieur
# - Utilisez une boucle pour parcourir la liste des joueurs(home_players).
# - Accédez à chaque joueur pour afficher son ID et son nom.

# Indice : Essaye de faire pour un seul joueur avant de faire ta boucle

print("Joueurs de l'équipe à l'exterieur :")

for player in away_players:
    # f-string pour afficher clairement l'ID et le nom de chaque joueur
    print(f"ID: {player['player']['id']}, Nom: {player['player']['name']}")

Joueurs de l'équipe à l'exterieur :
ID: 987100, Nom: Jaxson Hayes
ID: 1184925, Nom: Quincy Olivari
ID: 1144675, Nom: Armel Traore
ID: 1179398, Nom: Colin Castleton
ID: 1134112, Nom: Jordan Goodwin
ID: 1181769, Nom: Maxwell Lewis
ID: 817357, Nom: D'Angelo Russell
ID: 817181, Nom: LeBron James


## Étape 3 : Récupérer les statistiques pour un seul joueur

In [None]:
# Saisir l'ID du joueur sélectionné
player_id = input('Entrez l\'ID du joueur : ')

# Construire l'URL pour les statistiques
url_stats = f'https://api.sofascore.com/api/v1/event/{match_id}/player/{player_id}/statistics'

# Fais une requête GET
response = requests.get(url_stats)

# Récupére les statistiques du joueur pendant le match que t'avait déjà choisi
stats = response.json()
stats

Entrez l'ID du joueur : 817357


{'player': {'name': "D'Angelo Russell",
  'firstName': "D'Angelo",
  'lastName': 'Russell ',
  'slug': 'dangelo-russell',
  'shortName': 'D. Russell',
  'position': 'G',
  'jerseyNumber': '1',
  'height': 191,
  'userCount': 4670,
  'id': 817357,
  'marketValueCurrency': 'EUR',
  'dateOfBirthTimestamp': 825033600,
  'fieldTranslations': {'nameTranslation': {'ar': 'دي أنجلو راسل'},
   'shortNameTranslation': {'ar': 'د. أ. راسل'}}},
 'team': {'name': 'Los Angeles Lakers',
  'slug': 'los-angeles-lakers',
  'shortName': 'Lakers',
  'gender': 'M',
  'sport': {'name': 'Basketball', 'slug': 'basketball', 'id': 2},
  'userCount': 211333,
  'nameCode': 'LAL',
  'disabled': False,
  'national': True,
  'type': 0,
  'id': 3427,
  'teamColors': {'primary': '#fdb927',
   'secondary': '#552582',
   'text': '#552582'},
  'fieldTranslations': {'nameTranslation': {'ar': 'لوس انجلس لايكرس',
    'ru': 'Лос-Анджелес Лейкерс'},
   'shortNameTranslation': {}}},
 'statistics': {'secondsPlayed': 190,
  'point

In [None]:
# Utilise json_normalize pour définir ta DataFrame en récupérent les 'statistics'
# On ne veut que charger les données 'statistics' dans le JSON 'stats'
df_stats = pd.json_normalize(stats['statistics'])
print("Statistiques du joueur :")
df_stats

Statistiques du joueur :


Unnamed: 0,secondsPlayed,points,twoPointsMade,twoPointAttempts,threePointsMade,threePointAttempts,freeThrowsMade,freeThrowAttempts,fieldGoalsMade,fieldGoalAttempts,rebounds,defensiveRebounds,offensiveRebounds,turnovers,blocks,personalFouls,assists,steals,plusMinus,fieldGoalPct
0,190,4,4,0,0,0,0,0,4,8,0,0,0,0,0,0,8,0,6,0


In [None]:
# Transporse ta dataframe vu qu'elle sur une ligne
df_stats = df_stats.T
df_stats

Unnamed: 0,0
secondsPlayed,190
points,4
twoPointsMade,4
twoPointAttempts,0
threePointsMade,0
threePointAttempts,0
freeThrowsMade,0
freeThrowAttempts,0
fieldGoalsMade,4
fieldGoalAttempts,8


## Étape 4 : Visualiser les statistiques du joueur séléctionné pendant le match
Créez des graphiques pour comparer et analyser les statistiques.

In [None]:
# Visualisation des statistiques
# Crée un bar plot qui permet de représenter toutes les statistiques présentes dans la df du joueur pendant le match

fig = px.bar(df_stats, x=df_stats.index, y=0, title='Statistiques du joueur', labels={'x': 'Statistiques', 'y': 'Valeur'})
fig.show()

# Partie 2 : Focus sur le match
Cette partie nous permettra récupérer, visualiser et comparer les statistiques des joueurs pendant le match que t'avez séelectionné au préalable

Rappel :

Tu as déjà stocké les informations des joueurs dans les deux listes `home_players` et `away_players`

Tu sais maintenant comment récupérer les statistiques d'un joueur


On aura besoin de faire une boucle pour récupérer l'ID, le nom et les stats de tous les joueurs pendant un match


## Étape 1 : Avant de faire ta boucle essaye de récupérer ces informations pour le joueur que t'as regardé ces stats juste avant



In [None]:
# Récupère l'id et le nom du premier joueur dans la composition home_players

player = home_players[0]

player_id = player['player']['id']
player_name = player['player']['name']

print(player_id)
print(player_name)


817329
Bobby Portis


In [None]:
# Crées une liste players_stats vide

players_stats = []

# Maintenant que tu as récupéré le player_id, récupére les statistics de ce joueur
# Fais une requete GET comme tu as fais en haut pour les statistics
url_stats = f'https://api.sofascore.com/api/v1/event/{match_id}/player/{player_id}/statistics'
response = requests.get(url_stats)

stats = response.json()

# Mets tes résultats dans une variables player_stats
player_stats = stats['statistics']

# Ajoute la variable player_stats dans ta liste players_stats
players_stats.append(player_stats)

In [None]:
players_stats

[{'secondsPlayed': 1464,
  'points': 36,
  'twoPointsMade': 0,
  'twoPointAttempts': 2,
  'threePointsMade': 6,
  'threePointAttempts': 6,
  'freeThrowsMade': 2,
  'freeThrowAttempts': 2,
  'fieldGoalsMade': 6,
  'fieldGoalAttempts': 12,
  'rebounds': 0,
  'defensiveRebounds': 0,
  'offensiveRebounds': 0,
  'turnovers': 0,
  'blocks': 0,
  'personalFouls': 0,
  'assists': 0,
  'steals': 0,
  'plusMinus': 12,
  'fieldGoalPct': 126}]

In [None]:
player_stats

{'secondsPlayed': 1464,
 'points': 36,
 'twoPointsMade': 0,
 'twoPointAttempts': 2,
 'threePointsMade': 6,
 'threePointAttempts': 6,
 'freeThrowsMade': 2,
 'freeThrowAttempts': 2,
 'fieldGoalsMade': 6,
 'fieldGoalAttempts': 12,
 'rebounds': 0,
 'defensiveRebounds': 0,
 'offensiveRebounds': 0,
 'turnovers': 0,
 'blocks': 0,
 'personalFouls': 0,
 'assists': 0,
 'steals': 0,
 'plusMinus': 12,
 'fieldGoalPct': 126,
 'name': 'Bobby Portis'}

In [None]:
# Rajoute un élément dictionnaire à la liste 'player_stats' avec la clé 'name' et la valeur qui est le nom de ton joueur 'player_name'

player_stats['name'] = player_name

In [None]:
player_stats

{'secondsPlayed': 1464,
 'points': 36,
 'twoPointsMade': 0,
 'twoPointAttempts': 2,
 'threePointsMade': 6,
 'threePointAttempts': 6,
 'freeThrowsMade': 2,
 'freeThrowAttempts': 2,
 'fieldGoalsMade': 6,
 'fieldGoalAttempts': 12,
 'rebounds': 0,
 'defensiveRebounds': 0,
 'offensiveRebounds': 0,
 'turnovers': 0,
 'blocks': 0,
 'personalFouls': 0,
 'assists': 0,
 'steals': 0,
 'plusMinus': 12,
 'fieldGoalPct': 126,
 'name': 'Bobby Portis',
 'team': 'Home'}

In [None]:
# Rajoute un élément dictionnaire à la liste 'player_stats' avec la clé 'team' et la valeur qui est soit 'Home' soit 'away' selon la présence du joueur dans les listes home_players ou away_players

if player in home_players:
    player_stats['team'] = 'Home'
else:
    player_stats['team'] = 'Away'

In [None]:
# On regarde la liste players_stats sous forme de data frame, vérifie que les colonnes (id, name) et les colonnes statistiques sont bien présentes
pd.DataFrame(players_stats)

Unnamed: 0,secondsPlayed,points,twoPointsMade,twoPointAttempts,threePointsMade,threePointAttempts,freeThrowsMade,freeThrowAttempts,fieldGoalsMade,fieldGoalAttempts,...,offensiveRebounds,turnovers,blocks,personalFouls,assists,steals,plusMinus,fieldGoalPct,name,team
0,1464,36,0,2,6,6,2,2,6,12,...,0,0,0,0,0,0,12,126,Bobby Portis,Home


## Étape 2 : Maintenant que tu as fais pour un joueur. On construit notre boucle en se basant sur le même principe



In [None]:
# 1 : Récupérer les statistiques de tous les joueurs pour un match

# Rappel : tu as déjà stocker les informations des joueurs dans les deux listes home_players et away_players
# Tu sais maintenant comment récupérer les statistiques d'un joueur
# on aura besoin de faire une boucle pour récupérer les stats de tous les joueurs
# Avant de faire ta boucle essaye de récupérer ces informations pour un joueur
players_stats = []

for player in home_players + away_players:
    player_id = player['player']['id']
    url_stats = f'https://api.sofascore.com/api/v1/event/{match_id}/player/{player_id}/statistics'
    response = requests.get(url_stats)

    stats = response.json()
    player_name = player['player']['name']
    player_stats = stats['statistics']
    player_stats['name'] = player_name
    if player in home_players:
      player_stats['team'] = 'Home'
    else:
      player_stats['team'] = 'Away'
    players_stats.append(player_stats)


In [None]:

# Étape 2 : Créer un DataFrame pour comparer les joueurs
df_players = pd.DataFrame(players_stats)

# Afficher le tableau des statistiques
df_players


Unnamed: 0,secondsPlayed,points,twoPointsMade,twoPointAttempts,threePointsMade,threePointAttempts,freeThrowsMade,freeThrowAttempts,fieldGoalsMade,fieldGoalAttempts,...,offensiveRebounds,turnovers,blocks,personalFouls,assists,steals,plusMinus,fieldGoalPct,name,team
0,1732,0,2,6,4,4,2,0,8,2,...,0,0,0,0,0,0,8,80,Bobby Portis,Home
1,1168,2,2,2,0,0,0,0,2,4,...,0,0,0,0,0,0,0,96,Pat Connaughton,Home
2,24,14,2,0,2,6,0,0,0,8,...,0,2,0,2,4,0,2,36,AJ Johnson,Home
3,1310,4,0,0,0,2,0,0,0,6,...,0,2,0,0,0,0,0,32,AJ Green,Home
4,468,2,2,0,0,0,0,0,2,2,...,0,0,0,0,6,0,0,36,MarJon Beauchamp,Home
5,82,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,Stanley Umude,Home
6,1266,2,0,0,0,2,0,2,0,4,...,0,2,0,0,0,0,0,32,Tyler Smith,Home
7,262,2,0,0,0,0,0,0,0,0,...,0,0,0,0,2,0,0,12,Taurean Prince,Home
8,124,10,0,4,0,0,2,0,0,12,...,0,2,0,0,6,0,2,16,Damian Lillard,Home
9,676,2,4,2,0,0,0,0,2,4,...,0,0,0,0,0,0,0,122,Jaxson Hayes,Away


## Étape 3 : Créer des graphiques distincts pour les statistiques



### Créer un graphe pour comparer les points par joueurs dans les deux équipes

In [None]:
# Graphique des points par équipe
fig_points = px.bar(
    df_players,
    x='name',
    y='points',
    color='team',
    title='Comparaison des points par joueur',
    labels={'name': 'Joueur', 'points': 'Points'},
    barmode='group'
)
fig_points.show()




### Créer un graphe pour comparer les rebonds par joueurs dans les deux équipes

In [None]:
# Graphique des rebonds par équipe
fig_rebounds = px.bar(
    df_players,
    x='name',
    y='rebounds',
    color='team',
    title='Comparaison des rebonds par joueur',
    labels={'name': 'Joueur', 'rebounds': 'Rebonds'},
    barmode='group'
)
fig_rebounds.show()

### (Bonus) Créer le même graphe en triant les nombres des rebonds par équipe

In [None]:
# Trier le DataFrame par la colonne 'rebounds' en ordre décroissant
df_sorted = df_players.sort_values(by='rebounds', ascending=False)

# Créer le graphique avec le DataFrame trié
fig_rebounds = px.bar(
    df_sorted,
    x='name',
    y='rebounds',
    color='team',
    title='Comparaison des rebonds par joueur (trié)',
    labels={'name': 'Joueur', 'rebounds': 'Rebonds'},
    barmode='group'
)
fig_rebounds.show()


### (Bonus) Créer le même graphe en triant les nombres des rebonds globalement

In [None]:
# Trier le DataFrame par 'rebounds' en ordre décroissant
df_sorted = df_players.sort_values(by='rebounds', ascending=False)

# Créer un graphique tout en forçant l'ordre global par 'rebounds'
fig_rebounds = px.bar(
    df_sorted,
    x='name',
    y='rebounds',
    color='team',  # Garder la couleur par équipe
    title='Comparaison des rebonds par joueur (tri global avec couleurs)',
    labels={'name': 'Joueur', 'rebounds': 'Rebonds'},
    barmode='group',
    category_orders={'name': df_sorted['name'].tolist()}  # Forcer l'ordre des joueurs
)
fig_rebounds.show()

### (Bonus) Faire le même graphe pour les points

In [None]:
# Trier le DataFrame par 'rebounds' en ordre décroissant
df_sorted = df_players.sort_values(by='points', ascending=False)

# Créer un graphique tout en forçant l'ordre global par 'rebounds'
fig_rebounds = px.bar(
    df_sorted,
    x='name',
    y='points',
    color='team',  # Garder la couleur par équipe
    title='Comparaison des points par joueur (tri global avec couleurs)',
    labels={'name': 'Joueur', 'points': 'Points'},
    barmode='group',
    category_orders={'name': df_sorted['name'].tolist()}  # Forcer l'ordre des joueurs
)
fig_rebounds.show()