# CODE DE LA PARTIE ANALYSE DU PROJET.

In [2]:
import pandas as pd
import numpy as np

import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline

import plotly as py
import plotly.graph_objs as go

import statistics
from scipy.stats import pearsonr, chi2_contingency
import statsmodels.api

# Pour éviter d'avoir les messages warning
import warnings
warnings.filterwarnings('ignore')

- **Importation** du jeu de données : 

In [3]:
df = pd.read_csv('C:/Users/licke/Documents/datasets complets/NBA/NBA Shot Locations 1997 - 2020.csv')

df.head()

Unnamed: 0,Game ID,Game Event ID,Player ID,Player Name,Team ID,Team Name,Period,Minutes Remaining,Seconds Remaining,Action Type,...,Shot Zone Area,Shot Zone Range,Shot Distance,X Location,Y Location,Shot Made Flag,Game Date,Home Team,Away Team,Season Type
0,29700427,389,100,Tim Legler,1610612764,Washington Wizards,4,11,22,Jump Shot,...,Right Side(R),8-16 ft.,15,117,109,1,19980102,WAS,IND,Regular Season
1,29700427,406,100,Tim Legler,1610612764,Washington Wizards,4,9,36,Jump Shot,...,Right Side(R),8-16 ft.,14,143,25,0,19980102,WAS,IND,Regular Season
2,29700427,475,100,Tim Legler,1610612764,Washington Wizards,4,3,7,Jump Shot,...,Left Side(L),8-16 ft.,10,-87,55,0,19980102,WAS,IND,Regular Season
3,29700427,487,100,Tim Legler,1610612764,Washington Wizards,4,1,45,Jump Shot,...,Center(C),Less Than 8 ft.,5,-1,53,0,19980102,WAS,IND,Regular Season
4,29700427,497,100,Tim Legler,1610612764,Washington Wizards,4,0,45,Jump Shot,...,Right Side(R),8-16 ft.,14,89,113,0,19980102,WAS,IND,Regular Season


- **Filtrage des données** (restriction aux 20 joueurs à analyser) : 

In [4]:
# La liste des 20 joueurs à étudier : 

players = ['Tim Duncan','Kobe Bryant','Allen Iverson','Steve Nash','Ray Allen','Paul Pierce','Pau Gasol','Tony Parker',
           'Manu Ginobili','Dwyane Wade','LeBron James','Chris Paul','Kevin Durant','Russell Westbrook','Stephen Curry',
           'James Harden','Kawhi Leonard','Damian Lillard','Anthony Davis','Giannis Antetokounmpo']

# Filtrage des données de df : 

df_twenty = df[df['Player Name'].isin(players)]

In [5]:
df_twenty.head()

Unnamed: 0,Game ID,Game Event ID,Player ID,Player Name,Team ID,Team Name,Period,Minutes Remaining,Seconds Remaining,Action Type,...,Shot Zone Area,Shot Zone Range,Shot Distance,X Location,Y Location,Shot Made Flag,Game Date,Home Team,Away Team,Season Type
17033,29700010,31,1495,Tim Duncan,1610612759,San Antonio Spurs,1,8,47,Jump Shot,...,Right Side(R),16-24 ft.,16,154,53,0,19971031,DEN,SAS,Regular Season
17034,29700010,76,1495,Tim Duncan,1610612759,San Antonio Spurs,1,5,11,Layup Shot,...,Center(C),Less Than 8 ft.,0,0,0,1,19971031,DEN,SAS,Regular Season
17035,29700010,87,1495,Tim Duncan,1610612759,San Antonio Spurs,1,4,4,Driving Layup Shot,...,Center(C),Less Than 8 ft.,0,0,0,1,19971031,DEN,SAS,Regular Season
17036,29700010,226,1495,Tim Duncan,1610612759,San Antonio Spurs,2,3,35,Jump Shot,...,Left Side(L),8-16 ft.,11,-115,16,1,19971031,DEN,SAS,Regular Season
17037,29700010,287,1495,Tim Duncan,1610612759,San Antonio Spurs,3,10,59,Jump Shot,...,Center(C),Less Than 8 ft.,7,68,23,1,19971031,DEN,SAS,Regular Season


## 0) NETTOYAGE initial des données.

- **Nettoyage** des données :

In [6]:
def nettoyage_df_twenty(data = df_twenty):
    
    """Nettoyage du DataFrame data, à réaliser avant toute modification ou manipulation.
    
        Contient :
        
        . remplacement des anciens noms et anciens cigles de franchises, aujourd'hui disparues.
        . transformation du type de la colonne 'Game Date'au format pd.datetime
        . regroupement des valeurs de la variable 'Action Type' en 11 catégories au lieu de 70.
        . création d'une variable 'Time Remaining' à partir de 'Minutes Remaining' et 'Seconds Remaining'.
        . suppression des colonnes 'Minutes Remaining', 'Seconds Remaining', 'Game ID', 'Team ID', 'Player ID', 'Away Team', 
          et 'Home Team', inutiles pour la suite.
        . mise en minuscules de toutes les modalités de toutes les colonnes, hormi pour les colonnes 'Home Team' et 'Away Team'.
        . remplacement des modalités de la variable "shot zone area", pour plus de maniabilité et de compréhension.
        . mise en minuscules de tous les noms de colonnes.
        . remplacement des noms d'équipes complets de la colonne "team name" par leur cigle associé.
        . remplacement des modalités "2pt field goal" et "3py field goal" de "shot type" par les valeurs numériques 2 et 3.
        . calcul des distances de tirs exactes à l'aide du théorème de Pythagore, et mise à jour de la variable 'shot distance'.
        . création d'une variable binaire 'home', indiquant 1 si le joueur a effectué son tir à domicile et 0 sinon.
        . création d'une colonne 'adversary' contenant le nom de l'équipe adverse face à laquelle le joueur a pris son tir.
        . création de 4 nouvelles colonnes : "conference" , "division" , "conference adv" et "division adv, indiquant 
          la conférence et la division à laquelle appartient l'équipe du joueur ainsi que l'équipe adverse."""
        
    df_twenty_clean = data  # création d'une copie de data : c'est cette copie qui sera nettoyée.
    
    # Modification des anciens noms et cigles de franchises disparues :
    
    # remplacement des anciens noms de franchises dans la colonne "Team Name" : 

    df_twenty_clean = df_twenty_clean.replace({"Team Name":["Seattle SuperSonics" , "New Orleans Hornets" , 
                                                            "New Orleans/Oklahoma City Hornets" , "LA Clippers"]} , 
                                              {"Team Name":["Oklahoma City Thunder" , "New Orleans Pelicans" , 
                                                            "New Orleans Pelicans" , "Los Angeles Clippers"]})

    # remplacement des anciens cigles dans la colonne "Home Team" : 

    df_twenty_clean = df_twenty_clean.replace({"Home Team":["SEA" , "NOH" , "NOK" , "VAN" , "CHH" , "NJN"]} , 
                                              {"Home Team":["OKC" , "NOP" , "NOP" , "MEM" , "CHA" , "BKN"]})

    # remplacement des anciens cigles dans la colonne "Away Team" :

    df_twenty_clean = df_twenty_clean.replace({"Away Team":["SEA" , "NOH" , "NOK" , "VAN" , "CHH" , "NJN"]} , 
                                              {"Away Team":["OKC" , "NOP" , "NOP" , "MEM" , "CHA" , "BKN"]})
    
    
    # APRES CETTE ETAPE, IL DOIT RESTER 30 CIGLES DIFFERENTS ET 30 NOMS DE FRANCHISES DIFFERENTS DANS "Home Team" ET "Away Team".
    
    
    # conversion de la colonne "Game Date" au format date :
    
    df_twenty_clean["Game Date"] = df_twenty_clean["Game Date"].astype("str") # conversion de type :  int ==> str.
    
    date = lambda ligne : ligne[0:4] + "-" + ligne[4:6] + "-" + ligne[6:]

    df_twenty_clean["Game Date"] = df_twenty_clean["Game Date"].apply(func = date)

    
    df_twenty_clean["Game Date"] = pd.to_datetime(df_twenty_clean["Game Date"] , format = "%Y-%m-%d")
    
    
    # regroupement des 70 modalités de "Action Type" en 11 groupes : 
    
    # regroupement des "Jump Shot" : 
    
    df_twenty_clean = df_twenty_clean.replace({"Action Type":["Jump Bank Shot"]} , {"Action Type":["Jump Shot"]})

    
    # regroupement des "Layup Shot" (Finger Roll est une sous-catégorie de Layups) :
    
    df_twenty_clean = df_twenty_clean.replace({"Action Type":["Driving Layup Shot" , 
                                        "Reverse Layup Shot" , 
                                        "Running Layup Shot" ,
                                        "Driving Finger Roll Layup Shot" , 
                                        "Finger Roll Layup Shot" , 
                                        "Driving Reverse Layup Shot" , 
                                        "Running Finger Roll Layup Shot" , 
                                        "Running Reverse Layup Shot" , 
                                        "Cutting Layup Shot" , 
                                        "Cutting Finger Roll Layup Shot" ,
                                        "Finger Roll Shot" , 
                                        "Driving Finger Roll Shot" , 
                                        "Running Finger Roll Shot" , 
                                        "Turnaround Finger Roll Shot"]} , 
                        
                        {"Action Type":14*["Layup Shot"]})
    
    # regroupement des "Dunk Shot" :
    
    df_twenty_clean = df_twenty_clean.replace({"Action Type":["Slam Dunk Shot" , 
                                        "Driving Dunk Shot" , 
                                        "Reverse Dunk Shot" ,
                                        "Running Dunk Shot" , 
                                        "Follow Up Dunk Shot" , 
                                        "Driving Slam Dunk Shot" , 
                                        "Reverse Slam Dunk Shot" , 
                                        "Running Slam Dunk Shot" , 
                                        "Cutting Dunk Shot" , 
                                        "Running Reverse Dunk Shot" ,
                                        "Driving Reverse Dunk Shot"]} , 
                        
                        {"Action Type":11*["Dunk Shot"]})
    
    # regroupement des "Floating Shot" : 
    
    df_twenty_clean = df_twenty_clean.replace({"Action Type":["Floating Jump shot" , 
                                        "Driving Floating Jump Shot" , 
                                        "Driving Floating Bank Jump Shot"]} , 
                        
                        {"Action Type":3*["Floating Shot"]})
    
    # regroupement des "Fadeaway" :
    
    df_twenty_clean = df_twenty_clean.replace({"Action Type":["Fadeaway Jump Shot" , 
                                        "Turnaround Fadeaway shot" , 
                                        "Fadeaway Bank shot" ,
                                        "Turnaround Fadeaway Bank Jump Shot"]} , 
                        
                        {"Action Type":4*["Fadeaway"]})
    
    # regroupement des "Step Back Shot" :
   
    df_twenty_clean = df_twenty_clean.replace({"Action Type":["Step Back Jump shot" , 
                                        "Step Back Bank Jump Shot"]} , 
                        
                        {"Action Type":2*["Step Back Shot"]})
    
    # regroupement des "Hook Shot" :
    
    df_twenty_clean = df_twenty_clean.replace({"Action Type":["Running Hook Shot" , 
                                        "Jump Hook Shot" , 
                                        "Driving Hook Shot" , 
                                        "Turnaround Hook Shot" , 
                                        "Running Bank Hook Shot" , 
                                        "Hook Bank Shot" , 
                                        "Driving Bank Hook Shot" , 
                                        "Turnaround Bank Hook Shot" , 
                                        "Jump Bank Hook Shot"]} , 
                        
                        {"Action Type":9*["Hook Shot"]})
    
    
    # regroupement des "Tip Shot" :
    
    df_twenty_clean = df_twenty_clean.replace({"Action Type":["Running Tip Shot" , 
                                        "Tip Layup Shot" , 
                                        "Tip Dunk Shot"]} , 
                        
                        {"Action Type":3*["Tip Shot"]})
    
    # regroupement des "Putback Shot" :
    
    df_twenty_clean = df_twenty_clean.replace({"Action Type":["Putback Layup Shot" , 
                                        "Putback Slam Dunk Shot" , 
                                        "Putback Dunk Shot" , 
                                        "Putback Reverse Dunk Shot"]} , 
                        
                        {"Action Type":4*["Putback Shot"]})
    
    # regroupement des "Pull-up Shot" :
    
    df_twenty_clean = df_twenty_clean.replace({"Action Type":["Pullup Jump shot" , 
                                        "Pullup Bank shot" , 
                                        "Running Pull-Up Jump Shot"]} , 
                        
                        {"Action Type":3*["Pull-up Shot"]})
    
    # regroupement des "Alley oop" :
    
    df_twenty_clean = df_twenty_clean.replace({"Action Type":["Alley Oop Layup shot" , 
                                        "Alley Oop Dunk Shot" , 
                                        "Running Alley Oop Dunk Shot" , 
                                        "Running Alley Oop Layup Shot"]} , 
                        
                        {"Action Type":4*["Alley oop"]})
    
    # A CE STADE, IL RESTE ENCORE PLUS DE 11 MODALITES UNIQUES, COMME VOULU ==> IL Y EN A ENCORE A GERER.
    
    # regroupement de 3 modalités sous la catégorie "Jump Shot" :
    
    df_twenty_clean = df_twenty_clean.replace({"Action Type":["Running Jump Shot" , 
                                        "Turnaround Jump Shot" , 
                                        "Driving Jump shot"]} , 
                        
                        {"Action Type":3*["Jump Shot"]})
    
    # suppression des lignes de df_twenty ayant la modalité "No Shot" de "Action Type" : 
    
    no_shot = df_twenty_clean[df_twenty_clean["Action Type"]=="No Shot"] # les lignes de df_twenty ayant pour modalité "No Shot" de la variable Action Type.

    df_twenty_clean = df_twenty_clean.drop(labels=no_shot.index , axis=0) 
    
    # suppression des lignes de df_twenty ayant pour modalité de "Action Type" soit "Running Bank shot" , soit "Driving Bank shot" , soit "Turnaround Bank shot".
    
    L = ["Turnaround Bank shot", "Running Bank shot" , "Driving Bank shot"]
   
    df_twenty_clean = df_twenty_clean.drop(df_twenty_clean[df_twenty_clean["Action Type"].isin(L)].index)
    

    
    # création de la colonne "Time Remaining" à partir des colonnes "Minutes Remaining" et "Seconds Remaining" : 

    df_twenty_clean["Time Remaining"] = df_twenty_clean["Minutes Remaining"] + 0.01*df_twenty_clean["Seconds Remaining"]
    
    # conversion des colonnes "X Location" et "Y Location" en ft (actuellement, elles sont en ft*10) :

    df_twenty_clean["X Location"] = df_twenty_clean["X Location"]/10
    
    df_twenty_clean["Y Location"] = df_twenty_clean["Y Location"]/10
    
    # suppression des colonnes inutiles de data : 
    
    df_twenty_clean = df_twenty_clean.drop(["Minutes Remaining" , "Seconds Remaining" , "Team ID" , "Player ID" , 
                                            "Game ID" , "Game Event ID"] , 
                                           axis = 1)
    

    
    # renommage des modalités des colonnes NON NUMERIQUES de df_twenty (tout en miniscules), excepté pour "Home Team" et "Away Team" : 
    
    cat_vars = list(df_twenty_clean.select_dtypes("O").columns)
    cat_vars.remove("Home Team")
    cat_vars.remove("Away Team")
    for colonne in cat_vars:
        df_twenty_clean = df_twenty_clean.replace(to_replace = {colonne:df_twenty_clean[colonne].unique()} , value = {colonne:[df_twenty_clean[colonne].unique()[i].lower() for i in range(len(df_twenty_clean[colonne].unique()))]}) 
    
    # renommage de modalités de la colonne "shot zone area" : 
    
    df_twenty_clean["Shot Zone Area"] = df_twenty_clean["Shot Zone Area"].replace(['right side(r)', 'center(c)', 'left side(l)',
                                                                                   'right side center(rc)', 'left side center(lc)',
                                                                                   'back court(bc)'],
                                                                                  ["right side" , "center" , "left side" , 
                                                                                   "right side center" , "left side center", 
                                                                                   "back court"])
    
    # renommage des colonnes (écrit tout en minuscules) : 
    
    for colonne in df_twenty_clean.columns:
        df_twenty_clean = df_twenty_clean.rename(columns = {colonne:colonne.lower()})
    
    
    # remplacement des noms d'équipes complets (colonne "team name") par leur cigle : 
    
    team_cigles = {"san antonio spurs":"SAS" , "philadelphia 76ers":"PHI" , "milwaukee bucks":"MIL" , "phoenix suns":"PHX" , 
                   "los angeles lakers":"LAL" , "boston celtics":"BOS" , "dallas mavericks":"DAL" , "memphis grizzlies":"MEM" , 
                   "oklahoma city thunder":"OKC" , "cleveland cavaliers":"CLE" , "miami heat":"MIA" , 
                   "new orleans pelicans":"NOP", "denver nuggets":"DEN" , "detroit pistons":"DET" , 
                   "golden state warriors":"GSW" , "los angeles clippers":"LAC", "houston rockets":"HOU" , 
                   "portland trail blazers":"POR" , "brooklyn nets":"BKN" , "washington wizards":"WAS" , 
                   "chicago bulls":"CHI" , "toronto raptors":"TOR" , "charlotte hornets":"CHA"}
    
    df_twenty_clean["team name"] = df_twenty_clean["team name"].replace(team_cigles)
    
    
    # remplacement des modalités "2pt field goal" et "3pt field goal" de "shot type" par les chiffres 2 et 3 : 
    
    df_twenty_clean["shot type"] = df_twenty_clean["shot type"].replace(["2pt field goal" , "3pt field goal"] , [2 , 3])
    
    # Calcul des distances exactes de tir + mise à jour de "shot distance" : 
        
    df_twenty_clean["shot distance"] = np.sqrt(df_twenty_clean["x location"]**2 + df_twenty_clean["y location"]**2)
        
    
    # création de la variable binaire "home" :
        
    df_twenty_clean["home"] = df_twenty_clean["team name"]==df_twenty_clean["home team"]
    df_twenty_clean["home"] = df_twenty_clean["home"].replace([True,False] , [1,0])
        
    # création de la variable "adversary" : 
        
    adversaire = lambda ligne : ligne["home team"] if ligne["home team"]!=ligne["team name"] else ligne["away team"]
        
    df_twenty_clean["adversary"] = df_twenty_clean.apply(func = adversaire , axis = 1)
        
        
    # suppression des colonnes "home team" et "away team", désormais inutiles : 
        
    df_twenty_clean = df_twenty_clean.drop(["home team" , "away team"] , axis = 1)
    
    
    # création des 4 nouvelles colonnes "conference" , "division" , "conference adv" et "division adv" : 
        
    northwest_div = ["POR","UTA","DEN","OKC","MIN"] # les 5 équipes de la division nord-ouest
    pacific_div = ["SAC","LAL","LAC","GSW","PHX"] # les 5 équipes de la division pacifique
    southwest_div = ["DAL","SAS","HOU","NOP","MEM"] # les 5 équipes de la sud-ouest

    west_conf = northwest_div + pacific_div + southwest_div # les 15 équipes de la conférence ouest

    central_div = ["MIL","CHI","IND","DET","CLE"] # les 5 équipes de la division centrale
    southeast_div = ["WAS","CHA","ATL","ORL","MIA"] # les 5 équipes de la division sud-est
    atlantic_div = ["TOR","BOS","PHI","NYK","BKN"] # les 5 équipes de la division atlantique

    east_conf = central_div + southeast_div + atlantic_div # les 15 équipes de la conférence est

    # création de la fonction "conference", qui à une équipe associe la conférence à laquelle elle appartient. : 

    conference = lambda equipe : "est" if equipe in east_conf else "ouest"

    df_twenty_clean["conference adv"] = df_twenty_clean["adversary"].apply(func = conference)
    df_twenty_clean["conference"] = df_twenty_clean["team name"].apply(func = conference)

    # création de la fonction "division", qui à une équipe associe la division à laquelle elle appartient :

    def division(equipe):
        if equipe in northwest_div:
            return "nord-ouest"
        elif equipe in pacific_div:
            return "pacifique"
        elif equipe in southwest_div:
            return "sud-ouest"
        elif equipe in central_div:
            return "centrale"
        elif equipe in southeast_div:
            return "sud-est"
        else:
            return "atlantique"

    df_twenty_clean["division adv"] = df_twenty_clean["adversary"].apply(func = division)
    df_twenty_clean["division"] = df_twenty_clean["team name"].apply(func = division) 
    
    # ré-organisation de l'ordre des colonnes de df_twenty_clean : 
    
    df_twenty_clean = df_twenty_clean[["player name" , "team name" , "conference" , "division" , "adversary" , "conference adv" , 
                                       "division adv" , "game date" , "season type" , "home" , "period" , "time remaining" , 
                                       "x location" , "y location" , "shot distance" , "action type" , "shot type" , 
                                       "shot zone basic" , "shot zone area" , "shot zone range" , "shot made flag"]]

    # retourner le DataFrame nettoyé : 
    
    return df_twenty_clean

In [7]:
# Mise à jour de df_twenty : 

df_twenty = nettoyage_df_twenty()

# 1ères lignes : 

df_twenty.head()

Unnamed: 0,player name,team name,conference,division,adversary,conference adv,division adv,game date,season type,home,...,time remaining,x location,y location,shot distance,action type,shot type,shot zone basic,shot zone area,shot zone range,shot made flag
17033,tim duncan,SAS,ouest,sud-ouest,DEN,ouest,nord-ouest,1997-10-31,regular season,0,...,8.47,15.4,5.3,16.286497,jump shot,2,mid-range,right side,16-24 ft.,0
17034,tim duncan,SAS,ouest,sud-ouest,DEN,ouest,nord-ouest,1997-10-31,regular season,0,...,5.11,0.0,0.0,0.0,layup shot,2,restricted area,center,less than 8 ft.,1
17035,tim duncan,SAS,ouest,sud-ouest,DEN,ouest,nord-ouest,1997-10-31,regular season,0,...,4.04,0.0,0.0,0.0,layup shot,2,restricted area,center,less than 8 ft.,1
17036,tim duncan,SAS,ouest,sud-ouest,DEN,ouest,nord-ouest,1997-10-31,regular season,0,...,3.35,-11.5,1.6,11.610771,jump shot,2,mid-range,left side,8-16 ft.,1
17037,tim duncan,SAS,ouest,sud-ouest,DEN,ouest,nord-ouest,1997-10-31,regular season,0,...,10.59,6.8,2.3,7.17844,jump shot,2,in the paint (non-ra),center,less than 8 ft.,1


## 1) COMPARAISON des tirs de 20 top joueurs NBA du 21ème siècle.

- Création d'une **fonction permettant de tracer un terrain NBA à l'échelle sur une figure matplotlib existante** :

In [8]:
def draw_court(fig , ax , xlim_inf = -28 , xlim_sup = 28 , ylim_inf = 38 , ylim_sup = 94 , point_de_vue = "face" , print_ticks = False , linecolor = "black" , hoop_color = "red"):
    
    """Dessine un terrain NBA à l'échelle, sur une figure matplotlib déja éxistante et munie d'un système d'axes
    
       INFORMATIONS : 
       
       - Un terrain NBA mesure 50 ft de largeur pour 94 ft de longueur.
       - Le terrain est tracé de sorte que le centre du panier se trouve aux coordonnées (0,0) de la figure 
         si point_de_vue = 'derrière' et aux coordonnées (0,83.5) si point_de_vue = 'face'.
       
       CONSEILS : 
       
       - Taille conseillée pour la figure : figsize = (13,13).
       - Limites d'axes conseillées pour une vue FACE au panier : ylim_inf = 38 , ylim_sup = 94.
       - Limites d'axes conseillées pour une vue DOS au panier : ylim_inf = -7 , ylim_sup = 45.
       --------------------------------------------------------------------------------------------------------------------
       ARGUMENTS : 
       
       - fig : la figure sur laquelle tracer le terrain NBA, créée en amont.
       
       - ax : le système d'axe de coordonnées de cette figure.
       
       - xlim_inf : la limite inférieure de l'axe des abscisses.
       
       - xlim_sup : la limite supérieure de l'axe des abscisses.
       
       - ylim_inf : la limite inférieure de l'axe des ordonnées.
       
       - ylim_sup : la limite supérieure de l'axe des ordonnées.
       
       - point_de_vue : le point de vue que souhaite adopter l'utilisateur ('face' pour être face au panier, avec la vision du 
         tireur ou 'derrière' pour être dos au panier, avec la vision du défenseur.)
         
       - print_ticks : True si l'on souhaite afficher les graduations des axes de la figure, False sinon.
       
       - linecolor : la couleur dans laquelle doivent être dessinées les lignes du terrain.
       
       - hoop_color : la couleur dans laquelle doit être dessiné le panier."""
    
       
    from matplotlib.patches import Circle, Rectangle, Arc # les fonctions permettant de tracer des figures géométriques.
     
    if print_ticks==True: # si je souhaite afficher les graduations et les noms des axes : 
        
        ax.set_xlabel("x location (ft)" , fontsize = 15 , family = "serif")
        ax.set_ylabel("y location (ft)" , fontsize = 15 , family = "serif")
        
        # 2 graduations possibles, car 2 points de vue possibles : FACE au panier (vision attaquant), ou DOS au panier (vision défenseur).

        if point_de_vue == "face": # si je veux une vue FACE AU PANIER
            ax.set_xticks(np.arange(-25,26,2))
            ax.set_xticklabels(np.arange(-25,26,2))
            ax.set_yticks(np.arange(-6,89,2))
            ax.set_yticklabels(np.arange(89,-6,-2))   

        elif point_de_vue=="derrière": # si je veux une vue DOS au PANIER (rotation d'angle 180° de la vue face au panier)
            ax.set_yticks(np.arange(-5,90,2))
            ax.set_yticklabels(np.arange(-5,90,2))
            ax.set_xticks(np.arange(-25,26,2))
            ax.set_xticklabels(np.arange(25,-26,-2)) 

        else:
            raise valueError(f"Valeur attendue pour l'argument 'point_de_vue' : 'face' ou 'derrière'")
            
    else: # si je ne souhaite PAS afficher les graduations des axes : 
        ax.set_xticks([])
        ax.set_yticks([])
        
    
    # On fixe les valeurs limites des 2 axes, selon les valeurs renseignées en argument :
    
    ax.set_xlim(xlim_inf,xlim_sup)
    ax.set_ylim(ylim_inf,ylim_sup)
    
    
    # on rend transparent le bord droit de la figure : 
    
    ax.spines["right"].set_color("none")
    
    
    # on génère les différents tracers à effectuer : 

    traces = [] # la liste des tracés à effectuer qui seront ajoutés peu à peu, initialement vide.

    # tracé des contours du terrain : lignes de fonds et lignes de touche (rectangle de 50 ft de largeur sur 94 ft de longueur) :

    contour = Rectangle(xy = (-25,-5.25) , width = 50 , height = 94, color = linecolor , fill = False)
    traces.append(contour)

    # tracé de la ligne médiane (situé à 94/2 = 47 ft des 2 lignes de fond) : 

    ligne_mediane = Rectangle(xy = (-25,-5.25) , width = 50 , height = 47 , color = linecolor , fill = False)
    traces.append(ligne_mediane)

    # tracé du rond central (situé au milieu du terrain en largeur et en longueur, de rayon égal à 6 ft) : 

    rond_central_ext = Circle(xy = (0,41.75) , radius = 6 , color = linecolor , fill = False)
    rond_central_int = Circle(xy = (0,41.75) , radius = 2 , color = linecolor , fill = False)

    traces.append(rond_central_ext)
    traces.append(rond_central_int)


    # tracé de la raquette (rectangle de 16 ft de largeur (ext) et de 12 ft de largeur (int), et de 19 ft de hauteur) : 

    raquette_ext = Rectangle(xy = (-8,-5.25) , width = 16 , height = 19 , color = linecolor , fill = False)
    raquette_int = Rectangle(xy = (-6,-5.25) , width = 12 , height = 19 , color = linecolor , fill = False)

    traces.append(raquette_ext)
    traces.append(raquette_int)
    
    # tracé de la raquette opposée : 

    raquette_opp_ext = Rectangle(xy = (-8,69.75) , width = 16 , height = 19 , color = linecolor , fill = False)
    raquette_opp_int = Rectangle(xy = (-6,69.75) , width = 12 , height = 19 , color = linecolor , fill = False)

    traces.append(raquette_opp_ext)
    traces.append(raquette_opp_int)
    

    # tracé du cercle en haut de la raquette : 

    cercle_raquette_haut = Arc(xy = (0,13.75) , width = 12, height = 12 , theta1 = 0 , theta2 = 180 , color = linecolor)
    cercle_raquette_bas = Arc(xy = (0,13.75) , width = 12, height = 12 , theta1 = 180 , theta2 = 360 , ls = "--" , color = linecolor)

    traces.append(cercle_raquette_haut)
    traces.append(cercle_raquette_bas)
    
    # tracé du cercle en haut de la raquette opposée : 
    
    cercle_raquette_opp_haut = Arc(xy = (0,69.75) , width = 12, height = 12 , theta1 = 0 , theta2 = 180 , ls = "--" , color = linecolor)
    cercle_raquette_opp_bas = Arc(xy = (0,69.75) , width = 12, height = 12 , theta1 = 180 , theta2 = 360 , color = linecolor)

    traces.append(cercle_raquette_opp_haut)
    traces.append(cercle_raquette_opp_bas)

    # tracé de la zone restrictive (arc de cercle de rayon 4 ft et de centre (0,0)) : 

    zone_restrictive = Arc(xy = (0,0) , width = 8 , height = 8 , theta1 = 0 , theta2 = 180 , color = linecolor)
    traces.append(zone_restrictive)

    # tracé de la zone restrictive opposée : 
    
    zone_restrictive_opp = Arc(xy = (0,83.5) , width = 8 , height = 8 , theta1 = 180 , theta2 = 360 , color = linecolor)
    traces.append(zone_restrictive_opp)
    
    
    # tracé de la planche du panier (rectangle de largeur 6 ft) :

    planche = Rectangle(xy = (-3,-1.25) , width = 6 , height = 0.1 , color = hoop_color)
    traces.append(planche)
    
    # tracé de la planche du panier opposée :
    
    planche_opp = Rectangle(xy = (-3,84.75) , width = 6 , height = 0.1 , color = hoop_color)
    traces.append(planche_opp)


    # tracé de l'arceau du panier (cercle de rayon 0.758 ft) :

    arceau = Circle(xy = (0,0) , radius = 0.758 , color = hoop_color , fill = False)
    traces.append(arceau)
    
    # tracé de l'arceau du panier opposé :
    
    arceau_opp = Circle(xy = (0,83.5) , radius = 0.758 , color = hoop_color , fill = False)
    traces.append(arceau_opp)
    

    # tracé du support de l'arceau (tige de 0,5 ft de hauteur) : 

    support_arceau = Rectangle(xy = (-0.05,-1.25) , width = 0.1 , height = 0.6 , color = hoop_color)
    traces.append(support_arceau)
    
    # tracé du support de l'arceau opposé :
    
    support_arceau_opp = Rectangle(xy = (-0.05,84.25) , width = 0.1 , height = 0.6 , color = hoop_color)
    traces.append(support_arceau_opp)
    

    # tracé des lignes de corners (rectangles de largeur 3 ft et de hauteur 14 ft) :

    ligne_corner_gauche = Rectangle(xy = (-25,-5.25) , width = 3 , height = 14.55 , color = linecolor , fill = False)
    ligne_corner_droit = Rectangle(xy = (22,-5.25) , width = 3 , height = 14.55 , color = linecolor , fill = False)

    traces.append(ligne_corner_gauche)
    traces.append(ligne_corner_droit)
    
    # tracé des lignes de corners opposées :
    
    ligne_corner_opp_gauche = Rectangle(xy = (-25,74.2) , width = 3 , height = 14.55 , color = linecolor , fill = False)
    ligne_corner_opp_droit = Rectangle(xy = (22,74.2) , width = 3 , height = 14.55 , color = linecolor , fill = False)

    traces.append(ligne_corner_opp_gauche)
    traces.append(ligne_corner_opp_droit)
    

    # tracé de l'arc de la ligne des 3 points (arc de centre (0,0), de diametre 48 ft en x, et de diametre 47.5 ft en y) :

    arc_3_pts = Arc(xy = (0,0) , width = 47.5 , height = 47.5 , theta1 = 22, theta2 = 158, color = linecolor)
    traces.append(arc_3_pts)

    # tracé de l'arc de la ligne des 3 points opposé :
    
    arc_3_pts_opp = Arc(xy = (0,83.5) , width = 47.5 , height = 47.5 , theta1 = 202, theta2 = 338, color = linecolor)
    traces.append(arc_3_pts_opp)
    

    # tracé des tirets le long des lignes de touche :

    tiret_gauche = Rectangle(xy = (-25,22.75) , width = 3 , height = 0.167 , color = linecolor)
    tiret_droit = Rectangle(xy = (22,22.75) , width = 3 , height = 0.167 , color = linecolor)

    traces.append(tiret_gauche)
    traces.append(tiret_droit)

    # tracé de ces même tirets, mais dans la moitié de terrain opposée : 

    tiret_gauche_m1 = Rectangle(xy = (-25,60.583) , width = 3 , height = 0.167 , color = linecolor)
    tiret_droit_m1 = Rectangle(xy = (22,60.583) , width = 3 , height = 0.167 , color = linecolor)

    traces.append(tiret_gauche_m1)
    traces.append(tiret_droit_m1)
    

    for elt in traces: # pour chaque tracer généré...
        ax.add_patch(elt) # ...effectuer le tracé sur la figure

- Création d'une **fonction permettant de calculer la fréquence de tir ET l'efficacité au tir d'un joueur pour chaque modalité du critère renseigné (shot zone area, shot zone basic, ...)** : 

In [9]:
def statistic_by(data = df_twenty[df_twenty["player name"]=="kevin durant"] , critere = None):
    
    """Retourne un dictionnaire contenant 5 1D-arrays : 
    
    - un tableau avec chaque valeur/modalité unique de la variable
    - le tableau du NOMBRE de tirs tentés par modalité de 'critere'.
    - le tableau de la FREQUENCE de tirs tentés par modalité de 'critere'.
    - le tableau de la REUSSITE au tir par modalité de 'critère'.
    
    CRITERES POSSIBLES : "team name" , "conference" , "division" , "adversary" , "conference adv" , "division adv" , 
                         "season type" , "home" , "period" , "action type" , "shot type" , "shot zone basic" , "shot zone area" 
                         et "shot zone range". """

    
    # la liste des critères possibles : 
    
    criteres = [None , "team name" , "conference" , "division" , "adversary" , "conference adv" , "division adv" , "season type" , 
                "home" , "period" , "action type" , "shot type" , "shot zone basic" , "shot zone area" , "shot zone range"]
    
    if  critere in criteres : # SI le critère renseigné est bien dans la liste ci-dessus :
        
        
        stats_by = {} # le dictionnaire récapitulant toutes les statistiques de tirs selon le critère renseigné, initialement vide.

        nbr_tirs_marques = [] # la liste des nombre de paniers marqués par modalité du critère renseigné, initialement vide.
    
        taux_reussite = [] # la liste des taux de réussite au tir par modalité du critère renseigné, initialement vide.
        
        
        if critere==None: # si les tirs ne sont distingués selon aucun critère :
            nbr_tirs_marques = data["shot made flag"].value_counts().loc[1] # ...le nombre de paniers marqués est donné par l'indice 1 du value_counts
            taux_reussite = (data["shot made flag"].value_counts(normalize=True)*100).loc[1] # et le taux de réussite au tir est aussi donné par l'indice 1
            stats_by["marqués"] = nbr_tirs_marques # ajout des nombres de paniers marqués au dictionnaire stats_by
            stats_by["efficacité"] = taux_reussite # ajout des taux de réussite au dictionnaire stats_by 
        
        else: # si les tirs sont à distinguer selon un critère :
            nbr_tirs_tentes = list(data[critere].value_counts().sort_index()) # liste des nombres de tirs TENTES par modalité du critère
            part_tirs_tentes = list(data[critere].value_counts(normalize=True).sort_index()*100) # liste des parts (en %) de tirs TENTES par modalité du critère
            stats_by["modalités"] = np.array(data[critere].value_counts().sort_index().index) # liste des modalités du critère renseigné
            stats_by["tentés"] = np.array(nbr_tirs_tentes) # ajout des nombres de tirs tentés par modalité du critère au dictionnaire stats_by
            stats_by["% tentés"] = np.array(part_tirs_tentes) # ajout des parts de tirs tentés par modalité critère au dictionnaire stats_by

            for modalite in data[critere].value_counts().sort_index().index: # pour chaque modalité du critère renseigné : 
                data_modalite = data[data[critere]==modalite] # les données ayant cette modalité du critère renseigné
                if 1 in data_modalite["shot made flag"].value_counts().index: # si ce type de tir a été marqué au moins une fois...
                    nbr_marques_modalite = data_modalite["shot made flag"].value_counts().loc[1] # ...le nombre de paniers marqués est donné par l'indice 1 du value_counts
                    taux_reussite_modalite = (data_modalite["shot made flag"].value_counts(normalize=True)*100).loc[1] # et le taux de réussite au tir est aussi donné par l'indice 1
                else: # si ce type de tir a toujours été râté...
                    nbr_marques_modalite = 0 #...1 n'est pas dans l'index du value_counts ==> on fixe à 0 le nombre de paniers marqués.
                    taux_reussite_modalite=0 # et on fixe à 0 le taux de réussite au tir.

                nbr_tirs_marques.append(nbr_marques_modalite) # on ajoute le nombre de tirs marqués à la liste des tirs marqués
                taux_reussite.append(taux_reussite_modalite) # on ajoute le taux de réussite à la liste des taux de réussite

            stats_by["marqués"] = np.array(nbr_tirs_marques) # ajout des nombres de paniers marqués au dictionnaire stats_by
            stats_by["efficacité"] = np.array(taux_reussite) # ajout des taux de réussite au dictionnaire stats_by  
        
    
    else: # SI le critère renseigné en argument n'est PAS dans la liste des critères attendus : 
        raise ValueError("valeur attendue pour l'argument 'critere' : 'team name' , 'conference' , 'division' , 'adversary' , 'conference adv' , 'division adv' , 'season type' , 'home' , 'period' , 'action type' , 'shot type' , 'shot zone basic' , 'shot zone area' ou 'shot zone range'.")
        
    
    return stats_by
        

In [10]:
statistic_by(critere = None)

{'marqués': 9095, 'efficacité': 48.83221476510067}

- Création d'une **fonction permettant tracer la carte des tirs d'un joueur NBA** :

In [39]:
def shot_chart(fig , ax , figsize = (13.5,13.5) , data = df_twenty , print_ticks=False , player = "kevin durant" , critere = None , val_critere = None , hue = "shot made flag" , palette = "Dark2" , frequency_or_efficiency = "frequency" , xlim_inf = -28 , xlim_sup = 28 , ylim_inf = 38 , ylim_sup = 94 , facecolor = "black" , linecolor = "white" , hoop_color = "red"):
    
    """Affiche la carte des tirs pris par le joueur renseigné en argument, selon le point de vue voulu (face au panier ou 
    derrière le panier).
    
    DIMENSIONS CONSEILLEES POUR LA FIGURE : figsize = (13.5,13.5).
    
    -----------------------------------------------------------------------------------------------------------------------
    ARGUMENTS :
    
    - fig : la figure sur laquelle tracer la carte des tirs, créée en amont.
    
    - ax : le système d'axes de coordonnées de cette figure.
    
    - figsize : les dimensions (largeur,hauteur) de cette figure, à titre informatif (afin de déterminer la taille des textes à 
      afficher sur la carte).
      
    - data : le DataFrame contenant les données du joueur.
    
    - player : le nom du joueur dont on souhaite tracer la carte de tirs.
    
    - print_ticks : True si l'on souhaite afficher les graduations des axes, False sinon.
    
    - critere, val_critere : la variable du DataFrame et sa valeur, selon lesquelle on souhaite filter les données de tir du joueur."
      Entrées attendues pour 'critere' : 'team name', 'conference', 'division', 'adversary', 'conference adv', 'division adv', 
      'season type', 'home', 'period' ou 'action type'.
    
    - hue : la variable du DataFrame dont les valeurs prises servent à différencier les tirs par la couleur. 
            Entrées attendues : 'shot zone range', 'shot zone area', 'shot zone basic' ou 'shot type'.
    
    - palette : la palette de couleur à utiliser.
    
    - frequency_or_efficiency : le type de texte à afficher sur la carte ('frequency' pour afficher les fréquences de tirs ou 
      'efficiency' pour afficher les taux de réussite au tir).
      
    - facecolor : la couleur de fond du terrain.
    
    - linecolor : la couleur dans laquelle doivent être dessinées les lignes du terrain.
       
    - hoop_color : la couleur dans laquelle doit être dessiné le panier.
    
    - xlim_inf : la limite inférieure de l'axe des abscisses.
       
   - xlim_sup : la limite supérieure de l'axe des abscisses.

   - ylim_inf : la limite inférieure de l'axe des ordonnées.

   - ylim_sup : la limite supérieure de l'axe des ordonnées."""
       
      
    if player not in data["player name"].unique(): # SI le joueur renseigné ne fait pas partie de la liste des joueurs de data : 
        raise ValueError(f"{player} n'est pas présent dans {data}. Info : Le nom du joueur doit être écrit tout en minuscules.")
       
    # Filtrage des données du joueur renseigné en argument : 
    
    if critere==None: # SI aucun critère n'est renseigné, les données du joueur sont : 
        data_joueur = data[data["player name"]==player] 
    
    else: # SI un critère est renseigné, les données du joueur sont :
        
        # la liste des critères possibles attendus en argument : 
        
        criteres_valables = ['team name', 'conference', 'division', 'adversary', 'conference adv', 'division adv', 
                             'season type', 'home', 'period', 'action type']
        
        if critere in criteres_valables : # SI le critère renseigné fait partie de la liste des critères attendus : 
            L_vals_critere = data[data["player name"]==player][critere].unique() # la liste des valeurs que prend le critère

            if val_critere in L_vals_critere: # SI la valeur du critère renseignée fait partie des valeurs prisent par le critère :
                data_joueur = data[(data["player name"]==player) & (data[critere]==val_critere)]

            else: # SI la valeur du critère renseignée ne fait pas partie de la liste des valeurs du critère : 
                raise ValueError(f"valeur attendue pour l'argument 'val_critere' : {sorted(L_vals_critere)}") # retourner une erreur et une suggestion des valeurs possibles à entrer
        
        else: # SINON : 
            raise ValueError(f"valeur attendue pour l'argument 'critere' : {criteres_valables}")
            
    # dessin d'un terrain NBA sur la figure renseignée en argument :
    
    if print_ticks==False: # si je ne veux PAS afficher les graduations et les labels des axes : 
        draw_court(fig , ax , point_de_vue = "face" ,  print_ticks = False , linecolor = linecolor , hoop_color = hoop_color, 
                   xlim_inf = xlim_inf , xlim_sup = xlim_sup , ylim_inf = ylim_inf , ylim_sup = ylim_sup)
    else:
        draw_court(fig , ax , point_de_vue = "face" ,  print_ticks = True , linecolor = linecolor , hoop_color = hoop_color, 
                   xlim_inf = xlim_inf , xlim_sup = xlim_sup , ylim_inf = ylim_inf , ylim_sup = ylim_sup)
    
    
    
    # coordonnées en x des textes à afficher sur la carte : 
    
    x_text_area= {"center" : 0 , "left side center" : -14.75 , "right side center" : 14.75, "left side" : -14.75, 
                  "right side" : 15, "back court" : 0}
    
    x_text_basic = {"restricted area": 0 , "in the paint (non-ra)" : 0 , "mid-range" : 0 , "left corner 3" : -23.5 , 
                    "right corner 3" : 23.5 , "above the break 3" : 0 , "backcourt" : 0}
    
    x_text_type = {2 : 0 , 3 : 0}
    
    
    # coordonnées en y des textes à afficher sur la carte : 

    y_text_flag = {1 : 46.75}

    y_text_range = {"less than 8 ft." : 78.5 , "8-16 ft.": 70.5 , "16-24 ft.": 62 , "24+ ft.": 54, "back court shot" : 41}

    y_text_area = {"center" : 54, "left side center" : 60.25, "right side center" : 60.25 , "left side" : 79, "right side" : 79 ,
                   "back court" : 40.5}

    y_text_basic = {"restricted area": 81.5 , "in the paint (non-ra)" : 76.75 , "mid-range" : 68.25 , "left corner 3" : 81.75 , 
                    "right corner 3" : 81.75 , "above the break 3" : 55 , "backcourt" : 40.5}

    y_text_type = {2 : 62.5 , 3 : 53}
    
    
    # tracer des points correspondant aux lieux de tirs du joueur renseigné en argument : 
        
    if hue=="shot made flag": # SI on souhaite colorer les lieux de tirs selon la finalité du tir (marqué ou râté) :
        sns.scatterplot(data_joueur["x location"] , y = 83.5-data_joueur["y location"] ,  # 83.5 = ordonnée du centre du panier en vue de face
                        hue = data_joueur[hue] , palette = palette , ax = ax)
        
        ax.legend(loc = "lower right") # positionnement de la légende dans le coin inférieur droit de la figure.
        
        if frequency_or_efficiency=="efficiency": # SI on souhaite afficher sur la carte les taux de réussite au tir :
            # Les éléments à ajouter au texte : 
            
            stats_by = statistic_by(data = data_joueur, critere = None) # le dictionnaire des statistiques de tirs du joueur.
            efficacite_tir = stats_by["efficacité"] # le taux de réussite au tir du joueur
            nbr_tirs_tentes = len(data_joueur) # le nombre de tirs tentés par le joueur
            
            # les positions du texte sur le terrain : 
            
            abs = 0 # abscisse en laquelle centrer le texte à écrire
            ord = y_text_flag[1] # ordonnée en laquelle centrer le texte à écrire
            text = str(efficacite_tir.round(2))+ " % de réussite" + " (" + str(nbr_tirs_tentes) + " tirs)" # le texte à écrire

            # affichage du texte à l'endroit spécifié sur le terrain : 
            
            ax.text(x = abs , y = ord , s = text , family = "sans serif" , 
                    fontstyle = "italic" , color = "yellow" , fontweight = "heavy" , fontsize = 1.5*figsize[0] ,
                    horizontalalignment = "center" , verticalalignment = "center") 
            
            
            # Suivant le critère renseigné, le titre du graphique diffère (en taille et en texte) : 
            
            if critere!=None : # SI un critère est renseigné : 
                
                nbr_shots_critere = len(data_joueur) # le nombre de tirs pris par le joueur selon ce critère
                nbr_shots_total = len(data[data["player name"]==player]) # le nombre total de tirs pris par le joueur
                
                pct_shots_critere = (nbr_shots_critere/nbr_shots_total)*100 # le pourcentage de tirs pris par le joueur selon ce critère
            
            
                if critere in ["period","team name","conference","division","adversary","conference adv","division adv"]: # SI le critère renseigné est l'un de ceux-là :
                    titre = f"{player.upper()} ({critere}={val_critere}, {str(np.round(pct_shots_critere,2))} % des tirs, efficacité)"
                    titlesize = 1.4*figsize[0]

                else: # SI un autre critère que ceux de la liste ci-dessus est renseigné : 
                    titre = f"{player.upper()} ({val_critere}, efficacité)"
                    titlesize = 2.4*figsize[0]
            
            else : # SI aucun critère n'est renseigné : 
                titre = f"{player.upper()} (efficacité)"
                titlesize = 1.675*figsize[0]
                
            
                
        
        else: # SI on souhaite afficher sur la carte les fréquences de tirs : 
            
            if critere!=None : # SI un critère est renseigné :
                nbr_shots_critere = len(data_joueur) # le nombre de tirs pris par le joueur selon ce critère
                nbr_shots_total = len(data[data["player name"]==player]) # le nombre total de tirs pris par le joueur
                
                pct_shots_critere = (nbr_shots_critere/nbr_shots_total)*100 # le pourcentage de tirs pris par le joueur selon ce critère
            
                titre = f"{player.upper()} ({critere}={val_critere}, {str(np.round(pct_shots_critere,2))} % des tirs)"
                titlesize = 1.65*figsize[0]
            
            else: # SI aucun critère n'est renseigné : 
                
                titre = f"{player.upper()} (marqués/râtés)"
                titlesize = 2.4*figsize[0]
                
        ax.text(x = 0 , y = ylim_sup-(ylim_sup-88.75)/2, horizontalalignment = "center" , verticalalignment = "center" , 
                s = titre , fontsize = titlesize , family = "serif" , color = linecolor)


    else: # SI on ne souhaite pas colorer les lieux de tirs selon la finalité du tir : 
        if critere==None: # s'il n'y a aucun critère renseigné, beaucoup de points ==> alpha plus proche de 0 (transparence).
            sns.scatterplot(data_joueur["x location"] , y = 83.5-data_joueur["y location"] , 
                            hue = data_joueur[hue] , palette = palette , alpha = 0.4 ,  # alpha = 0.4
                            hue_order = data_joueur[hue].value_counts().sort_index(ascending = False).index , ax = ax)

        else: # s'il y a un critère sélectionné, peu de points ==> alpha plus proche de 1.
            sns.scatterplot(data_joueur["x location"] , y = 83.5-data_joueur["y location"] ,  
                            hue = data_joueur[hue] , palette = palette , alpha = 0.7 ,   # alpha = 0.7
                            hue_order = data_joueur[hue].value_counts().sort_index(ascending = False).index , ax = ax)
    
        ax.legend(loc = "lower right") # positionnement de la légende dans le coin inférieur droit de la figure.
        
        if hue == "shot zone range": # SI on souhaite colorer les lieux de tirs selon la tranche de distance tireur-panier : 
            stats_by = statistic_by(data = data_joueur , critere = "shot zone range") # le dictionnaire des statistiques de tir par tranche de distance tireur-panier
        
        elif hue == "shot zone area": # SI on souhaite colorer les lieux de tirs selon la zone de tir face au panier : 
            stats_by = statistic_by(data = data_joueur , critere = "shot zone area") # le dictionnaire des statistiques de tir par zone de tir face au panier
            
        elif hue == "shot type": # SI on souhaite colorer les lieux de tirs selon la valeur du tir tenté : 
            stats_by = statistic_by(data = data_joueur , critere = "shot type") # le dictionnaire des statistiques de tir par valeur de tir
               
        elif hue == "shot zone basic": # SI on souhaite colorer les lieux de tirs selon la zone de tir : 
            stats_by = statistic_by(data = data_joueur , critere = "shot zone basic") # le dictionnaire des statistiques de tir par zone de tir
       
            
        # pour chaque modalité/valeur de la variable renseignée dans 'hue', nous allons afficher le texte demandé 
        # (la fréquence ou le taux de réussite) dans la zone du terrain correspondante :     
        
        for i in range(len(data_joueur[hue].unique())): 
            val = data_joueur[hue].value_counts().sort_index().index[i] # la modalité/valeur en question
            
            if hue=="shot zone range": # SI l'on souhaite distinguer les tirs par tranche de distance tireur-panier :  
                abs = 0 # abscisse en laquelle centrer le texte à écrire 
                ord = y_text_range[val] # ordonnée en laquelle centrer le texte à écrire
            
            elif hue=="shot zone area": # SI l'on souhaite distinguer les tirs par zone de tir par rapport au panier :
                abs = x_text_area[val] # abscisse en laquelle centrer le texte à écrire 
                ord = y_text_area[val] # ordonnée en laquelle centrer le texte à écrire
            
            if hue=="shot zone basic": # SI l'on souhaite distinguer les tirs par zone de tir :
                abs = x_text_basic[val] # abscisse en laquelle centrer le texte à écrire 
                ord = y_text_basic[val] # ordonnée en laquelle centrer le texte à écrire
            
            elif hue=="shot type": # SI l'on souhaite distinguer les tirs par valeur du tir :
                abs = x_text_type[val] # abscisse en laquelle centrer le texte à écrire 
                ord = y_text_type[val] # ordonnée en laquelle centrer le texte à écrire  
                 
            
            # Suivant que l'on souhaite afficher les fréquences ou les taux de réussite, le texte à afficher diffère : 
            
            if frequency_or_efficiency=="frequency": # SI on souhaite afficher le texte des fréquences de tir par modalité/valeur :
                part_tirs_tentes_val = stats_by["% tentés"][i] # la part de tirs tentés par le joueur dans cette modalité/valeur
                text = str(part_tirs_tentes_val.round(2)) + " %" # le texte à écrire
                fontsize = (20/12)*figsize[0] # la taille de police du texte
                
                if val=="left corner 3": # s'il faut écrire le texte dans le corner gauche : 
                    rotation=90 # écrire le texte parallèlement à la ligne de touche
                
                elif val=="right corner 3": # s'il faut écrire le texte dans le corner droit : 
                    rotation = -90 # écrire le texte parallèlement à la ligne de touche
                
                else: # s'il faut écrire le texte partout ailleurs que dans un corner :
                    rotation = 0 # écrire le texte parallèlement à la ligne de fond 
                    
            elif frequency_or_efficiency=="efficiency": # SI on souhaite afficher le texte des taux de réussite au tir par modalité/valeur :
                tirs_tentes_val = stats_by["tentés"][i] # le nombre de tirs tentés par le joueur pour cette modalité/valeur
                efficacite_tir_val = stats_by["efficacité"][i] # le taux de réussite au tir pour cette modalité/valeur
                text = str(efficacite_tir_val.round(2))+ " %" + " (" + str(tirs_tentes_val) + " tirs)" # le texte à écrire
                
                if hue=="shot zone area": # s'il faut écrire les taux de réussite au tir par zone de tir face au panier : 
                    fontsize = 1.3*figsize[0] # la taille de police du texte
                    rotation = 0 # écrire le texte parallèlement à la ligne de fond 
                                
                elif hue=="shot zone basic": # s'il faut écrire les taux de réussite au tir par zone de tir :
                
                    if val=="left corner 3": # s'il faut écrire le texte dans le corner gauche : 
                        rotation=90 # écrire le texte parallèlement à la ligne de touche
                        fontsize = 1.333*figsize[0]

                    elif val=="right corner 3": # s'il faut écrire le texte dans le corner droit : 
                        rotation = -90 # écrire le texte parallèlement à la ligne de touche
                        fontsize = 1.333*figsize[0] # la taille de police du titre

                    else: # s'il faut écrire le texte partout ailleurs que dans un corner :
                        rotation = 0 # écrire le texte parallèlement à la ligne de fond 
                        fontsize = 1.11*figsize[0] # la taille de police du titre
                        
                else: # s'il faut écrire les taux de réussite au tir pour tout autre critère que les zones de tir : 
                    fontsize = 1.107*figsize[0] # la taille de police du texte
                    rotation = 0 # écrire le texte parallèlement à la ligne de fond 
         
            else: # SI la modalité renseignée dans l'argument "frequency_or_efficiency" n'est pas celle attendue : 
                raise ValueError("valeur attendue pour l'argument 'frequency_or_efficiency' : 'frequency' , 'efficiency'.") 
            
            # le texte à écrire sur la terrain, pour chaque modalité/valeur de la variable renseignée dans l'argument 'hue' : 
            
            ax.text(x = abs , y = ord , s = text , fontsize = fontsize , rotation = rotation , family = "sans serif" , 
                    color = "yellow" , horizontalalignment = "center" , verticalalignment = "center" , fontweight = "heavy" , 
                    fontstyle = "italic") # le texte est centré autour du point (x,y).
           

        # Suivant que l'on souhaite afficher les fréquences ou les taux de réussite au tir et suivant le critère renseigné (ou non), le titre diffère : 

        if frequency_or_efficiency=="frequency": # SI on souhaite afficher le texte des fréquences de tir par modalité/valeur :
            if critere!=None: # SI un critère est renseigné : 
                
                nbr_shots_critere = len(data_joueur) # le nombre de tirs pris par le joueur selon ce critère
                nbr_shots_total = len(data[data["player name"]==player]) # le nombre total de tirs pris par le joueur
                
                pct_shots_critere = (nbr_shots_critere/nbr_shots_total)*100 # le pourcentage de tirs pris par le joueur selon ce critère
                
                if critere in ["period","team name","conference","division","adversary","conference adv","division adv","home"]: # SI le critère renseigné est dans la liste ci-jointe :
                    titre = f"{player.upper()} ({critere}={val_critere}, {str(np.round(pct_shots_critere,2))} % des tirs, fréquence)" # titre à afficher de la forme "JOUEUR (critere=val, fréquence)"
                    titlesize = 1.315*figsize[0] # la taille de police du titre
                
                else: # SI le critère renseigné n'est pas dans la liste ci-dessus (pas besoin de préciser le critère, qui se déduit facilement) : 
                    titre = f"{player.upper()} ({val_critere}, {str(np.round(pct_shots_critere,2))} % des tirs, fréquence)"  # titre à afficher de la forme "JOUEUR (val, fréquence)"
                    titlesize = 1.43*figsize[0] # la taille de police du titre
            
            else: # SI aucun critère n'est renseigné : 
                titre = f"{player.upper()} (fréquence)" # titre à afficher de la forme "JOUEUR (fréquence)"
                titlesize = 2.4*figsize[0] # la taille de police du titre
            
            
            
        elif frequency_or_efficiency=="efficiency": # SI on souhaite afficher le texte des taux de réussite au tir par modalité/valeur :
            
            if critere!=None: # SI un critère est renseigné : 
                
                nbr_shots_critere = len(data_joueur) # le nombre de tirs pris par le joueur selon ce critère
                nbr_shots_total = len(data[data["player name"]==player]) # le nombre total de tirs pris par le joueur
                
                pct_shots_critere = (nbr_shots_critere/nbr_shots_total)*100 # le pourcentage de tirs pris par le joueur selon ce critère
                
                if critere in ["period","team name","conference","division","adversary","conference adv","division adv","home"]: # SI le critère renseigné est dans la liste ci-jointe :
                    titre = f"{player.upper()} ({critere}={val_critere}, {str(np.round(pct_shots_critere,2))} % des tirs, efficacité) " # titre à afficher de la forme "JOUEUR (critere=val, efficacité)"
                    titlesize = 1.315*figsize[0] # la taille de police du titre
                
                else: # SI le critère renseigné n'est pas dans la liste ci-dessus (pas besoin de préciser le critère, qui se déduit facilement) : 
                    titre = f"{player.upper()} ({val_critere}, {str(np.round(pct_shots_critere,2))} % des tirs, efficacité)" # titre à afficher de la forme "JOUEUR (val, efficacité)"
                    titlesize = 1.3*figsize[0] # la taille de police du titre
            
            else: # SI aucun critère n'est renseigné : 
                titre = f"{player.upper()} (efficacité)" # titre à afficher de la forme "JOUEUR (efficacité)"
                titlesize = 2.4*figsize[0] # la taille de police du titre
            
            
        else: # SI la modalité renseignée dans l'argument "frequency_or_efficiency" n'est pas celle attendue :
            raise ValueError("valeur attendue pour l'argument 'frequency_or_efficiency' : 'frequency' , 'efficiency'.")  
            
        
        # affichage du titre sous forme de texte derrière la ligne de fond du terrain : 
        
        ax.text(x = 0 , y = ylim_sup-(ylim_sup-88.75)/2 , s = titre , fontsize = titlesize , family = "serif" , 
                color = linecolor ,  horizontalalignment = "center" , verticalalignment = "center")  # texte centré en (x,y)  

In [None]:
fig = plt.figure(figsize = (13.5,13.5))
ax = fig.add_subplot(111)
ax.set_facecolor("black")

shot_chart(fig , ax , figsize = (13.5,13.5) , critere = "home" , val_critere = 0 , 
           player = "giannis antetokounmpo" , 
           frequency_or_efficiency = "frequency" , hue = "shot zone basic")

- Création d'une **fonction permettant d'afficher côte à côte la carte de tirs d'un même joueur selon 2 modalités d'un critère choisit** : 

In [13]:
def shot_chart_by(player = "kevin durant" , data = df_twenty , critere = "action type" , modalite_1 = "layup shot" , modalite_2 = "dunk shot" , hue = "shot zone area" , palette = "Dark2" , figsize = (28,12) , facecolor = "black" , linecolor = "white" , hoop_color = "red" , frequency_or_efficiency = "frequency"):
    
    """Affiche côte à côte les cartes de tirs du joueur renseigné, différenciées selon 2 des modalité modalite_1 et modalite_2 
       de la variable renseignée dans l'argument 'critere'.
       -----------------------------------------------------------------------------------------------------------------------
       ARGUMENTS :
       
       - data : le DataFrame contenant les données de tir.
       
       - player : le joueur dont on souhaite tracer les cartes de tirs.
       
       - critere : la variable du DataFrame selon laquelle on souhaite différencier les cartes de tirs (1 carte par modalité
         unique prise par cette variable).
         
       - modalite_1 : la 1ère modalité de critere selon laquelle filtrer les tirs.
       
       - modalite_2 : la 2ème modalité de critere selon laquelle filtrer les tirs.
       
       - figsize : les dimensions de la grille à afficher (grille comportant 1 ligne et 2 colonnes).
       
       - hue : la variable du DataFrame dont les valeurs prises servent à différencier les tirs par la couleur.
    
       - palette : la palette dd couleur à utiliser.
    
       - frequency_or_efficiency : le type de texte à afficher sur la carte ('frequency' pour afficher les fréquences de tirs ou 
         'efficiency' pour afficher les taux de réussite au tir).
      
       - facecolor : la couleur de fond du terrain.
    
       - linecolor : la couleur dans laquelle doivent être dessinées les lignes du terrain.
       
       - hoop_color : la couleur dans laquelle doit être dessiné le panier."""
       
       
    
    # SI au moins l'une des deux modalités renseignées n'est pas prise par la variable renseignée dans l'argumet 'critere' :
    
    if (modalite_1 not in data[data["player name"]==player][critere].unique()) or (modalite_2 not in data[data["player name"]==player][critere].unique()):
        raise ValueError(f"valeur attendue pour les arguments 'modalite_1' et 'modalite_2' : {data[data['player name']==player][critere].unique()}")
    
    else: # Sinon : 
        fig , ax = plt.subplots(1,2,figsize = figsize) # générer une grille multi-graphiques comportant 1 ligne et 2 colonnes
        ax[0].set_facecolor(facecolor) # coloration du fond de la 1ère grille
        ax[1].set_facecolor(facecolor) # coloration du fond de la 1ère grille
    
        
        # Tracer des 2 cartes de tirs côte à côte :    
        
        # 1ère carte de tirs sur la grille de gauche : pour la modalité modalite_1 du critère renseigné :
        
        shot_chart(fig , ax[0] , figsize = (figsize[0]/2 , figsize[1]) , data = data , player = player , critere = critere , 
                   val_critere = modalite_1 , hue = hue , palette = palette , frequency_or_efficiency = frequency_or_efficiency)
        
        # 2ème carte de tirs sur la grille de gauche : pour la modalité modalite_2 du critère renseigné :
        
        shot_chart(fig , ax[1] , figsize = (figsize[0]/2 , figsize[1]) , data = data , player = player , critere = critere , 
                   val_critere = modalite_2 , hue = hue , palette = palette , frequency_or_efficiency = frequency_or_efficiency)

- Création d'une **fonction permettant de créer une grille avec la carte de tirs d'un même joueur pour CHAQUE modalité d'une variable critère choisie** : 

In [14]:
def shot_chart_grid_by(figsize = (26,52) , player = "kevin durant" , data = df_twenty , critere = "action type" , frequency_or_efficiency = "frequency" , hue = "shot zone area" , palette = "Dark2" , facecolor = "black" , linecolor = "white" , hoop_color = "red"):
    
    """Affiche dans une grille multi-graphiques les cartes de tirs du joueur renseigné, différenciées selon CHAQUE modalité de 
    la variable renseignée dans l'argument 'critere'.
    --------------------------------------------------------------------------------------------------------------------------
    ARGUMENTS :
    
    - data : le DataFrame contenant les données de tir.
       
    - player : le joueur dont on souhaite tracer les cartes de tirs.
       
    - critere : la variable du DataFrame selon laquelle on souhaite différencier les cartes de tirs (1 carte par modalité
         unique prise par cette variable).
       
    - figsize : les dimensions de la grille à afficher (grille comportant autant de lignes que critere prend de valeurs, et 2 colonnes).
       
    - hue : la variable du DataFrame dont les valeurs prises servent à différencier les tirs par la couleur.
    
    - palette : la palette dd couleur à utiliser.
    
    - frequency_or_efficiency : le type de texte à afficher sur la carte ('frequency' pour afficher les fréquences de tirs ou 
         'efficiency' pour afficher les taux de réussite au tir).
      
    - facecolor : la couleur de fond du terrain.
    
    - linecolor : la couleur dans laquelle doivent être dessinées les lignes du terrain.
       
    - hoop_color : la couleur dans laquelle doit être dessiné le panier."""
       
    
        
    data_joueur = data[data["player name"]==player] # les données du joueur renseigné en argument.
    
    n = len(data_joueur[critere].unique()) # le nombre de valeurs uniques de la variable renseignée dans 'critere'.
        
    if n<=2: # SI le critère renseigné prend soit 1 valeur distincte, soit 2 valeurs distinctes : 
        
        if n==2: # SI le critère renseigné prend exactement 2 valeurs distinctes : 
            fig , ax = plt.subplots(1,2,figsize = figsize) # on génère une grille contenant 1 ligne et 2 colonnes
            
            for i in range(2): # Pour chaque modalité prise par la variable renseigné dans 'critere' : 
                modalite_critere = data_joueur[critere].value_counts().sort_index().index[i] # nous allons par la suite filtrer les données du joueur selon cette modalité du critère renseigné.
                ax[i].set_facecolor(facecolor) # coloration du fond de la figure
                
                # Tracer de la carte de tir correspondant à chacune des 2 modalités du critère, sur chacune des 2 grilles.
                
                shot_chart(fig , ax[i] , figsize = (figsize[0]/2 , figsize[1]) , data = data , player = player , 
                           critere = critere , val_critere = modalite_critere , hue = hue , frequency_or_efficiency = frequency_or_efficiency)
        
        else: # SI le critère renseigné prend exactement 1 valeur distincte (pas besoin de filtrer les données du joueur dans ce cas) : 
            fig = plt.figure(figsize = figsize) # on ne génrère pas de grille, mais simplement une figure classique.
            ax = fig.add_subplot(111) 
            ax.set_facecolor(facecolor) # coloration du fond de la figure
            
            # Tracer de la carte de tirs classique du joueur : 
            
            shot_chart(fig , ax , figsize = figsize , data = data , player = player , critere = None , val_critere = None , 
                       hue = hue , frequency_or_efficiency = frequency_or_efficiency)
    
    else: # SI le critère renseigné prend strictement plus de 2 valeurs distinctes : 
        if n%2==0: # SI ce critère prend un nombre PAIR de valeurs distinctes : 
            nbr_lignes_grille = n//2 # on génèrera une grille multi-graphiques comportant n//2 lignes
        else: # SI ce critère prend un nombre IMPAIR de valeurs distinctes : 
            nbr_lignes_grille = int(n/2)+1 # on génèrera une grille multi-graphiques contenant un nombre de lignes égal à la partie entière supérieure de n/2
            
        fig , ax = plt.subplots(nbr_lignes_grille,2,figsize = figsize) # génération d'une grille multi-graphiques, comportant 2 colonns
        
        k = 0 # l'indice de la modalité de la variable 'critere', initialisé à zéro.
        
        for i in range(nbr_lignes_grille): # Pour chaque ligne de la grille : 
            for j in range(2): # Pour chaque colonne de la grille : 
                
                # Distinction du cas ou le nombre de valeurs prises par le critère renseigné est PAIR ou IMPAIR : 
                
                if n%2!=0: # SI le critère renseigné prend un nombre IMPAIR de valeurs distinctes, alors une des grilles restera vide ==> il y a une grille de plus que de modalités prise par le critère
                    if k < n: # cas k >= n : ne pas tracer de carte de tirs dans la dernière grille, sinon une erreur sera retournée.
                        modalite_critere = data_joueur[critere].value_counts().sort_index().index[k] # la modalité du critère selon laquelle filtrer les données du joueur
                        
                        ax[i,j].set_facecolor(facecolor) # coloration du fond de la figure
                        
                        # Tracer de la carte des tirs du joueurs pour cette modalité du critère renseigné : 
                        
                        shot_chart(fig , ax[i,j] , figsize = (figsize[0]/2 , figsize[1]/nbr_lignes_grille) , data = data , 
                                   player = player , critere = critere , val_critere = modalite_critere , hue = hue , 
                                   palette = palette , frequency_or_efficiency = frequency_or_efficiency)
                    
                
                else: # SI le critère renseigné prend un nombre PAIR de valeurs distinctes, alors toutes les grilles seront remplies, car il y a autant de grilles que de valeurs distinctes du critère
                    modalite_critere = data_joueur[critere].value_counts().sort_index().index[k] # la modalité du critère
                    
                    ax[i,j].set_facecolor(facecolor) # coloration du fond de la figure.
                    
                    # Tracer de la carte des tirs du joueur pour cette modalité du critère renseigné : 
                    
                    shot_chart(fig , ax[i,j] , figsize = (figsize[0]/2 , figsize[1]/nbr_lignes_grille) , data = data , 
                               player = player , critere = critere , val_critere = modalite_critere , hue = hue , 
                               palette = palette , frequency_or_efficiency = frequency_or_efficiency)
                    
                
                k+=1 # on passe à la modalité suivante du critère (incrémentation d'une unité)

- Création d'une **fonction permettant de dessiner côte à côte les cartes de tirs de 2 joueurs différents** :

In [15]:
def shot_chart_comparison_2(figsize = (28,12) , data = df_twenty , player1 = "kevin durant" , player2 = "lebron james" , critere = None , val_critere = None , hue = "shot made flag" , frequency_or_efficiency = "frequency" , facecolor = "black" , linecolor = "white" , hoop_color = "orange"):
    
    """Affiche côte à côte les cartes de tirs des 2 joueurs NBA renseignés en argument."""
    
    # Création d'une grille multi-graphiques contenant 1 ligne et 2 colonnes : 
    
    fig , ax = plt.subplots(1,2,figsize = figsize)
    ax[0].set_facecolor(facecolor) # coloration du fond de la figure
    ax[1].set_facecolor(facecolor) # coloration du fond de la figure
    
    
    # Tracer des cartes de tirs des 2 joueurs côte à côte : 
    
    # La carte de tirs du 1er joueur renseigné, sur la grille de gauche : 
    
    shot_chart(fig , ax[0] , figsize = (figsize[0]/2 , figsize[1]) , data = data , player = player1 , critere = critere , 
               val_critere = val_critere, hue = hue , frequency_or_efficiency = frequency_or_efficiency)
    
    # La carte de tirs du 2nd joueur renseigné, sur la grille de droite : 
    
    shot_chart(fig , ax[1] , figsize = (figsize[0]/2 , figsize[1]) , data = data , player = player2 , critere = critere , 
               val_critere = val_critere , hue = hue , frequency_or_efficiency = frequency_or_efficiency)

- Création d'une **fonction permettant de comparer la carte des tirs de plusieurs joueurs différents, dans une grille** : 

In [16]:
def shot_chart_comparison_n(figsize = (32,10) , data = df_twenty , players = ["kevin durant" , "lebron james" , "anthony davis"] , critere = None , val_critere = None , hue = "shot made flag" , palette = "Dark2" , frequency_or_efficiency = "frequency" , facecolor = "black" , linecolor = "white" , hoop_color = "orange"):
    
    """Affiche dans une grille multi-graphiques les cartes de tirs des n joueurs NBA renseignés en argument."""
    
    nbr_players = len(players) # le nombre de joueurs dont on souhaite tracer la carte des tirs
    
    
    # CAS ou l'ou souhaite afficher, pour chaque joueur,soit la carte de tirs avec les fréquences, soit celle avec les taux de réussite au tir :
    
    if frequency_or_efficiency in ["frequency" , "efficiency"] : 
    
        if nbr_players<=3: # SI l'on souhaite tracer la carte des tirs de 2 joueurs ou de 3 joueurs : 
            fig , ax = plt.subplots(1,nbr_players,figsize = figsize) # génération d'une grille comportant 1 ligne et nbr_players colonnes

            for i in range(nbr_players): # Pour chaque joueur dont on souhaite tracer la certe des tirs...
                ax[i].set_facecolor(facecolor) # coloration du fond de la figure 

                # Tracer de la carte de tirs du joueur dans la grille réservée : 

                shot_chart(fig , ax[i] , figsize = (figsize[0]/nbr_players , figsize[1]) , data = data , player = players[i] , 
                           critere = critere , val_critere = val_critere, hue = hue , palette = palette , 
                           frequency_or_efficiency = frequency_or_efficiency)

        else: # SI l'on souhaite tracer la carte des tirs de strictement plus de 3 joueurs : 
            
            if nbr_players%2==0: # SI le nombre de joueurs est PAIR : 
                nbr_lignes_grille = nbr_players//2 # génération d'une grille comportant nbr_players//2 lignes et 2 colonnes

            else: # SI le nombre de joueurs est IMPAIR : 
                nbr_lignes = nbr_lignes_grille = int(nbr_players/2)+1 # génération d'une grille comportant int(nbr_players/2)+1 lignes et 2 colonnes

            fig , ax = plt.subplots(nbr_lignes_grille,2,figsize = figsize) # on génère la grille multi-graphiques

            k=0 # l'indice du joueur de 'players' dont on trace la carte des tirs, initialisé à zéro

            for i in range(nbr_lignes_grille): # Pour chaque ligne de la grille...
                    for j in range(2): # Pour chaque colonne de la grille...

                        if nbr_players%2!=0: # SI le nombre joueurs est IMPAIR, alors une des grilles restera vide ==> il y a une grille de plus que de joueurs

                            if k < nbr_players: # cas k >= nbr_players : ne pas tracer de carte de tirs dans la dernière grille, sinon une erreur sera retournée.

                                ax[i,j].set_facecolor(facecolor) # coloration du fond de la figure

                                # Tracer de la carte des tirs du joueur dans une des grilles : 

                                shot_chart(fig , ax[i,j] , figsize = (figsize[0]/2 , figsize[1]/nbr_lignes_grille) , data = data , 
                                           player = players[k] , critere = critere , val_critere = val_critere, hue = hue , 
                                           palette = palette , frequency_or_efficiency = frequency_or_efficiency)

                            k+=1 # on passe au joueur suivant (incrémentation d'une unité)

                        else: # SI le nombre de joueurs est PAIR, alors toutes les grilles seront remplies car il y a autant de grilles que de joueurs.

                            ax[i,j].set_facecolor(facecolor) # coloration du fond de la figure

                            # Tracer de la carte des tirs du joueur dans une des grilles : 

                            shot_chart(fig , ax[i,j] , data = data , figsize = (figsize[0]/2 , figsize[1]/nbr_lignes_grille) , 
                                       player = players[k] , critere = critere , val_critere = val_critere, hue = hue , 
                                       palette = palette , frequency_or_efficiency = frequency_or_efficiency)

                            k+=1 # on passe au joueur suivant (incrémentation d'une unité)
                            
        
    # CAS ou l'on souhaite afficher, pour chaque joueur, à la fois la fréquence ET le taux de réussite au tir :
        
    elif frequency_or_efficiency=="both":

        fig , ax = plt.subplots(nbr_players, 2, figsize = figsize) # génération d'une grille comportant nbr_players lignes (1 ligne par joueur) et 2 colonnes

        for i in range(nbr_players): # Pour chaque joueur dont on souhaite tracer la certe des tirs...

            ax[i,0].set_facecolor(facecolor) # coloration du fond de la 1ère figure du joueur
            ax[i,1].set_facecolor(facecolor) # coloration du fond de la 2nde figure du joueur

            # Tracer de la carte de tirs du joueur avec affichage des FREQUENCES, dans la 1ère colonne de la grille : 

            shot_chart(fig , ax[i,0] , figsize = (figsize[0]/2 , figsize[1]/nbr_players) , data = data , player = players[i] , 
                       critere = critere , val_critere = val_critere, hue = hue , palette = palette , 
                       frequency_or_efficiency = "frequency")
            

            # Tracer de la carte de tirs du joueur avec affichage des TAUX DE REUSSITE, dans la 2nde colonne de la grille : 

            shot_chart(fig , ax[i,1] , figsize = (figsize[0]/2 , figsize[1]/nbr_players) , data = data , player = players[i] , 
                       critere = critere , val_critere = val_critere, hue = hue , palette = palette , 
                       frequency_or_efficiency = "efficiency")
            

    else:
        raise ValueError("valeur attendue pour l'argument 'frequency_or_efficiency' : 'frequency', 'efficiency' ou 'both'.")
                

In [None]:
shot_chart_comparison_n(frequency_or_efficiency="both" , hue = "shot zone basic" , figsize = (40,65))

## 1-a) Comparaison par poste.

==> Nous allons regrouper les 20 joueurs de la liste selon leur poste : en effet, un pivot et un meneur n'ont pas grand chose en commun, tant sur le plan physique que sur le plan du style de jeu ou même de l'espace occupé en attaque. Il serait donc farfelu de comparer les tirs de 2 joueurs jouant sur ces 2 postes, en tout cas en terme de fréquences de tirs.  

Regroupons donc les joueurs par poste : 

In [18]:
# regroupement des PIVOTS de la liste : 

pivots = ["tim duncan" , "pau gasol" , "anthony davis"]

# regroupement des MENEURS de la liste : 

meneurs = ["allen iverson" , "steve nash" , "tony parker" , "chris paul" , "russell westbrook" , "stephen curry" , 
           "damian lillard"]

# regroupement des ARRIERES de la liste : 

arrieres = ["kobe bryant" , "ray allen" , "paul pierce" , "manu ginobili" , "dwyane wade" , "james harden"]

# regroupement des AILIERS / AILIERS FORTS de la liste : 

ailiers = ["lebron james" , "kevin durant" , "kawhi leonard" , "giannis antetokounmpo"]

### i) Les PIVOTS.

- Comparaison **par zone de tirs :**

In [None]:
shot_chart_comparison_n(players = pivots , hue = "shot zone basic" , figsize = (55,18));

**DECRYPTAGE :**  

- En terme de **fréquences de tir :**  

==> Pour les 3 joueurs, les deux zones dans lesquelles le plus grand pourcentage de tirs est tenté sont **la zone restrictive** (orange) avec pour chacun **plus d'un tiers des tirs tentés dans cette zone**, et **la zone mi-distance** (violet) dans laquelle ils tentent chacun entre 29 % et 35 % de leurs tirs : rien de très surprenant à cela, puisque le jeu d'un pivot au basket se situe majoritairement autour du panier, voir même au contact du panier. Leur grande taille et leur physique souvent massif font qu'il est souvent beaucoup plus aisé pour eux de marquer proche du panier.  

==> La **raquette** (vert) est également un des lieux de tir favoris des pivots, ce qui se vérifie avec Tim Duncan et Pau Gasol. Cependant, une différence importante est à noter entre les 3 joueurs sur ce point : bien que Duncan et Gasol tirent presque indifféremment dans la zone restrictive, dans la raquette ou à mi-distance, Anthony Davis tirent assez peu dans la raquette par rapport à ces 2 joueurs (presque 9 % du temps en moins).  
On remarque d'ailleurs que cet écart en défaveur de Davis dans la raquette est quasiment comblé par l'écart entre les proportions de tirs tentés derrière **l'arc des 3 points** des trois joueurs : alors que Duncan et Gasol n'ont quasiment jamais tiré derrière l'arc de toute leur carrière, ce n'est pas le cas de Davis, qui aime bien sortir en poste et prendre du champ afin de dégainer de loin (7 % du temps), ce qui le rend d'autant plus dangereux en attaque et surtout difficile à défendre.

==> Enfin, comme on pouvait s'y attendre, quasiment aucun tir n'est tenté dans **les corners** (couloirs le long des touches) par ces 3 joueurs avec moins d'1 % du total des tirs tentés dans cette zone, une zone de tir essentiellement pratiquée par les arrières.  

- Comparaison en terme **d'efficacité au tir :** 

In [None]:
for player in pivots:
    fig = plt.figure(figsize = (12,12))
    ax = fig.add_subplot(111)
    ax.set_facecolor("black")
                     
    shot_chart(fig , ax , figsize = (12,12) ,player = player , hue = "shot zone basic" , frequency_or_efficiency = "efficiency")

**DECRYPTAGE :**  

- En terme de **réussite au tir :**  

**. zone restrictive** (*orange*) : le plus efficace dans cette zone se nomme **Anthony Davis**, avec **plus de 70 % de réussite**. Cependant, Tim Duncan et Pau Gasol ne sont pas en reste, avec des pourcentages de réussite assez proches.  
Il s'agit de la zone du terrain dans laquelle la probabilité de marquer est la plus élevée, car la distance de tir est la plus faible. Les pivots utilisent très souvent le layup, le dunk et le alley oop dans pour tirer depuis cette zone, des tirs généralement simple à marquer, d'autant plus qu'un règle NBA stipule que tout défenseur situé dans la zone restrictive ne se verra jamais attribué de passage en force. Un pivot bien servi dans cette zone a donc de grande chances de marquer, ce qui explique ces pourcentages de réussite très élevée pour les 3 joueurs.  
Notons cependant que Davis ayant commencé sa carrière NBA en 2013, il a joué beaucoup moins de matchs que ses 2 compères dans sa carrière, ce qui se vérifie avec le nombre de tirs tentés dans cette zone (plus du double de tirs tentés pour Duncan et Gasol) : on peut donc se demander si avec le temps, Davis parviendra à garder une telle efficacité au tir dans la zone restrictive...  

**. raquette** (*vert*) : Là encore, **Anthony Davis** domine le classement, mais les taux de réussite des 3 joueurs sont extrêmement proches.  
Notons, pour chacun d'eux, la grande différence entre le taux de réussite dans la raquette et celui dans la zone restrictive !  
Une des explications réside dans la pression défensive exercée, beaucoup plus forte dans la raquette que dans la zone restrictive (comme mentionné ci-dessus avec la règle du passage en force).  
Mais il y a également le paramètre "distance" à prendre en compte, car la raquette est plutôt large (4,8 m de largeur pour 5,5 m de heuteur) et la distance panier-tireur est plus importante ici que dans la zone restrictive.  

**. mi-distance** (*violet*) : cette fois-ci, le plus performant se nomme **Pau Gasol**, l'espagnol dominant de peu Duncan et Davis sur ce spot de tir.  
Le tir à mi-distance est l'un des tirs dont la probabilité de rentrer est la plus faible avec les tirs à 3 points : en effet, le tireur n'est ni proche ni très loin du panier et l'angle de tir peut varier de 0° à 180 °. Pour rentrer, un tir pris dans cette zone requiert donc un très bon touché de balle ainsi qu'un bon dosage et à ce jeux-là, Gasol est le meilleur.  
Notons que les taux de réussite dans cette zone sont quasiment équivalents à ceux de la raquette pour les 3 joueurs, ce qui est assez remarquable !  

**. arc des 3 points** (*marron*) : Une nouvelle fois, **Pau Gasol** est la plus précis des pivots sur ce lieu de tir : il domine de peu Anthony Davis mais surclasse Tim Duncan, avec un taux de réussite plus de 2 fois supérieur !  
Il est évident que Tim Duncan était en grande difficultées lorsqu'il s'agissait de prendre un tir derrière l'arc, ce qui peut expliquer le fait qu'il ait tenté aussi peu de tirs ici dans sa carrière (seulement 0,65 %)...  
On peut en revanche se demander pourquoi Pau Gasol ne prenait pas plus de tirs depuis cette zone (seulement 1,88 %), au vu de son très bon taux de réussite, à moins que ce ne soit l'inverse, et que ce bon pourcentage s'explique par le faible nombre de tirs tentés ici par le pivot espagnol...  
Notons cependant, à la décharge de Tim Duncan que contrairement à Davis par exemple, sa carte de tirs montre des prises de tirs dans des positions extrêmement compliquées derrière l'arc (plus proches de la ligne médiane que de l'arc), ce qui à sûrement contribué à baisser son pourcentage de réussite ici.  

**. corners** : les tirs tentés dans les 2 corners sont trop peu nombreux pour pouvoir juger de l'efficacité réelle des pivots dans cette zone.

**BILAN PIVOTS :**  
    
==> Les habitudes de tirs de nos pivots sont assez similaires : la zone restrictive et la zone à mi-distance sont leurs lieux de tirs privilégiés, ce qui est attendu pour un joueur jouant au poste de pivot.
Cependant, une différence importante survient lorsque l'on regarde les tirs pris derrière l'arc des 3 points : cette différence est sûrement le signe d'un changement d'époque, puisqu'Anthony Davis fait partie de cette jeune génération de joueurs modernes, envers qui les recruteurs et entraîneurs exigent une grande polyvalence dans le jeu plutôt qu'une spécialisation dans un secteur de jeu en particulier, comme c'était plus le cas avant : le joueur de basket américain doit être plus "professionnel" qu'auparavant.   
Cela se confirme également avec les taux de réussites au tir, plutôt très bons pour Davis dans toutes les zones sans exception, alors que Tim Duncan était par exemple relativement peu à l'aise derrière l'arc.

### ii) Les MENEURS.

- Comparaison **par zone de tirs :**

In [None]:
shot_chart_comparison_n(players = meneurs , hue = "shot zone basic" , figsize = (35,75) , 
                        frequency_or_efficiency = "frequency");

**DECRYPTAGE :**  

- En terme de **fréquences de tir :**  

==> On peut distinguer **3 catégories de meneurs** ici :  

**.** les meneurs de jeu **modernes des années 2010**, qui adorent prendre énormément de tirs au loin : c'est le cas de **Stephen Curry** et **Damian Lillard**. Ces joueurs font partie de la génération "Moreyball", un style de jeu né dans les années 2010 et créé par l'ex-Manager général des Houston Rockets **Daryl Morey** consistant à monter la balle le plus vite possible vers l'avant avant que la défense ne soit repliée, afin de trouver un shoot ouvert au près du panier ou à 3 points.  
Dans cette philosophie de jeu, le tir à mi-distance est bani au profit du tir à 3 points, suite à un constat très simple réalisé par Morey : la probabilité de marquer un tir à mi-distance (donc à 2 points) n'étant pas très différente de la probabilité de marquer un tir pris derrière l'arc (donc à 3 points) mais les paniers à 2 points rapportant 1,5 fois moins de points que les paniers à 3 points (3/2 = 1.5), il est plus rentable de tenter sa chance à 3 points. Autrement dit, bien que la probabilité qu'un tir soit marqué diminue avec l'augmentation de la distance de tir, ce déficit de probabilité est largement en faveur du tir à 2 points est compensé par le nombre de points que rapporte un panier à 3 points à l'équipe.  
Ce principe de jeu est parfaitement illustré par les Rockets des années 2010, dont la figure de proue du projet se nommait James Harden.  
Constatant que cette philosophie de jeu fonctionne (en tout cas en saison régulière), beaucoup d'autres franchises NBA se sont mises à suivre cet exemple, et nottamment les Warriors de Stephen Curry, mais de manière moins extrême que pour les Rockets.  

Un autre phénomème intéressant réside dans l'élaboration par la NBA de règles visant à rendre ce sport spectaculaire depuis des années : et selon la NBA, cela passe par l'attaque.  
Ainsi, tout est fait pour que l'attaque soit au centre des matchs NBA, que le jeu soit rapide, que les séquences offensives se multiplient, avec par exemple l'évolution de la règle sur les rebonds offensifs il y a quelques saisons : si un tir est manqué et récupéré par un coéquipier (rebond offensif), l'équipe dispose de seulement 14 secondes (au lieu de 24 secondes auparavant) pour aller marquer un panier. L'objectif etant de ne pas voir une équipe s'éterniser en attaque.

On voit donc bien la prédominance des tirs pris derrière l'arc (part de quasiment 40 % des tirs pour les deux joueurs).  
Notons que les tirs à mi-distance sont assez fréquents, et loin d'être bannis comme on voulait le faire chez les Rockets.  
Cependant, Curry et Lillard se distinguent sur un point important : les tirs dans la zone restrictive. Lillard prend souvent ses tirs dans cette zone (30 % du temps),c'est même la 2ème zone dans laquelle il prend le plus de tirs alors que Curry ne tire que 20 % du temps ici, et privilégie plutôt la zone mi-distance (22 % du temps).  
De plus, Curry se distingue de tous les autres meneurs par ses prises de tirs plus importantes que pour les autres joueurs dans les corners.  

**.** les meneurs de jeu de **l'ancienne ère de la NBA** sont composés de **Allen Iverson**, **Steve Nash** et **Tony Parker** : les 2 premiers ont débuté en NBA lors de la saison 1996-1997, alors que Tony Parker n'a débuté qu'en 2021-2022. Leurs prises de tirs diffèrent grandement des 2 meneurs étudiés précédemment.  
Iverson et Nash ont des profils assez similaires sur certains points : ils prennent beaucoup de tirs à mi-distance (ce que l'on cherche au maximum a éviter de nos jours) et dans la zone restrictive : leur "petit" gabarit (1.83 m pour Iverson, 1.91 m pour Nash) favorisait un jeu tout en pénétration, et donc la prise de tir au plus proche du panier.  
Cependant, Nash se distingue d'Iverson par une prise de tirs importante (quasiment le double d'Iverson) derrière l'arc des 3 points : la cause de cette observation est un principe précurseur du "Moreyball" (déjà évoqué plus haut), appelé "7 seconds or less". Ce style de jeu prône, comme son nom l'indique, une prise de tir rapide survenant moins de 7 secondes après qu'une équipe ait récupéré la balle, alors que la défense adverse n'est pas encore replacée. Steve Nash ayant joué pour les Suns de Phoenix durant une grande partie de sa carrière sous la houlette de Mike D'Antoni, l'entraîneur à l'origine de ce principe de jeu, il n'est pas étonnant de constater sa prise d'initiative importante à 3 points.  
Bin qu'appartenant à la même "génération", Tony Parker diffèrait de ses 2 compatriotes : il prenait très peu de tirs derrière l'arc (seulement 6 % du temps), mais énormément au plus près du panier (zone restrictive, raquette) et à mi-distance. Curieusement, sa carte de tirs est très similaire à celle du pivot Anthony Davis, que nous avons décrypté précédemment, bien que ces 2 joueurs n'iaent rien de comparable !  

**.** les meneurs de **l'entre deux** sont ceux ayant joué en NBA entre les 2 périodes décrites ci-dessus. On y trouve un seul joueur : **Chris Paul.**  

**.** Enfin, **Rusell Westbrook** est un meneur de jeu moderne au jeu assez atypique : bien qu'ayant une taille modeste (1.91 m) similaire à Steve Nash et Stephen Curry par exemple, son jeu très explosif voire même brutal favorisant le contact en fait un meneur bien différent des autres, comme en témoigne sa carte de tirs : assez peu de tirs tentés derrière l'arc des 3 points (seulement 18 %, à comparer aux 40 % de Lillard et Curry, les 2 autres joueurs de sa génération) mais énormément de tirs pris dans la zone restrictive, la raquette et à mi-distance. Son jeu tout en puissance le pousse à énormément porter le ballon et jouer sur son physique, même face à des joueurs au gabarit souvent beaucoup plus impressionnant que le sien, comme l'illustrent les dunks impressionnants qu'il est capable de marquer. Nous pouvons même dire que son style de jeu est totalement opposé à celui d'un Stephen Curry.

In [None]:
shot_chart_comparison_n(players = meneurs , hue = "shot zone basic" , figsize = (35,80) , 
                        frequency_or_efficiency = "efficiency");

**DECRYPTAGE :**  

- En terme de **réussite au tir :**  

**. zone restrictive** (*orange*) : **Steve Nash** est le meneur le plus efficace au tir dans cette zone : il devance de très peu Tony Parker et Stephen Curry. En revanche, **Damian Lillard** n'est qu'à 55 % de réussite dans cette zone.

**. raquette** (*vert*) : **Chris Paul** est de loin le plus efficace dans la raquette, avec près de 49 % de réussite au tir dans cette zone. Ce pourcentae est même meilleur que celui des 3 pivots étudiés, qui tournaient autour de 43 % de réussite ici !  
Steve Nash et Tony Parker suivent avec respectivement 46 % et 44 % de réussite.  
En revanche, une nouvelle fois, **Damian Lillard** occupe la dernière position de ce classement avec seulement **34 % de réussite**.


**. mi-distance** (*violet*) : le trio de tête se compose de **Steve Nash**, **Chris Paul** et **Stephen Curry**, qui tournent à 47 %, 46 % et 45 % de réussite au tir dans cette zone.  
Par contre, Allen Iverson et Russell Westbrook sont les derniers de la classe sur ce spot de tir, alors qu'ils prennent une part assez conséquente de leurs tirs dans cette zone !

**. arc des 3 points** (*marron*) : Bien que Stephen Curry soit considéré comme l'un des meileurs tireurs à 3 points de l'histoire, **Steve Nash** le domine de très peu en terme de réussite au tir derrière l'arc des 3 points, les deux joueurs tournant à 42 % de réussite.  
A contrario, Tony Parker ne parvient pas à dépasser les 30 % de réussite à 3 points et se classe en dernière position sur ce spot de tir. On comprend dès lors mieux pourquoi seulement 6 % de ses tirs étaient tentés ici...

**. corner gauche** : **Stephen Curry** est non seulement celui qui tente le plus de tirs dans ce corner, mais également celui qui y est le plus efficace avec un taux de réussite de 50 %, une nouvelle fois devant Steve Nash avec 49 %.  
Russell Westbrook ferme la marche de ce classement, avec seulement 32 % de réussite.  

**. corner droit** : comme pour le corner gauche, **Stephen Curry** domine ses adversaires tant sur le nombre de tirs tentés que sur le taux de réussite dans ce coin, avec quasiment 50 % de réussite, loin devant Steve Nash avec 40 %.  
Le mauvais élève se nomme une nouvelle fois Russell Westbrook, avec 29 % de réussite.

### iii) Les ARRIERES.

- Comparaison **par zone de tirs :**

In [None]:
shot_chart_comparison_n(players = arrieres , hue = "shot zone basic" , figsize = (35,60));

**DECRYPTAGE :**  

- En terme de **fréquence de tir :**  

==> On observe des cartes très différentes selon les joueurs :   

**. Kobe Bryant** avait une zone de tir privlégiée et clairement identifiable : **la zone de mi-distance**, dans laquelle 41 % de ses tirs était pris ! C'est le même pourcentage que pour Allen Iverson (meneur), les 2 joueurs ayant commencé à jouer en NBA la même saison et ayant joué durant 17 saisons communes !  
Ensuite, Bryant tire dans des proportions assez proches dans la zone restrictive et derrière l'arc (entre 18 % et 23 %), et un peu moins fréquemment dans la raquette (14 %).  
Il est en revanche l'un des arrières tentant le moins souvent sa chance dans les corners.

**. Ray Allen**, au coeur des débats sur le meilleur tireur à 3 points de l'histoire avec Stephen Curry, ne prenait pas tant de tirs derrière l'arc que ce que l'on peut penser (seulement 28 % derrière l'arc, contre 41 % pour Curry et Harden par exemple). Il tirait quasiment la même proportion de ses tirs à mi-distance, et est le joueur de la liste des 20 joueurs qui tentait le plus sa chance dans les corners avec une proportion de 10 %, corners gauche et droit confondus (pour la petite annecdote, un de ses tirs les plus célèbres reste le panier marqué avec Miami dans le corner droit, à quelques secondes de la fin du match 6 des NBA Finals 2013 face aux Spurs de San Antonio, ayant permi au Heat d'aller en prolongation puis de gagner ce match historique).  

**. Paul Pierce** n'avait pas réelement de zone de tir privilégiée, et était plutôt polyvalent : il prenait ses tirs aussi régulièrement de très proche (zone restrictive) qu'à mi-distance et qu'à longue distance (arc des 3 points).  
En revanche, il délaissait quelque peu la raquette par rapport aux autres spots de tir, avec seulement 9 % de ses tirs pris dans la raquette.  


**. Manu Ginobili** possède une carte de tirs assez similaire à celle de James Harden : l'argentin privilégiait la prise de tir soit très proche du panier (zone restrictive, 1/3 du temps), soit à longue distance (derrière l'arc, quasiment 1/3 du temps). La raquette et la zone de mi-distance n'étaien pas délaissées, mais il y prenait beaucoup moins de tirs que dans les 2 premières zones citées.  
Derrière Allen et Curry, il est celui qui tente également la plus grande part de tirs dans les corners.  

**. Dwyane Wade** possèdait des habitudes de tirs très différentes des autres arrières étudiés ici : sa carte de tirs ressemble de près à celle de Tony Parker (meneur). A l'intar de Manu Ginobili, il privilégiait 2 zones de tirs en particulier, mais pas les mêmes zones que Ginobili : les tirs très proche (zone restritive) et les tirs mi-distance.  
En revanche, pour ce qui est des tirs longue distance, Wade présente un très faible pourcentage avec seulement 9 % de ses tirs tentés !  


**.** Comme expliqué plus haut lors de l'analyse des meneurs, **James Harden** symbolise à lui seul le principe du Moreyball : seulement 12 % de ses tirs sont pris à mi-distance (LE tir bâni par ce principe de jeu moderne), et la majeure partie de ses tirs sont pris soit à 3 points (41 % derrière l'arc, 4 % dans les corners), soit au contact du panier dans la zone restrictive (30,46 %).  

In [None]:
shot_chart_comparison_n(players = arrieres , hue = "shot zone basic" , figsize = (35,60) , 
                        frequency_or_efficiency = "efficiency");

**DECRYPTAGE :**  

- En terme de **réussite au tir :**  

**. zone restrictive** (*orange*) :  

- top 3 : Wade (64,42 %) - Bryant (62,37 %) - Allen (60,74 %).  
- flop : Pierce (58,76 %)

**. raquette** (*vert*) :  

- top 3 : Bryant (45,01 %) - Wade (43,35 %) - Allen (42,69 %)
- flop : Harden (36,73 %)

**. mi-distance** (*violet*) :  

- top 3 : Allen (42,32 %) - Bryant (40,55 %) - Pierce (40,41 %)
- flop : Ginobili (35,83 %)

**. arc des 3 points** (*marron*) :  

- top 3 : Allen (39,1 %) - Ginobili (36,59 %) - Pierce (36,51 %)
- flop : Wade (29,59 %)

**. corner gauche** :  

- top 3 : Allen (44,53 %) - Ginobili (40,21 %) - Pierce (38,72 %)
- flop : Wade (34,43 %)

**. corner droit** :  

- top 3 : Allen (42,25 %) - Pierce (38,82 %) - Harden (37,57) %
- flop : Wade (34,29 %)  


**BILAN :** Ray Allen est systématiquement dans le top 3 en terme d'efficacité : il est très précis quelque soit la zone du terrain dans laquelle il prend son tir, et ce n'est donc pas pour rien qu'il est considéré comme l'un des meilleurs tireurs de l'histoire de la NBA.  
A noter également que Kobe Bryant n'apparaît dans le top 3 que pour les zones de tirs proches du panier ou à mi-distance : il ne fait pas partie des meilleurs tireurs à 3 points, ce qui peut expliquer pourquoi il ne tentit pas une part faramineuse de ses tirs à 3 points.  
Enfin, Dwyane Wade est en dernière position dans tous les secteurs de tirs longue distance (corners + arc) : cela traduit des difficultés encore plus importantes que Kobe sur les tirs longue distance.

### iiii) Les AILIERS/ AILIERS FORTS.

- Comparaison **par zone de tirs :**

In [None]:
shot_chart_comparison_n(players = ailiers , hue = "shot zone basic" , figsize = (35,38));

**DECRYPTAGE :**  

- En terme de **fréquence de tir :**  
  

**. LeBron James** privilégie 2 zones de tir en particulier : la **zone restrictive** et la **zone mi-distance**. Au vue de son physique et de son style de jeu tout en puissance et en "enfoncement" du défenseur adverse, rien de très surprenant à cela puisqu'aucun joueur de la ligue n'est en mesure de le stopper une fois qu'il est lancé vers la panier, encore aujourd'hui à 37 ans !  
Malgré cela, ses prises de tirs derrière l'arc des 3 points sont loin de représenter une part négligeable de ses prises de tir, avec 20 % du total de ses tentatives. Notons cependant la dispersion des points représentant ses tirs derrière l'arc, pour certains très éloignés de l'arc !

**. Kevin Durant** possède comme LeBron James les 2 mêmes zones de tirs préférentielles, mais pas dans le même ordre : Durant tire en priorité à mi-distance (35 % du temps) et ensuite dans la zone restrictive (23 % du temps).  
Comparé à James, il tire plus régulièrement derrière l'arc et y est sûrement plus à l'aise pour tirer que LeBron au vue de l'aisance et la fluidité du tir de Durant sur ce spot. LeBron James quant à lui possède un tir beaucoup moins "naturel" derrière l'arc, qui s'est fluidifié avec le temps mais qui était loin d'être parfait au début de sa carrière, ou il lui arrivait parfois d'envoyer quelques "briques" contre la planche.

**. Giannis Antetokounmpo** est quant à lui l'archétype même du joueur puissant : sûrement l'un des plus puissants (si ce n'est le plus puissant) joueur de la ligue actuel, il cherche presque systématiquement à faire la différence sur son défenseur par la force, en effonçant son défenseur qui ne peut alors rien faire, en témoigne sa carte de tirs : 54 % de ses tirs sont pris dans la zone restrictive !  
C'est même le seul joueur de la liste des 20 qui prend plus de 50 % de ses tirs dans une seule zone !  
Sa part de tentatives derrière l'arc est assez faible, plus de 2 fois inférieure à celle de James et sa part de tirs mi-distance n'est pas très élevée non plus (14 %) : on voit donc assez aisément avec cette carte quel type de jeu produit Giannis Antetokounmpo sur le terrain. 


**. Kawhi Leonard** est le seul "ailier de formation" parmi ces 4 joueurs, les 3 autres etant avant tout des ailiers forts. Sa carte de tirs est assez proche de celle de Kevin Durant, mais les pourcentages associés sont plus ressérés que pour Durant, ce qui traduit une plus grande indifférence de la part de Kawhi dans la position de tir : il tire quasiment autant de fois depuis la zone restrictive, qu'à mi-ditance ou derrière l'arc.  
En revanche, il se distingue de ses homologues par ses prises de tirs plus fréquentes dans les corners, quasiment équivalentes à celle de Manu Ginobili (arrière).

In [None]:
shot_chart_comparison_n(players = ailiers , hue = "shot zone basic" , figsize = (35,38) , 
                        frequency_or_efficiency = "efficiency");

**DECRYPTAGE :**  

- En terme de **réussite au tir :**  

**. zone restrictive** (*orange*) :  

- top 3 : James (71,43 %) - Durant (71,02 %) - Giannis (68,72 %).  
- flop : Leonard (67,39 %)

**. raquette** (*vert*) :  

- top 3 : Leonard (46,88 %) - Durant (44,17 %) - James (38,27 %)
- flop : Giannis (35,74 %)

**. mi-distance** (*violet*) :  

- top 3 : Leonard (45,29 %) - Durant (44,84 %) - James (37,82 %)
- flop : Giannis (34,42 %)

**. arc des 3 points** (*marron*) :  

- top 3 : Durant (37,41 %) - Leonard (36,33 %) - James (33,98 %)
- flop : Giannis (29,29 %)

**. corner gauche** :  

- top 3 : Leonard (46,2 %) - Durant (43,17 %) - James (37,67 %)
- flop : Giannis (25,86 %)

**. corner droit** :  

- top 3 : Leonard (43,05 %) - Durant (40,64 %) - James (36,12) %
- flop : Giannis (28,33 %)  


**BILAN :** On retrouve quasiment systématiquement le même top 3 et dans le même ordre : Kawhi Leonard - Kevin Durant - LeBron James.  
Giannis est quasiment en dernière position dans toutes les zones et présente de plus des pourcentges assez éloignés de ses accolytes ! Même dans la zone restrictive, dans laquelle on rappelle qu'il prend 54 % de ses tirs, sont efficacité ne surpasse pas celle de James et Durant...  
Il est malgré tout parvenu à être MVP lors des 2 dernières saisons NBA, et à remporter un titre NBA la saison passée avec son équipe des Milwaukee Bucks...

## 1 - b) Approfondissement des analyses.

In [27]:
players = df_twenty["player name"].unique()

- **QU 1) :** Quel joueur possède le **meilleur taux de réussite à 3 points ?**

In [None]:
shot_chart_comparison_n(critere = None , frequency_or_efficiency = "efficiency" , players = players , 
                        figsize = (25,150) , hue = "shot type")

Le top 3 des meilleurs marqueurs à 3 points (en termes d'efficacité) est composé de **Stephen Curry** (42,89 % sur 6899 tentatives), suivi de très près par **Steve Nash** (42,59 % sur  4318 tentatives) et **Ray Allen** (40,07 % sur 8089 tentatives).  

A ce jeu là, les 2 dernier se nomment **Tim Duncan** (17,24 % sur seulement 203 tentatives) et **Giannis Antetokounmpo** (28,75 % sur 1141 tentatives) : 2 joueurs intérieurs, relativement peu à l'aise sur les tirs à 3 points qui ne sont pas leurs tirs de prédilection...

- **QU 2) :** LeBron James à t-il l'habitude de prendre les choses en main **dans le 4ème quart-temps ?**

In [None]:
shot_chart_grid_by(player = "lebron james", critere = "period", frequency_or_efficiency = "frequency" , figsize = (25,40))

**ANALYSE :**  
    
Contrairement à ce que l'on pourrait croire, LeBron James ne prend pas le jeu à son compte dans le 4ème et dernier quart-temps du temps réglementaire : avec 23 % de ses tirs tentés dans ce quart-temps, la part de tirs qu'il prend dans les 1er et 3ème quart-temps sont plus importantes (27 % chacune).  

Il serait intérressant de voir cette même part de tirs pris mais par minute restant dans chaque quart-temps, afin par exemple de voir si James prend plus de tirs dans la dernière minute du 4ème quart-temps que dans la dernière minutes des 3 autres quart-temps.

- **QU 3) :** Y a t-il un **"effet Playoffs" pour certains joueurs ?**

In [None]:
for player in players : 
    
    shot_chart_grid_by(player = player, critere = "season type", frequency_or_efficiency = "efficiency", 
                       figsize = (20,10.5))
    plt.suptitle(player.upper() , family = "serif" , fontsize = 40)

**ANALYSE :**  
    
- Il est tout d'abord important de noter que bien que ces joueurs aient tous joués au moins 1 match en Playoffs au cours de leur carrière, certains d'eux ont l'habitude d'y accéder (LeBron James, Kobe Bryant, ...) alors d'autres sont des novices à ce niveau (Anthony Davis par exemple) : il peut donc être difficile de comparer les joueurs entre eux au niveau des tirs pris en Playoffs, car le comparaison ne serait peut-être pas significative.  


- On note cependant qu'il semble y avoir **un vrai impact "négatif" des Playoffs** sur les performances de tirs de **Damian Lillard**, **Manu Ginobili**, **Tony Parker**, **Pau Gasol**, **Paul Pierce**, **Tim Duncan** voire même **Stephen Curry**, dont les taux de réussite au tir semblent diminuer de manière assez significative dans quasiment chaque zone lors des Playoffs.  

- A contrario, **Kawhi Leonard**, **Steve Nash**, **Kobe Bryant** et **Ray Allen** semblent maintenir un  niveau d'efficacité par zone assez similaire à celui produit en saison régulière voire en hausse dans quasiment tous les secteurs, comme c'est las cas pour Leonard, qui parait se transcender dès que surviennent les Playoffs !