In [1]:
import pandas as pd
import os
from funciones_auxiliares import *
import warnings
warnings.filterwarnings('ignore')

# 3.4 *Estadisticas avanzadas individuales*

Las *estadísticas avnzadas individuales* son el tipo de estadística definida por *Dean Oliver* en su libro *Basketball on Paper* las cuales permiten medir diferentes aspectos de los jugadores de baloncesto a partir de las *estadísticas totales* en un periodo de tiempo. En este notebook se buscará dar explicación de manera entendible y visualizada a todo el procesamiento realizado para la construcción de estas estadísticas a través de los siguientes puntos:
* **1. Base teórica de la construcción de las estadísticas.** Se realizará la explicación teórica de los pasos realizados para la construcción de este tipo de estadísticas.
* **2. Procesamiento de los datos.** Se realizará la explicación guiada del procesamiento de los datos para la construcción de las estadísticas totales.

A través de esos puntos se realizará la comprensión y entendimiento del trabajo realizado para la construcción de las *estadísticas totales*.

## 1. Base teórica de la construcción de las estadísticas

Como ha sido comentado al inicio de este notebook, las *estadísticas avanzadas individuales* fueron diseñadas por *Dean Oliver* en su libro *Baskeball on Paper* en el cual se definieron diferentes métricas las cuales permiten saber el desempeño de los jugadores de baloncesto en función de su estadísticas individuales totales. Estas estadísticas permite mostrar el desempeño de los jugadores de baloncesto dentro de una pista ya que representan cada una de las estadísticas teniendo en cuenta el contexto en el que las realizó el jugador. Es por este motivo que para la construcción de las *estadísticas avanzadas individuales* han sido utilizadas las estadísticas totales contruidas en el apartado [Construcción de las *estadísticas totales*.](3.1%20Estadisticas%20totales) tanto de jugadores como de equipos. Mediante este tipo de estadísticas será construidas las siguientes estadísticas avanzadas:
* *eFG%  - Effective Field Goal Percentage.* El *eFG%* conocida como *porcentaje de eficiencia del tiro*, es la métrica que permite conocer como de bunos han sido los tiros realizados por el jugador. Esta métrica es calcula a patir de la fórmula *eFG% = (Tiros anotados + 0.5 * Tiros de tres anotados) / Tiros lanzdaos*.
* *3Pr - Three-Point rating.* El *3Pr* conocida como *volumen de tiros de tres lanzados*, es la métrica que permite conocer el porcentaje de tiros de tres que ha sido lanzado por el jugador con respecto a su tiros totales. Est métrica es calculada a partir de la fórmula *3Pr = Tiros de tres lanzados / Tiros lanzados.
* *FTr - Free Throw rating.* El *Ftr* conocida como *volumen de tiros libres* es la métrica que permite conocer el volumen de tiros libres anotados con respecto a los tiros lanzados por el jugador. Esta métrica es calculada a partir de la fórmula *FTr = Tiros libres anotados / Tiros de campo lanzados.
* *ORB% -  Offensive Rebound Percentage.* El *ORB%* tambien conocida por *Volumen de rebotes ofensivos* es la métrica que permite conocer cuantos rebotes ofensivos del total de rebotes diponibles fue capaz de capturar el jugador. Esta métrica es calculada a partir de la fórmula *ORB% = (Rebotes ofensivos capturados por el jugador * (Minutos jugados por el equipo / 5)) / (Minutos jugados por el jugador * (Rebotes ofensivos del equipo + Rebotes defensivos del equipo rival))*.
* *DRB% -  Defensive Rebound Percentage.* El *DRB%* también conocida por *volumen de rebotes defensivos* es la métrica que permite conocer cuantos rebotes defensivos del total de rebotes dispones fue capaz de capturar el jugador. Esta métrica es calculada a a partir de la fórmula *DRB% = (Rebotes defensivos capturados por el jugador * (Minutos jugados por el equipo / 5)) / (Minutos jugados por el jugador * (Rebotes defensivos del equipo + Rebotes ofensivos del equipos rival))*.
* *STL% - Steal Percentage.* El *STL%* también conocida como *volumen de recuperaciones realizadas* es la métrica que permite conocer cuantos balones fueron robados por el jugador con respecto al total de balones robados por el equipo. Esta métrica es calculada a partir de la fórmula *STL% = (Robos realizados por el jugador * (Minutos jugados por el equipo / 5)) / (Minutos jugados por el jugador * Posesiones realizadas por el rival)*.
* *BLK% - Block Percentage.* El *BLK%* también conocida como *volumen de tapones realizados* es la métrica que permite conocer cuanto tiros del oponente fueron taponados con respecto al volumen total de tiros. Esta métrica es calculada a partir de la fórmula *BLK% = Tapones realizados por el jugador * (Minutos jugados por el equipo / 5)) / (Minutos jugados por el jugador * (Tiros de campo anotados por el rival - Tiros de tres anotados por el rival)*.
* *TOV% - Turnover Percentage.* El *TOV%* también conocida como *volumen de pérdidas realizadas* es la métrica que permite conocer cuantos balonces fueron perdidos por el jugador con respecto al total de balones perdidos del equipo. Esta métrica es calculada a partir de la fórmula *TOV% = Pérdidas realizadas por el jugador / (Tiros de campo anotados por el jugador + 0.44 * Tiros libres anotados por el jugador + Pérdidas realizadas por el jugador)*.
* *AST% - Assist Percentage.* El *AST%* también conocida como *volumen de asistencias realizadas* es la metrica que permite conoces el volumen de asistencias realizadas por el jugadr con respecto a los tiros realizados del equipo. Esta métrica es calculada a apartir de la fórmula *AST% = Asistencias del jugador / (((Minutos jugados por el jugador / (Minutos jugados por el equipo / 5)) * Tiros realizados por el equipo) - Tiros realizados por el jugador*.
* *USG% - Usage Percentage.* El *USG%* también conocida como *porcentaje de uso* es la métrica que permite conocer cuantas posesiones del equipo fueron finalizadas por el jugador ya sea por tiro, pérdida o falta recibida de tiro. Esta métrica es calculada a partir de la fórmula *USG% = (Tiros de campo lanzados por el jugador + 0.44 * Tiros libres lanzados por el jugador + Pérdidas realizadas por el jugador) * (Minutos jugados por el equipo / 5)) / (Minutos jugados por el jugador * (Tiros de campo lanzados por el jugador + 0.44 * Tiros libres lanzados por el equipo + Péridas realizadas por el equipo)*.
* *STOP%.*

A partir de estas estadísticas han sido creadas las estadísticas individuales de los jugadores. Para ello, ha sido creado el script de código [04_Procesamiento_ESTADISTICA_AVANZADA](04_Procesamiento_ESTADISTICA_AVANZADA.py) con el cual se realiza la construcción de las estadísticas avanzadas para cada jugador en cada una de las temporadas para las que han sido construidas las *estadísticas totales*.

# 2. Procesamiento de los datos

Como ha sido explicado en el apartado anterior, para el cálculo de las *estadísticas avanzadas individuales* es necesario tener la información por un lado de las estadísticas totales realizadas por los jugadores, las estadísticas totales de los equipos y las estadísticas totales de los rivales a lo que se haya enfrentado el equipo. Es por este motivo que para la construcción de este tipo de estadística se realiza la carga de todas las estadísticas totales del Real Madrid durante la temporada *2022-2023*:

In [2]:
# Ruta para acceder al fichero de estadísticas totales del Real Madrid
fichero_total_jugadores_2022 = 'E:/TFM/02. Datos/ACB/ESTADISTICAS/2022/Real Madrid/01_ESTADISTICAS_TOTALES_EQUIPO.csv'

# Ruta para acceder al fichero de estadísticas totales de los rivales del Real Madrid
fichero_rival_2022 = 'E:/TFM/02. Datos/ACB/ESTADISTICAS/2022/Real Madrid/01_ESTADISTICAS_TOTALES_RIVAL.csv'

df_totales_2022 = pd.read_csv(fichero_total_jugadores_2022, sep = ';')
df_totales_rival_2022 = pd.read_csv(fichero_rival_2022, sep = ';')

print("##################################################################################")
print("# ESTADISTICAS TOTALES DE LOS JUGADORES DEL REAL MADRID EN LA TEMPORADA 2022-2023")
print("##################################################################################")
print(df_totales_2022.to_string(index=False, col_space=4)) 

print("\n##################################################################################")
print("# ESTADISTICAS TOTALES DEL REAL MADRID EN LA TEMPORADA 2022-2023")
print("##################################################################################")
df_totales_2022['EQUIPO'] = 'EQUIPO'
df_equipo_total = df_totales_2022.drop(['NO.','JUGADOR'],axis=1).groupby('EQUIPO').sum().reset_index()
print(df_equipo_total.to_string(index=False, col_space=4)) 

print("\n##################################################################################")
print("# ESTADISTICAS TOTALES DE LOS RIVALES DEL REAL MADRID EN LA TEMPORADA 2022-2023")
print("##################################################################################")
print(df_totales_rival_2022.to_string(index=False, col_space=4)) 

##################################################################################
# ESTADISTICAS TOTALES DE LOS JUGADORES DEL REAL MADRID EN LA TEMPORADA 2022-2023
##################################################################################
 NO.         JUGADOR  MIN  PTS   RO   RD   RT   AS  PER  REC  TAP   TR  MAT   FP   FR    +-   VAL  T2A  T2L  T3A  T3L  TLA  TLL
   0 N.Williams-Goss  370  137    6   35   41   63   23   16    5    5    0   39   13 154.0 144.0   42   79   16   41    5    7
   1      F. Causeur  562  238    7   48   55   47   32   25    4   10    0   52   47 167.0 201.0   49   94   37  102   29   40
  11      M. Hezonja  570  282   11  114  125   40   44   23    8    4    8   59   49 126.0 301.0   51   92   46  116   42   50
  13    S. Rodríguez  447  156    4   45   49  101   42   12    0    2    0   37   36  49.0 204.0   23   48   30   71   20   23
  14         G. Deck  473  209   31   79  110   37   23   16    2    7    5   30   46 178.0 290.0   66  112   13

A partir de las estadísticas totales mostradas y la aplicación de las fórmulas definidas en el primer apartado se pasa a mostrar la *estadísticas totales avanzadas* de los jugadores del Real Madrid durante la temporada *2022-2023*:

In [3]:
print("######################################################################################")
print("# ESTADISTICAS AVANZADAS DE LOS JUGADORES DEL REAL MADRID EN LA TEMPORADA 2022-2023")
print("######################################################################################")
df_estadisticas_avanzadas = procesar_ADVANCED_STATS(df_totales_2022, df_equipo_total, df_totales_rival_2022)
print(df_estadisticas_avanzadas.to_string(index=False, col_space=4)) 

######################################################################################
# ESTADISTICAS AVANZADAS DE LOS JUGADORES DEL REAL MADRID EN LA TEMPORADA 2022-2023
######################################################################################
 NO.         JUGADOR   eFG%    3Pr    FTr   ORB%   DRB%   STL%   BLK%   TOV%    AST%   USG%  STOP%
   0 N.Williams-Goss 0.5500 0.3417 0.0583 0.0210 0.1079 0.0232 0.0129 0.1584  0.1329 0.1829 0.4525
   1      F. Causeur 0.5332 0.5204 0.2041 0.0161 0.0975 0.0239 0.0068 0.1329  0.0665 0.2025 0.4237
  11      M. Hezonja 0.5769 0.5577 0.2404 0.0250 0.2282 0.0217 0.0134 0.1627  0.0566 0.2227 0.6043
  13    S. Rodríguez 0.5714 0.5966 0.1933 0.0116 0.1149 0.0144 0.0000 0.2473  0.1687 0.1774 0.3801
  14         G. Deck 0.6107 0.2000 0.3357 0.0849 0.1906 0.0182 0.0040 0.1280  0.0597 0.1799 0.5093
  17      V. Poirier 0.5392 0.0261 0.4771 0.1811 0.1426 0.0125 0.0567 0.1239  0.0397 0.2062 0.5678
  19        E. Demin 0.0000 0.5000 0.0000 0.0000 