# PoC Scrapping

In [1]:
from bs4 import BeautifulSoup
import pandas as pd
pd.set_option('display.max_columns', None)

## Desde get_games traemos:

In [2]:


# Nombre del archivo de texto que contiene el HTML
file_name = "../data/external/elemento_html_partidos_temporada_24_25.txt"

# Diccionario para almacenar los datos de los partidos
match_data = {}
try:
    # 1. Leer el contenido del archivo .txt
    with open(file_name, "r", encoding="utf-8") as f:
        html_content = f.read()

    # 2. Crear un objeto BeautifulSoup para parsear el HTML
    soup = BeautifulSoup(html_content, "html.parser")
    
    # 3. Buscar todas las filas de la tabla (<tr>)
    filas_partidos = soup.find_all("tr", role="row")
    
    print(f"Extrayendo datos de {len(filas_partidos)} partidos...")

    for fila in filas_partidos:
        # Extraer los datos de las celdas (<td>) de cada fila
        celdas = fila.find_all("td")

        # Asegurarse de que la fila tiene la estructura esperada
        if len(celdas) > 8:
            # Extraer los datos por su índice de celda
            fecha_hora = celdas[0].get_text(strip=True)[-17:]
            nombre_local = celdas[1].get_text(strip=True)
            puntos_local = celdas[3].get_text(strip=True)
            puntos_visita = celdas[4].get_text(strip=True)
            nombre_visita = celdas[6].get_text(strip=True)
            
            # El link está dentro de la celda en el índice 8 (anteriormente 9)
            link_tag = celdas[8].find("a", href=True)
            link_estadisticas = link_tag.get('href') if link_tag else None
            
            # Usar una combinación única como clave del diccionario
            match_key = f"{nombre_local} vs {nombre_visita} ({fecha_hora})"
            
            # Guardar los datos en el diccionario
            match_data[match_key] = {
                "nombre_local": nombre_local,
                "puntos_local": puntos_local,
                "nombre_visita": nombre_visita,
                "puntos_visita": puntos_visita,
                "link_estadisticas": link_estadisticas
            }
    
    print("\nDiccionario de datos de partidos creado.")
    
    # Mostrar el diccionario para su verificación
    display(match_data)
    
except FileNotFoundError:
    print(f"Error: No se encontró el archivo '{file_name}'. Asegúrate de que el archivo existe en la ruta correcta.")
except Exception as e:
    print(f"Ocurrió un error al procesar el archivo: {e}")

Extrayendo datos de 380 partidos...

Diccionario de datos de partidos creado.


{'ATENAS (C) vs BOCA (007/10/2024 22:10)': {'nombre_local': 'ATENAS (C)',
  'puntos_local': '69',
  'nombre_visita': 'BOCA',
  'puntos_visita': '81',
  'link_estadisticas': 'https://estadisticascabb.gesdeportiva.es/partido/rM2-eTJQHJsR2FLJYE8GRw==?a=1'},
 'OBRAS vs PLATENSE (008/10/2024 20:00)': {'nombre_local': 'OBRAS',
  'puntos_local': '94',
  'nombre_visita': 'PLATENSE',
  'puntos_visita': '90',
  'link_estadisticas': 'https://estadisticascabb.gesdeportiva.es/partido/UYiBwuNnKVL9qCbXhOY76g==?a=1'},
 'INSTITUTO vs OLIMPICO (LB) (008/10/2024 21:00)': {'nombre_local': 'INSTITUTO',
  'puntos_local': '99',
  'nombre_visita': 'OLIMPICO (LB)',
  'puntos_visita': '73',
  'link_estadisticas': 'https://estadisticascabb.gesdeportiva.es/partido/Dwgh5U3-8hNWcMtXCbn6yw==?a=1'},
 'UNION (SF) vs SAN LORENZO (008/10/2024 21:30)': {'nombre_local': 'UNION (SF)',
  'puntos_local': '68',
  'nombre_visita': 'SAN LORENZO',
  'puntos_visita': '63',
  'link_estadisticas': 'https://estadisticascabb.gesdepor

## Pruebas de web scrapping

In [3]:
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from webdriver_manager.chrome import ChromeDriverManager
from bs4 import BeautifulSoup
import pandas as pd
import re # Carta de trio
import json # Box score
import time # Box score


### Mapa de tiro

In [4]:
# Nota: Este script asume que la variable 'match_data' ya fue creada
#       y contiene los datos de los partidos, incluyendo los enlaces.
#       Por ejemplo:
# match_data = {
#     "ATENAS (C) vs BOCA (07/10/2024 22:10)": {
#         "nombre_local": "ATENAS (C)",
#         "puntos_local": "69",
#         "nombre_visita": "BOCA",
#         "puntos_visita": "81",
#         "link_estadisticas": "https://estadisticascabb.gesdeportiva.es/partido/rM2-eTJQHJsR2FLJYE8GRw==?a=1"
#     }
#     ...
# }
# --- Parte 1: Obtener el primer enlace y nombres de equipos ---
try:
    if not match_data:
        raise ValueError("El diccionario 'match_data' está vacío o no ha sido creado. No se puede continuar.")
        
    # Obtener la clave del primer partido
    primer_partido_key = list(match_data.keys())[0]
    partido_info = match_data[primer_partido_key]

    # Guardar el enlace y los nombres de los equipos
    primer_link = partido_info["link_estadisticas"]
    nombre_local = partido_info["nombre_local"]
    nombre_visitante = partido_info["nombre_visita"]
    
    print(f"El enlace del primer partido es: {primer_link}")
    print(f"Procesando partido: {nombre_local} vs {nombre_visitante}")


except Exception as e:
    print(f"Ocurrió un error al obtener datos del diccionario: {e}")
    primer_link = None

# --- Parte 2: Usar Selenium para navegar a ese enlace y extraer datos ---
if primer_link:
    try:
        print("\nIniciando Selenium para navegar al mapa de tiro...")
        
        # Configuración de Selenium
        options = Options()
        options.add_argument("--no-sandbox")
        options.add_argument("--disable-dev-shm-usage")
        options.add_argument("user-agent=Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36")
        # options.add_argument("--headless")  # Descomenta si no quieres ver el navegador
        
        driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()), options=options)
        driver.get(primer_link)

        # Esperar el iframe principal y cambiar a él
        WebDriverWait(driver, 20).until(EC.frame_to_be_available_and_switch_to_it((By.TAG_NAME, "iframe")))
        
        # Ahora, dentro del iframe principal, buscar el iframe del mapa de tiro
        iframe_mapa = WebDriverWait(driver, 20).until(
            EC.presence_of_element_located((By.CSS_SELECTOR, "iframe[src*='mapa-tiro']"))
        )
        driver.switch_to.frame(iframe_mapa)
        
        # Extraer el HTML del iframe del mapa de tiro
        html_mapa_tiro = driver.page_source
        
        # Procesar el HTML con BeautifulSoup
        soup = BeautifulSoup(html_mapa_tiro, "html.parser")
        tiros = soup.find_all("i", class_="ico-tiro")
        
        print(f"Se encontraron {len(tiros)} tiros en el mapa del primer partido.")

        # Crear un DataFrame con los datos de los tiros
        data = []
        for tiro in tiros:
            clases = tiro.get("class", [])
            estilo = tiro.get("style", "")
            
            resultado = "fallado" if "fa-times" in clases else "acertado" if "fa-circle" in clases else "desconocido"
            
            try:
                left = float(estilo.split("left:")[1].split("%")[0].strip())
                top = float(estilo.split("top:")[1].split("%")[0].strip())
            except (IndexError, ValueError):
                left, top = None, None

            # --- LÓGICA FINAL PARA DETERMINAR EL EQUIPO ---
            # Se asigna el NOMBRE del equipo local o visitante según la coordenada 'left'
            if left is not None:
                equipo = nombre_local if left <= 50 else nombre_visitante
            else:
                equipo = "desconocido"
            
            data.append({
                "equipo": equipo,
                "resultado": resultado,
                "left_pct": left,
                "top_pct": top
            })

        df_tiros = pd.DataFrame(data)
        print(f"\nDataFrame de tiros del partido ({nombre_local} vs {nombre_visitante}):")
        display(df_tiros.head(20))

    except Exception as e:
        print(f"Ocurrió un error en la parte de Selenium: {e}")
    finally:
        try:
            driver.quit()
        except NameError:
            pass

El enlace del primer partido es: https://estadisticascabb.gesdeportiva.es/partido/rM2-eTJQHJsR2FLJYE8GRw==?a=1
Procesando partido: ATENAS (C) vs BOCA

Iniciando Selenium para navegar al mapa de tiro...
Se encontraron 121 tiros en el mapa del primer partido.

DataFrame de tiros del partido (ATENAS (C) vs BOCA):


Unnamed: 0,equipo,resultado,left_pct,top_pct
0,BOCA,fallado,62.79,24.7
1,ATENAS (C),acertado,14.51,26.88
2,BOCA,fallado,84.91,28.09
3,BOCA,fallado,62.21,26.15
4,ATENAS (C),acertado,15.37,27.36
5,BOCA,acertado,88.51,34.38
6,ATENAS (C),fallado,15.95,25.67
7,BOCA,fallado,67.82,20.34
8,ATENAS (C),acertado,16.67,26.39
9,BOCA,fallado,87.93,28.57


### Box Score

In [13]:
# --- Datos de ejemplo ---
# match_data = {
#     "ATENAS (C) vs BOCA (07/10/2024 22:10)": {
#         "link_estadisticas": "https://estadisticascabb.gesdeportiva.es/partido/rM2-eTJQHJsR2FLJYE8GRw==?a=1"
#     }
# }
# --- Fin del ejemplo ---

all_player_stats = []
driver = None

try:
    primer_partido_key = list(match_data.keys())[0]  # Obtener el último partido del diccionario
    primer_link = match_data[primer_partido_key]["link_estadisticas"]
    print(f"El enlace del partido es: {primer_link}")

    # --- Parte 1: NAVEGACIÓN CON SELENIUM (YA FUNCIONA CORRECTAMENTE) ---
    print("\nIniciando Selenium...")
    options = Options()
    options.add_argument("--headless")
    options.add_argument("--no-sandbox")
    options.add_argument("--disable-dev-shm-usage")
    options.add_argument("user-agent=Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36")

    driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()), options=options)
    driver.get(primer_link)
    
    wait = WebDriverWait(driver, 20)

    print("Cambiando al iframe principal...")
    wait.until(EC.frame_to_be_available_and_switch_to_it((By.TAG_NAME, "iframe")))
    print("Cambio al iframe principal exitoso.")

    print("Buscando y haciendo clic en la pestaña 'Estadísticas'...")
    tab_selector = (By.CSS_SELECTOR, "li.pestana-estadisticas")
    estadisticas_tab_element = wait.until(EC.visibility_of_element_located(tab_selector))
    driver.execute_script("arguments[0].click();", estadisticas_tab_element)
    time.sleep(1)

    print("Cambiando al iframe de datos de estadísticas...")
    iframe_de_datos_selector = (By.CSS_SELECTOR, "div.contenido-estadisticas.activo iframe")
    wait.until(EC.frame_to_be_available_and_switch_to_it(iframe_de_datos_selector))
    print("Acceso al iframe de datos exitoso.")

    print("Extrayendo el código HTML final...")
    html_box_scores = driver.page_source
    
    # --- Parte 2: EXTRACCIÓN CON BEAUTIFULSOUP (SECCIÓN CORREGIDA) ---
    print("Procesando el HTML para extraer datos de jugadores...")
    soup = BeautifulSoup(html_box_scores, "html.parser")
    
    # --- INICIO DE LA CORRECCIÓN ---
    # Hacemos la búsqueda de los nombres de equipo de forma segura
    
    equipo_local_nombre = "Local" # Valor por defecto
    equipo_visitante_nombre = "Visitante" # Valor por defecto
    
    # Buscamos los divs que contienen los nombres de los equipos.
    # El selector 'div.nombre-equipo' es un candidato común.
    divs_nombres = soup.find_all("div", class_="nombre-equipo")
    if len(divs_nombres) >= 2:
        equipo_local_nombre = divs_nombres[0].get_text(strip=True)
        equipo_visitante_nombre = divs_nombres[1].get_text(strip=True)
    else:
        print("Advertencia: No se encontraron los nombres de equipo con el selector 'div.nombre-equipo'. Se usarán nombres genéricos.")
    # --- FIN DE LA CORRECCIÓN ---

    tablas = soup.find_all("table", class_="tabla-estadisticas")
    
    if len(tablas) >= 2:
        print(f"\nExtrayendo datos de: {equipo_local_nombre}")
        for fila in tablas[0].find("tbody").find_all("tr", onclick=True):
            onclick_attr = fila["onclick"]
            match = re.search(r"(\{.*\})", onclick_attr)
            if match:
                json_str = match.group(1).replace("'", '"')
                player_data = json.loads(json_str)
                player_data['equipo'] = equipo_local_nombre
                all_player_stats.append(player_data)

        print(f"Extrayendo datos de: {equipo_visitante_nombre}")
        for fila in tablas[1].find("tbody").find_all("tr", onclick=True):
            onclick_attr = fila["onclick"]
            match = re.search(r"(\{.*\})", onclick_attr)
            if match:
                json_str = match.group(1).replace("'", '"')
                player_data = json.loads(json_str)
                player_data['equipo'] = equipo_visitante_nombre
                all_player_stats.append(player_data)
    
    # --- Parte 3: PRESENTACIÓN DE DATOS CON PANDAS ---
    if all_player_stats:
        df_box_scores = pd.DataFrame(all_player_stats)
        print("\n✅ DataFrame final con todos los datos extraídos:")
        df_box_scores
    else:
        print("\nNo se pudieron extraer datos de jugadores del HTML.")

except Exception as e:
    print(f"Ocurrió un error general: {e}")
finally:
    if driver:
        driver.quit()
        print("\nNavegador cerrado.")

df_box_scores = df_box_scores[['IdJugador', 'IdClub', 'IdEquipo', 'Nombre', 'NombreCompleto',
                              'Puntos', 'TirosDos', 'TirosTres', 'TirosLibres',
                              'ReboteDefensivo', 'ReboteOfensivo', 'RebotesTotales',
                              'Asistencias', 'Recuperaciones', 'Perdidas',
                              'TaponCometido','TaponRecibido', 'FaltaCometida','FaltaRecibida','Valoracion',
                              'TiempoJuego', 'CincoInicial', 'equipo']]
# Lista de las columnas que contienen diccionarios para procesar
columnas_con_diccionarios = ['TirosDos', 'TirosTres', 'TirosLibres']

# Iteramos sobre cada columna que necesitamos transformar
for columna in columnas_con_diccionarios:
    if columna in df_box_scores.columns:
        # Creamos la nueva columna para 'Aciertos'
        # La función lambda toma cada diccionario (x) de la columna y extrae el valor de 'Aciertos'
        # .get('Aciertos', 0) es una forma segura que devuelve 0 si la clave 'Aciertos' no existe
        df_box_scores[f'{columna}Aciertos'] = df_box_scores[columna].apply(lambda x: x.get('Aciertos', 0))
        
        # Creamos la nueva columna para 'Fallos'
        df_box_scores[f'{columna}Fallos'] = df_box_scores[columna].apply(lambda x: x.get('Fallos', 0))

# Eliminamos las columnas originales que contenían los diccionarios para limpiar el DataFrame
df_box_scores = df_box_scores.drop(columns=columnas_con_diccionarios)
df_box_scores


El enlace del partido es: https://estadisticascabb.gesdeportiva.es/partido/rM2-eTJQHJsR2FLJYE8GRw==?a=1

Iniciando Selenium...
Cambiando al iframe principal...
Cambio al iframe principal exitoso.
Buscando y haciendo clic en la pestaña 'Estadísticas'...
Cambiando al iframe de datos de estadísticas...
Acceso al iframe de datos exitoso.
Extrayendo el código HTML final...
Procesando el HTML para extraer datos de jugadores...

Extrayendo datos de: ATENAS (C)
Extrayendo datos de: BOCA

✅ DataFrame final con todos los datos extraídos:

Navegador cerrado.


Unnamed: 0,IdJugador,IdClub,IdEquipo,Nombre,NombreCompleto,Puntos,ReboteDefensivo,ReboteOfensivo,RebotesTotales,Asistencias,Recuperaciones,Perdidas,TaponCometido,TaponRecibido,FaltaCometida,FaltaRecibida,Valoracion,TiempoJuego,CincoInicial,equipo,TirosDosAciertos,TirosDosFallos,TirosTresAciertos,TirosTresFallos,TirosLibresAciertos,TirosLibresFallos
0,78377,1498,0,"ARAUJO, M.","ARAUJO, MAXIMO",3,0,0,0,0,0,0,0,0,1,0,1,18:05,False,ATENAS (C),0,0,1,0,0,0
1,326699,1498,0,"BUENDIA, C.","BUENDIA, CARLOS MANUEL",1,0,0,0,1,0,1,0,0,0,3,1,07:57,True,ATENAS (C),0,0,0,0,1,0
2,273565,1498,0,"MONTERO, J.","MONTERO, JOSE IGNACIO",2,0,0,0,3,1,2,0,0,0,2,4,23:27,False,ATENAS (C),0,0,0,0,2,0
3,209515,1498,0,"ARN BUSTAMANTE, L.","ARN BUSTAMANTE, LUCAS MARTIN",12,1,0,1,4,0,0,0,0,2,3,9,30:14,True,ATENAS (C),1,0,3,0,1,0
4,321117,1498,0,"MARCONETTI, S.","MARCONETTI, SANTIAGO JAVIER",0,0,0,0,0,0,0,0,0,0,0,0,00:00,False,ATENAS (C),0,0,0,0,0,0
5,209521,1498,0,"LEMA, L.","LEMA, LEONARDO",10,7,0,7,2,1,1,0,1,3,5,13,36:50,True,ATENAS (C),2,0,1,0,3,0
6,235314,1498,0,"VALFRE, F.","VALFRE, FACUNDO NICOLAS",0,0,0,0,0,0,0,0,0,0,0,0,00:00,False,ATENAS (C),0,0,0,0,0,0
7,171753,1498,0,"MAIDANA, J.","MAIDANA, JERONIMO",6,2,1,3,0,0,0,0,0,3,0,6,12:56,False,ATENAS (C),3,0,0,0,0,0
8,326727,1498,0,"BERNABEI, L.","BERNABEI, LISANDRO",0,0,0,0,0,0,0,0,0,0,0,0,00:00,False,ATENAS (C),0,0,0,0,0,0
9,276607,1498,0,"BUEMO, C.","BUEMO, CARLOS EMANUEL",15,1,1,2,1,1,2,0,0,3,2,6,36:30,True,ATENAS (C),6,0,1,0,0,0


In [29]:
df_box_scores.columns

Index(['IdJugador', 'IdClub', 'IdEquipo', 'Nombre', 'NombreCompleto', 'Puntos',
       'ReboteDefensivo', 'ReboteOfensivo', 'RebotesTotales', 'Asistencias',
       'Recuperaciones', 'Perdidas', 'TaponCometido', 'TaponRecibido',
       'FaltaCometida', 'FaltaRecibida', 'Valoracion', 'TiempoJuego',
       'CincoInicial', 'equipo', 'TirosDosAciertos', 'TirosDosFallos',
       'TirosTresAciertos', 'TirosTresFallos', 'TirosLibresAciertos',
       'TirosLibresFallos'],
      dtype='object')

### Play by Play

In [8]:
acciones_del_partido = []
driver = None

try:
    # Asumiendo que 'match_data' ya fue creada
    partido_key = list(match_data.keys())[0]
    partido_link = match_data[partido_key]["link_estadisticas"]
    print(f"El enlace del partido es: {partido_link}")

    # --- Parte 1: NAVEGACIÓN CON SELENIUM ---
    print("\nIniciando Selenium...")
    options = webdriver.ChromeOptions()
    options.add_argument("--headless")
    options.add_argument("--no-sandbox")
    options.add_argument("--disable-dev-shm-usage")
    options.add_argument("user-agent=Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36")

    driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()), options=options)
    driver.get(partido_link)
    
    wait = WebDriverWait(driver, 20)

    print("Cambiando al iframe principal...")
    wait.until(EC.frame_to_be_available_and_switch_to_it((By.TAG_NAME, "iframe")))
    print("Cambio al iframe principal exitoso.")
    
    print("Haciendo clic en la pestaña 'En vivo'...")
    en_vivo_tab = wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR, "li.pestana-en-vivo")))
    driver.execute_script("arguments[0].click();", en_vivo_tab)
    
    print("Cambiando al iframe anidado del Play-by-Play...")
    iframe_pbp_selector = (By.CSS_SELECTOR, "div.contenido-en-vivo div:nth-child(2) iframe")
    wait.until(EC.frame_to_be_available_and_switch_to_it(iframe_pbp_selector))
    print("Acceso al iframe final del Play-by-Play exitoso.")
    
    html_pbp = driver.page_source
    
    # --- Parte 2: EXTRACCIÓN CON BEAUTIFULSOUP (CORREGIDA) ---
    print("Procesando el HTML para extraer las acciones del partido...")
    soup = BeautifulSoup(html_pbp, "html.parser")

    contenedor_acciones = soup.find("ul", class_="listadoAccionesPartido")

    if contenedor_acciones:
        acciones = contenedor_acciones.find_all("li", class_="accion")
        print(f"Se encontraron {len(acciones)} acciones en el partido.")

        for accion in acciones:
            # Inicializamos todas las variables
            tipo_accion = jugador = cuarto = tiempo = ""
            puntos_local = None 
            puntos_visita = None

            titulo_tag = accion.find("strong", class_="titulo")
            if titulo_tag:
                tipo_accion = titulo_tag.get_text(strip=True)

            spans_info = accion.find_all("span", class_="informacion")
            if len(spans_info) >= 2:
                jugador = spans_info[0].get_text(strip=True)
                tiempo_text = spans_info[1].get_text(strip=True)
                match = re.search(r"Cuarto\s*(\d+)\s*-\s*(\d{2}:\d{2}:\d{2})", tiempo_text)
                if match:
                    cuarto = match.group(1)
                    tiempo = match.group(2)

            # --- NUEVO: Extraer el marcador de la acción ---
            marcador_tag = accion.find("strong", class_="informacionAdicional")
            if marcador_tag:
                marcador_texto = marcador_tag.get_text(strip=True)
                partes_marcador = marcador_texto.split('-')
                if len(partes_marcador) == 2:
                    try:
                        puntos_local = int(partes_marcador[0].strip())
                        puntos_visita = int(partes_marcador[1].strip())
                    except ValueError:
                        pass # Si hay un error, se quedan como None

            acciones_del_partido.append({
                "cuarto": cuarto,
                "tiempo": tiempo,
                "accion": tipo_accion,
                "jugador": jugador,
                "puntos_local": puntos_local,
                "puntos_visita": puntos_visita
            })

    # --- Parte 3: Crear y mostrar el DataFrame ---
    if acciones_del_partido:
        df_acciones = pd.DataFrame(acciones_del_partido)
        print("\n✅ DataFrame con marcador en cada acción:")
        display(df_acciones.head(10))
    else:
        print("No se pudieron extraer datos del Play-by-Play.")

except Exception as e:
    print(f"Ocurrió un error general: {e}")
finally:
    if driver:
        driver.quit()
        print("\nNavegador cerrado.")

El enlace del partido es: https://estadisticascabb.gesdeportiva.es/partido/rM2-eTJQHJsR2FLJYE8GRw==?a=1

Iniciando Selenium...
Cambiando al iframe principal...
Cambio al iframe principal exitoso.
Haciendo clic en la pestaña 'En vivo'...
Cambiando al iframe anidado del Play-by-Play...
Acceso al iframe final del Play-by-Play exitoso.
Procesando el HTML para extraer las acciones del partido...
Se encontraron 470 acciones en el partido.

✅ DataFrame con marcador en cada acción:


Unnamed: 0,cuarto,tiempo,accion,jugador,puntos_local,puntos_visita
0,,,FINAL DEL PERIODO4,,,
1,4.0,00:00:21,PÉRDIDA DE BALÓN,"PROME, TIZIANO URIEL SEBASTIAN",,
2,4.0,00:00:32,REBOTE OFENSIVO#5,"GUERRERO MARGARIT, JUAN MARTIN",,
3,4.0,00:00:32,TIRO DE 3 FALLADO,"PROME, TIZIANO URIEL SEBASTIAN",,
4,4.0,00:00:55,TIRO LIBRE ANOTADO,"TOMATIS, TIAGO",69.0,81.0
5,4.0,00:00:55,TIRO LIBRE ANOTADO,"TOMATIS, TIAGO",68.0,81.0
6,4.0,00:00:55,2 TIROS LIBRES PARA EL#55,"TOMATIS, TIAGO",,
7,4.0,00:00:55,FALTA RECIBIDA,"TOMATIS, TIAGO",,
8,4.0,00:00:55,FALTA COMETIDA,"CUELLO, MARTIN NICOLAS",,
9,4.0,00:01:11,TIRO LIBRE ANOTADO,"GUERRERO MARGARIT, JUAN MARTIN",67.0,81.0



Navegador cerrado.


In [None]:
# --- Requisitos ---
# Se asume que ya existen:
# 1. df_acciones: Con las columnas básicas (cuarto, tiempo, accion, etc.).
# 2. df_box_scores: Con las columnas 'NombreCompleto' y 'equipo'.
# ------------------

print("Iniciando el proceso completo para generar quintetos por equipo...")

try:
    # === PASO 1: Crear el mapa de jugadores desde el Box Score ===
    print("Paso 1: Creando mapa de jugadores desde 'df_box_scores'...")
    if 'df_box_scores' not in locals() or df_box_scores.empty:
        raise NameError("El DataFrame 'df_box_scores' no existe o está vacío.")
    
    player_to_team_map = pd.Series(df_box_scores.equipo.values, index=df_box_scores.NombreCompleto).to_dict()
    nombre_local = df_box_scores['equipo'].unique()[0]
    print(f"Mapa de roster creado. Equipo local: {nombre_local}")

    # === PASO 2: Generar la columna temporal 'quinteto_en_cancha' ===
    print("Paso 2: Generando lista de 10 jugadores en cancha por acción...")
    # Invertimos el DataFrame para procesar en orden cronológico
    df_cronologico = df_acciones.iloc[::-1].reset_index(drop=True)

    jugadores_en_cancha = set()
    lista_de_quintetos_mixtos = []

    for index, row in df_cronologico.iterrows():
        accion = row.get('accion', '')
        jugador = row.get('jugador', '')
        accion_upper = accion.upper() if isinstance(accion, str) else ''

        # Actualizamos el set de jugadores en cancha
        if "ENTRA A PISTA" in accion_upper or "CAMBIO-ENTRA" in accion_upper:
            if pd.notna(jugador) and jugador != '':
                jugadores_en_cancha.add(jugador)
        elif "ABANDONA LA PISTA" in accion_upper or "CAMBIO-SALE" in accion_upper:
            if pd.notna(jugador) and jugador != '':
                jugadores_en_cancha.discard(jugador)
        
        lista_de_quintetos_mixtos.append(sorted(list(jugadores_en_cancha)))

    # Añadimos la columna temporal al DataFrame cronológico
    df_cronologico['quinteto_en_cancha'] = lista_de_quintetos_mixtos

    # === PASO 3: Separar el quinteto mixto en local y visitante ===
    print("Paso 3: Separando la lista de 10 jugadores en quintetos por equipo...")
    
    def dividir_quinteto(quinteto_mixto, roster_map, equipo_local_nombre):
        quinteto_local, quinteto_visitante = [], []
        for jugador in quinteto_mixto:
            if roster_map.get(jugador) == equipo_local_nombre:
                quinteto_local.append(jugador)
            else:
                quinteto_visitante.append(jugador)
        return sorted(quinteto_local), sorted(quinteto_visitante)

    # Aplicamos la función para crear las dos columnas finales
    nuevas_columnas = df_cronologico['quinteto_en_cancha'].apply(
        lambda q: pd.Series(dividir_quinteto(q, player_to_team_map, nombre_local))
    )
    nuevas_columnas.columns = ['quinteto_local', 'quinteto_visita']

    # Unimos las columnas finales al DataFrame cronológico
    df_cronologico = pd.concat([df_cronologico, nuevas_columnas], axis=1)

    # === PASO 4: Finalizar y mostrar el DataFrame ===
    # Eliminamos la columna temporal que ya no necesitamos
    df_cronologico = df_cronologico.drop(columns=['quinteto_en_cancha'])
    
    # Revertimos el orden para que coincida con el original y lo guardamos
    df_acciones_final = df_cronologico.iloc[::-1].reset_index(drop=True)

    print("\n✅ ¡Proceso completado! DataFrame final generado.")
    
    # Mostramos el resultado
    columnas_a_mostrar = [
    'cuarto',          
    'tiempo',           
    'accion',
    'jugador',
    'puntos_local',
    'puntos_visita',
    'quinteto_local',
    'quinteto_visita'
]
    display(df_acciones_final[columnas_a_mostrar].head(10))

except Exception as e:
    print(f"❌ Ocurrió un error en el script: {e}")

Iniciando el proceso completo para generar quintetos por equipo...
Paso 1: Creando mapa de jugadores desde 'df_box_scores'...
Mapa de roster creado. Equipo local: ATENAS (C)
Paso 2: Generando lista de 10 jugadores en cancha por acción...
Paso 3: Separando la lista de 10 jugadores en quintetos por equipo...

✅ ¡Proceso completado! DataFrame final generado.


Unnamed: 0,cuarto,tiempo,accion,jugador,puntos_local,puntos_visita,quinteto_local,quinteto_visita
0,,,FINAL DEL PERIODO4,,,,"[ARAUJO, MAXIMO, LEMA, LEONARDO, MAIDANA, JERO...","[CUELLO, MARTIN NICOLAS, DELIA, MARCOS NICOLAS..."
1,4.0,00:00:21,PÉRDIDA DE BALÓN,"PROME, TIZIANO URIEL SEBASTIAN",,,"[ARAUJO, MAXIMO, LEMA, LEONARDO, MAIDANA, JERO...","[CUELLO, MARTIN NICOLAS, DELIA, MARCOS NICOLAS..."
2,4.0,00:00:32,REBOTE OFENSIVO#5,"GUERRERO MARGARIT, JUAN MARTIN",,,"[ARAUJO, MAXIMO, LEMA, LEONARDO, MAIDANA, JERO...","[CUELLO, MARTIN NICOLAS, DELIA, MARCOS NICOLAS..."
3,4.0,00:00:32,TIRO DE 3 FALLADO,"PROME, TIZIANO URIEL SEBASTIAN",,,"[ARAUJO, MAXIMO, LEMA, LEONARDO, MAIDANA, JERO...","[CUELLO, MARTIN NICOLAS, DELIA, MARCOS NICOLAS..."
4,4.0,00:00:55,TIRO LIBRE ANOTADO,"TOMATIS, TIAGO",69.0,81.0,"[ARAUJO, MAXIMO, LEMA, LEONARDO, MAIDANA, JERO...","[CUELLO, MARTIN NICOLAS, DELIA, MARCOS NICOLAS..."
5,4.0,00:00:55,TIRO LIBRE ANOTADO,"TOMATIS, TIAGO",68.0,81.0,"[ARAUJO, MAXIMO, LEMA, LEONARDO, MAIDANA, JERO...","[CUELLO, MARTIN NICOLAS, DELIA, MARCOS NICOLAS..."
6,4.0,00:00:55,2 TIROS LIBRES PARA EL#55,"TOMATIS, TIAGO",,,"[ARAUJO, MAXIMO, LEMA, LEONARDO, MAIDANA, JERO...","[CUELLO, MARTIN NICOLAS, DELIA, MARCOS NICOLAS..."
7,4.0,00:00:55,FALTA RECIBIDA,"TOMATIS, TIAGO",,,"[ARAUJO, MAXIMO, LEMA, LEONARDO, MAIDANA, JERO...","[CUELLO, MARTIN NICOLAS, DELIA, MARCOS NICOLAS..."
8,4.0,00:00:55,FALTA COMETIDA,"CUELLO, MARTIN NICOLAS",,,"[ARAUJO, MAXIMO, LEMA, LEONARDO, MAIDANA, JERO...","[CUELLO, MARTIN NICOLAS, DELIA, MARCOS NICOLAS..."
9,4.0,00:01:11,TIRO LIBRE ANOTADO,"GUERRERO MARGARIT, JUAN MARTIN",67.0,81.0,"[ARAUJO, MAXIMO, LEMA, LEONARDO, MAIDANA, JERO...","[CUELLO, MARTIN NICOLAS, DELIA, MARCOS NICOLAS..."


In [39]:
# --- FUNCIÓN PARA CALCULAR EL +/- ---
def calcular_plus_minus_corregido(df_enriquecido, roster_completo):
    print("Calculando +/- para cada jugador...")
    plus_minus = {jugador: 0 for jugador in roster_completo.keys()}
    score_anterior = {'local': 0, 'visitante': 0}
    df_enriquecido[['puntos_local', 'puntos_visita']] = df_enriquecido[['puntos_local', 'puntos_visita']].ffill().fillna(0)
    
    for _, row in df_enriquecido.iterrows():
        puntos_actual_local, puntos_actual_visitante = row['puntos_local'], row['puntos_visita']
        if puntos_actual_local != score_anterior['local'] or puntos_actual_visitante != score_anterior['visitante']:
            diferencial_jugada = (puntos_actual_local - score_anterior['local']) - (puntos_actual_visitante - score_anterior['visitante'])
            for p in row['quinteto_local']:
                if p in plus_minus: plus_minus[p] += diferencial_jugada
            for p in row['quinteto_visita']:
                if p in plus_minus: plus_minus[p] -= diferencial_jugada
            score_anterior = {'local': puntos_actual_local, 'visitante': puntos_actual_visitante}
    print("✅ Cálculo de +/- finalizado.")
    return pd.DataFrame(list(plus_minus.items()), columns=['jugador', 'plus_minus'])

# --- NUEVA FUNCIÓN PARA CALCULAR POSESIONES ---
def calcular_posesiones(df_acciones):
    """
    Calcula las posesiones consumidas por cada jugador basándose en palabras clave.

    Args:
        df_acciones (pd.DataFrame): DataFrame con el play-by-play del partido.
            Debe contener las columnas 'accion' y 'jugador'.

    Returns:
        pd.DataFrame: Un DataFrame con las columnas 'jugador' y 'posesiones'.
    """
    print("🔥 Calculando posesiones consumidas por jugador...")

    # 1. Lista de acciones que cuentan como una posesión consumida
    acciones_de_posesion = [
        "TIRO DE 3 FALLADO",
        "TIRO DE 2 FALLADO",
        "2 TIROS LIBRES PARA",
        "3 TIROS LIBRES PARA",
        "TRIPLE",
        "CANASTA DE 2 PUNTOS",
        "PÉRDIDA DE BALÓN"
    ]

    # 2. Crear un patrón de texto para buscar todas las acciones a la vez
    # El '|' funciona como un 'OR' en la búsqueda de texto.
    patron_busqueda = '|'.join(acciones_de_posesion)

    # 3. Filtrar el DataFrame para obtener solo las filas donde la acción coincide
    # 'str.contains' busca el patrón en la columna 'accion'. 'na=False' evita errores con filas vacías.
    df_posesiones_consumidas = df_acciones[df_acciones['accion'].str.contains(patron_busqueda, na=False)].copy()

    # 4. Agrupar por jugador y contar cuántas de estas acciones tuvo cada uno
    conteo_posesiones = df_posesiones_consumidas.groupby('jugador').size()
    
    # 5. Convertir el resultado a un DataFrame con el formato correcto
    df_resultado = conteo_posesiones.reset_index(name='posesiones')
    
    print("✅ Cálculo de posesiones finalizado.")
    return df_resultado

def contar_posesiones_jugadas_por_equipo(df_acciones, df_box_scores, player_to_team_map):
    """
    Cuenta las posesiones que ocurrieron para el equipo de un jugador mientras
    este se encontraba en la cancha.

    Args:
        df_acciones (pd.DataFrame): DataFrame con el play-by-play y quintetos.
        df_box_scores (pd.DataFrame): DataFrame con el roster de jugadores y equipos.
        player_to_team_map (dict): Diccionario que mapea 'NombreCompleto' a 'equipo'.

    Returns:
        pd.DataFrame: DataFrame con las columnas 'jugador' y 'posesiones_jugadas'.
    """
    print("📊 Calculando posesiones jugadas por equipo para cada jugador...")

    # 1. Inicializar el contador para todos los jugadores del partido.
    roster = df_box_scores['NombreCompleto'].tolist()
    posesiones_jugadas = {jugador: 0 for jugador in roster}
    
    # Necesitamos saber cuál es el equipo local para diferenciar quintetos.
    nombre_local = df_box_scores['equipo'].unique()[0]

    # 2. Identificar las jugadas que finalizan una posesión.
    acciones_de_posesion = [
        "TIRO DE 3 FALLADO",
        "TIRO DE 2 FALLADO",
        "2 TIROS LIBRES PARA",
        "3 TIROS LIBRES PARA",
        "TRIPLE",
        "CANASTA DE 2 PUNTOS",
        "PÉRDIDA DE BALÓN"
    ]
    patron_busqueda = '|'.join(acciones_de_posesion)
    df_fines_de_posesion = df_acciones[df_acciones['accion'].str.contains(patron_busqueda, na=False)].copy()

    # 3. Iterar sobre las jugadas de fin de posesión.
    for _, jugada in df_fines_de_posesion.iterrows():
        jugador_accion = jugada.get('jugador')
        
        # Si no hay un jugador asociado a la acción, no podemos determinar el equipo.
        if not jugador_accion or pd.isna(jugador_accion):
            continue

        # 4. Determinar qué equipo tuvo la posesión.
        equipo_posesion = player_to_team_map.get(jugador_accion)
        
        # 5. Seleccionar el quinteto correcto (local o visitante).
        quinteto_del_equipo_en_posesion = []
        if equipo_posesion == nombre_local:
            quinteto_del_equipo_en_posesion = jugada['quinteto_local']
        else:
            quinteto_del_equipo_en_posesion = jugada['quinteto_visita']

        # 6. Sumar 1 al contador de cada jugador de ese quinteto.
        for jugador in quinteto_del_equipo_en_posesion:
            if jugador in posesiones_jugadas:
                posesiones_jugadas[jugador] += 1
    
    # 7. Convertir el resultado a un DataFrame.
    df_resultado = pd.DataFrame(list(posesiones_jugadas.items()), columns=['jugador', 'posesiones_jugadas'])
    print("✅ Cálculo de posesiones jugadas finalizado.")
    return df_resultado

# --- FUNCIÓN MEJORADA PARA CALCULAR REBOTES OF/DEF DISPONIBLES ---
def calcular_rebotes_disponibles(df_acciones, df_box_scores, player_to_team_map):
    """
    Calcula la cantidad de oportunidades de rebote ofensivo y defensivo que 
    tuvo cada jugador mientras estaba en la cancha.

    Una oportunidad de rebote ocurre cuando hay un tiro de campo fallado o el
    último tiro libre de una secuencia es fallado.

    - Para el equipo que atacaba, es una oportunidad de rebote OFENSIVO.
    - Para el equipo que defendía, es una oportunidad de rebote DEFENSIVO.

    Args:
        df_acciones (pd.DataFrame): DF con el play-by-play y quintetos, ordenado cronológicamente.
        df_box_scores (pd.DataFrame): DF con el roster de jugadores y equipos.
        player_to_team_map (dict): Diccionario que mapea 'NombreCompleto' a 'equipo'.

    Returns:
        pd.DataFrame: DataFrame con las columnas 'jugador', 'reb_of_disp', y 'reb_def_disp'.
    """
    print(" rebounding... Calculando oportunidades de rebote OFENSIVAS y DEFENSIVAS...")

    # 1. Inicializar contadores para todos los jugadores del partido.
    roster = df_box_scores['NombreCompleto'].tolist()
    # *** NUEVO: Dos diccionarios, uno para cada tipo de rebote disponible. ***
    reb_of_disponibles = {jugador: 0 for jugador in roster}
    reb_def_disponibles = {jugador: 0 for jugador in roster}
    
    nombre_local = df_box_scores['equipo'].unique()[0]
    
    # 2. Iterar sobre el índice del DataFrame para poder mirar filas futuras.
    num_acciones = len(df_acciones)
    for i in range(num_acciones):
        jugada = df_acciones.iloc[i]
        accion = jugada['accion']
        
        es_oportunidad_de_rebote = False
        
        # --- Lógica para detectar una oportunidad de rebote (sin cambios) ---
        if "TIRO DE 3 FALLADO" in accion or "TIRO DE 2 FALLADO" in accion:
            es_oportunidad_de_rebote = True
        elif "1 TIRO LIBRE PARA" in accion:
            if (i + 1 < num_acciones) and "TIRO LIBRE FALLADO" in df_acciones.iloc[i + 1]['accion']:
                es_oportunidad_de_rebote = True
        elif "2 TIROS LIBRES PARA" in accion:
            if (i + 2 < num_acciones) and "TIRO LIBRE FALLADO" in df_acciones.iloc[i + 2]['accion']:
                es_oportunidad_de_rebote = True
        elif "3 TIROS LIBRES PARA" in accion:
            if (i + 3 < num_acciones) and "TIRO LIBRE FALLADO" in df_acciones.iloc[i + 3]['accion']:
                es_oportunidad_de_rebote = True

        # 3. Si se encontró una oportunidad, se asigna a ambos equipos.
        if es_oportunidad_de_rebote:
            jugador_accion = jugada.get('jugador')
            if not jugador_accion or pd.isna(jugador_accion):
                continue

            equipo_ofensivo = player_to_team_map.get(jugador_accion)
            if not equipo_ofensivo:
                continue

            # *** NUEVO: Identificar ambos quintetos, el ofensivo y el defensivo. ***
            if equipo_ofensivo == nombre_local:
                quinteto_ofensivo = jugada['quinteto_local']
                quinteto_defensivo = jugada['quinteto_visita']
            else:
                quinteto_ofensivo = jugada['quinteto_visita']
                quinteto_defensivo = jugada['quinteto_local']

            # Sumar la oportunidad de REBOTE OFENSIVO a los jugadores del equipo atacante.
            for jugador in quinteto_ofensivo:
                if jugador in reb_of_disponibles:
                    reb_of_disponibles[jugador] += 1
            
            # Sumar la oportunidad de REBOTE DEFENSIVO a los jugadores del equipo defensor.
            for jugador in quinteto_defensivo:
                if jugador in reb_def_disponibles:
                    reb_def_disponibles[jugador] += 1

    # 4. Convertir los diccionarios en DataFrames y unirlos.
    df_ofensivos = pd.DataFrame(list(reb_of_disponibles.items()), columns=['jugador', 'rebote_of_disp'])
    df_defensivos = pd.DataFrame(list(reb_def_disponibles.items()), columns=['jugador', 'rebote_def_disp'])
    
    # Unir los dos dataframes en uno solo usando 'jugador' como clave.
    df_resultado = pd.merge(df_ofensivos, df_defensivos, on='jugador')
    
    print("✅ Cálculo de rebotes disponibles finalizado.")
    return df_resultado

# --- FUNCIÓN PARA CALCULAR POSESIONES INDIVIDUALES ESTIMADAS ---
def calcular_posesiones_individuales(df_box_score):
    """
    Estima las posesiones finalizadas por cada jugador individualmente usando
    la fórmula de Dean Oliver.

    Args:
        df_box_score (pd.DataFrame): DataFrame que contiene las estadísticas
                                     detalladas por jugador. Debe incluir columnas
                                     de aciertos y fallos para cada tipo de tiro,
                                     'ReboteOfensivo' y 'Perdidas'.

    Returns:
        pd.DataFrame: El DataFrame original con una nueva columna llamada
                      'posesiones_estimadas'.
    """
    print(" Bx... Estimando posesiones finalizadas por cada jugador...")
    
    # Se crea una copia para evitar advertencias de SettingWithCopyWarning
    df = df_box_score.copy()

    # 1. Calcular Tiros de Campo Intentados (TCI)
    tci_individual = (df['TirosDosAciertos'] + df['TirosDosFallos'] +
                      df['TirosTresAciertos'] + df['TirosTresFallos'])

    # 2. Calcular Tiros Libres Intentados (TLI)
    tli_individual = df['TirosLibresAciertos'] + df['TirosLibresFallos']
    
    # 3. Aplicar la fórmula de Oliver y crear la nueva columna
    df['posesiones_estimadas'] = (
        tci_individual +
        0.44 * tli_individual -
        df['ReboteOfensivo'] +
        df['Perdidas']
    ).clip(lower=0).round(2)
    
    return df

# --- FUNCIÓN PARA CALCULAR PUNTOS EN EL ÚLTIMO CUARTO (LÓGICA MEJORADA) ---
def calcular_puntos_ultimo_cuarto(df_acciones, df_box_scores):
    """
    Calcula los puntos anotados por cada jugador en el último cuarto (Q4) y
    cualquier prórroga posterior.

    Args:
        df_acciones (pd.DataFrame): DataFrame con el play-by-play del partido.
                                    Debe contener las columnas 'accion', 'jugador' y 'cuarto'.
        df_box_scores (pd.DataFrame): DataFrame con el roster de jugadores para inicializar los contadores.

    Returns:
        pd.DataFrame: Un DataFrame con las columnas 'jugador' y 'puntos_q4_y_prorroga'.
    """
    print(" clutch... Calculando puntos en el último cuarto y prórrogas...")

    # 1. Inicializar el contador de puntos.
    roster = df_box_scores['NombreCompleto'].tolist()
    puntos_finales = {jugador: 0 for jugador in roster}

    # 2. Filtrar las acciones que NO ocurrieron en los primeros 3 cuartos.
    cuartos_a_excluir = ['1', '2', '3']
    df_momentos_finales = df_acciones[~df_acciones['cuarto'].isin(cuartos_a_excluir)].copy()

    # 3. Definir los puntos por acción.
    # ¡Ajusta 'TIRO LIBRE ANOTADO' si en tus datos se llama de otra manera!
    puntos_por_accion = {
        "TRIPLE": 3,
        "CANASTA DE 2 PUNTOS": 2,
        "TIRO LIBRE ANOTADO": 1
    }

    # 4. Iterar sobre las jugadas de los momentos finales y sumar los puntos.
    for _, jugada in df_momentos_finales.iterrows():
        accion = jugada.get('accion')
        jugador = jugada.get('jugador')
        
        if accion in puntos_por_accion and pd.notna(jugador):
            if jugador in puntos_finales:
                puntos_finales[jugador] += puntos_por_accion[accion]
    
    # 5. Convertir a DataFrame y renombrar la columna para mayor claridad.
    df_resultado = pd.DataFrame(list(puntos_finales.items()), columns=['jugador', 'puntos_q4_y_prorroga'])
    
    print("✅ Cálculo de puntos en Q4 y prórrogas finalizado.")
    return df_resultado


In [40]:
# --- INICIO DEL SCRIPT DE ANÁLISIS PRINCIPAL ---
print("\nIniciando análisis avanzado de Play-by-Play...")
try:
    # --- PREPARACIÓN DE DATOS ---
    player_to_team_map = pd.Series(df_box_scores.equipo.values, index=df_box_scores.NombreCompleto).to_dict()
    df_sorted = df_acciones_final.iloc[::-1].reset_index(drop=True)
    
    # --- CÁLCULO DE MÉTRICAS AVANZADAS (DESDE FUNCIONES) ---
    df_plus_minus = calcular_plus_minus_corregido(df_sorted.copy(), player_to_team_map)
    df_posesiones_consumidas = calcular_posesiones(df_sorted.copy())
    df_posesiones_consumidas.rename(columns={'posesiones': 'posesiones_consumidas'}, inplace=True)
    df_posesiones_jugadas = contar_posesiones_jugadas_por_equipo(df_sorted.copy(), df_box_scores.copy(), player_to_team_map)
    df_rebotes_disponibles = calcular_rebotes_disponibles(df_sorted.copy(), df_box_scores.copy(), player_to_team_map)
    df_puntos_q4 = calcular_puntos_ultimo_cuarto(df_acciones_final.copy(), df_box_scores.copy())

    # --- UNIR ESTADÍSTICAS AVANZADAS ---
    print("\nUniendo todos los datos calculados...")
    resultado_final = df_box_scores.copy()
    
    lista_de_stats = [df_plus_minus, df_posesiones_consumidas, df_posesiones_jugadas, df_rebotes_disponibles, df_puntos_q4]
    
    for df_stat in lista_de_stats:
        df_stat.rename(columns={'jugador': 'NombreCompleto'}, inplace=True)
        resultado_final = pd.merge(resultado_final, df_stat, on='NombreCompleto', how='left')

    cols_a_rellenar = ['plus_minus', 'posesiones_consumidas', 'posesiones_jugadas', 'reb_of_disp', 'reb_def_disp', 'puntos_q4']
    for col in cols_a_rellenar:
        if col in resultado_final.columns:
            resultado_final[col] = resultado_final[col].fillna(0).astype(int)

    resultado_final = calcular_posesiones_individuales(resultado_final)

    # --- MOSTRAR RESULTADO FINAL ---
    print("\n✅ Resultado Final con Estadísticas Completas:")
    display(resultado_final)

except Exception as e:
    import traceback
    print(f"\n❌ Ocurrió un error en el script de análisis: {e}")
    traceback.print_exc()


Iniciando análisis avanzado de Play-by-Play...
Calculando +/- para cada jugador...
✅ Cálculo de +/- finalizado.
🔥 Calculando posesiones consumidas por jugador...
✅ Cálculo de posesiones finalizado.
📊 Calculando posesiones jugadas por equipo para cada jugador...
✅ Cálculo de posesiones jugadas finalizado.
 rebounding... Calculando oportunidades de rebote OFENSIVAS y DEFENSIVAS...
✅ Cálculo de rebotes disponibles finalizado.
 clutch... Calculando puntos en el último cuarto y prórrogas...
✅ Cálculo de puntos en Q4 y prórrogas finalizado.

Uniendo todos los datos calculados...
 Bx... Estimando posesiones finalizadas por cada jugador...

✅ Resultado Final con Estadísticas Completas:


Unnamed: 0,IdJugador,IdClub,IdEquipo,Nombre,NombreCompleto,Puntos,ReboteDefensivo,ReboteOfensivo,RebotesTotales,Asistencias,Recuperaciones,Perdidas,TaponCometido,TaponRecibido,FaltaCometida,FaltaRecibida,Valoracion,TiempoJuego,CincoInicial,equipo,TirosDosAciertos,TirosDosFallos,TirosTresAciertos,TirosTresFallos,TirosLibresAciertos,TirosLibresFallos,plus_minus,posesiones_consumidas,posesiones_jugadas,rebote_of_disp,rebote_def_disp,puntos_q4_y_prorroga,posesiones_estimadas
0,78377,1498,0,"ARAUJO, M.","ARAUJO, MAXIMO",3,0,0,0,0,0,0,0,0,1,0,1,18:05,False,ATENAS (C),0,0,1,0,0,0,1,2,53,26,22,0,1.0
1,326699,1498,0,"BUENDIA, C.","BUENDIA, CARLOS MANUEL",1,0,0,0,1,0,1,0,0,0,3,1,07:57,True,ATENAS (C),0,0,0,0,1,0,-15,4,14,7,4,0,1.44
2,273565,1498,0,"MONTERO, J.","MONTERO, JOSE IGNACIO",2,0,0,0,3,1,2,0,0,0,2,4,23:27,False,ATENAS (C),0,0,0,0,2,0,-2,5,44,19,17,0,2.88
3,209515,1498,0,"ARN BUSTAMANTE, L.","ARN BUSTAMANTE, LUCAS MARTIN",12,1,0,1,4,0,0,0,0,2,3,9,30:14,True,ATENAS (C),1,0,3,0,1,0,-15,13,56,27,21,0,4.44
4,321117,1498,0,"MARCONETTI, S.","MARCONETTI, SANTIAGO JAVIER",0,0,0,0,0,0,0,0,0,0,0,0,00:00,False,ATENAS (C),0,0,0,0,0,0,0,0,0,0,0,0,0.0
5,209521,1498,0,"LEMA, L.","LEMA, LEONARDO",10,7,0,7,2,1,1,0,1,3,5,13,36:50,True,ATENAS (C),2,0,1,0,3,0,-15,12,69,33,30,3,5.32
6,235314,1498,0,"VALFRE, F.","VALFRE, FACUNDO NICOLAS",0,0,0,0,0,0,0,0,0,0,0,0,00:00,False,ATENAS (C),0,0,0,0,0,0,0,0,0,0,0,0,0.0
7,171753,1498,0,"MAIDANA, J.","MAIDANA, JERONIMO",6,2,1,3,0,0,0,0,0,3,0,6,12:56,False,ATENAS (C),3,0,0,0,0,0,0,3,22,11,13,4,2.0
8,326727,1498,0,"BERNABEI, L.","BERNABEI, LISANDRO",0,0,0,0,0,0,0,0,0,0,0,0,00:00,False,ATENAS (C),0,0,0,0,0,0,0,0,0,0,0,0,0.0
9,276607,1498,0,"BUEMO, C.","BUEMO, CARLOS EMANUEL",15,1,1,2,1,1,2,0,0,3,2,6,36:30,True,ATENAS (C),6,0,1,0,0,0,-13,19,70,33,26,4,8.0


falta agrega puntos_cluch

Este es el conteo de posesiones cnsumidas realmente por los jugadores. Comparo con la estimadas:

In [12]:
print("Calculando posesiones estimadas y agregándolas al DataFrame...")

try:
    # 1. Calculamos los Tiros de Campo Intentados (TCI)
    tiros_de_campo_intentados = (
        df_box_scores['TirosDosAciertos'] +
        df_box_scores['TirosDosFallos'] +
        df_box_scores['TirosTresAciertos'] +
        df_box_scores['TirosTresFallos']
    )

    # 2. Calculamos los Tiros Libres Intentados (TLI)
    tiros_libres_intentados = (
        df_box_scores['TirosLibresAciertos'] +
        df_box_scores['TirosLibresFallos']
    )

    # 3. Aplicamos la fórmula completa para las posesiones estimadas
    df_box_scores['posesiones_estimadas'] = (
        tiros_de_campo_intentados +
        (0.44 * tiros_libres_intentados) +
        df_box_scores['Perdidas']
    )
    
    print("\n✅ Columna 'posesiones_estimadas' agregada exitosamente.")
    
    # 4. Mostramos las columnas relevantes para comparar
    # (Asegúrate de tener la columna 'posesiones_reales' de tu análisis anterior para una comparación directa)
    
    columnas_a_mostrar = ['NombreCompleto', 'equipo', 'posesiones_estimadas']
    
    # Si ya tienes la columna de posesiones reales, la añadimos para comparar
    if 'posesiones_reales' in df_box_scores.columns:
        columnas_a_mostrar.append('posesiones_reales')

    display(df_box_scores[columnas_a_mostrar].sort_values(by='posesiones_estimadas', ascending=False))

except KeyError as e:
    print(f"\n❌ Error: No se encontró la columna {e} en el DataFrame.")
    print("Por favor, verifica que todos los nombres de columnas sean correctos.")
except Exception as e:
    print(f"\n❌ Ocurrió un error inesperado: {e}")

Calculando posesiones estimadas y agregándolas al DataFrame...

✅ Columna 'posesiones_estimadas' agregada exitosamente.


Unnamed: 0,NombreCompleto,equipo,posesiones_estimadas
11,"OBERTO, JUAN CRUZ MATEO",ATENAS (C),10.88
9,"BUEMO, CARLOS EMANUEL",ATENAS (C),9.0
17,"DELIA, MARCOS NICOLAS",BOCA,7.44
14,"ANDERSON, ALPHONSO JORDAN",BOCA,7.44
13,"GUERRERO MARGARIT, JUAN MARTIN",BOCA,6.88
12,"STENTA, NICOLAS",BOCA,6.44
16,"VILDOZA, JOSE IGNACIO",BOCA,5.88
5,"LEMA, LEONARDO",ATENAS (C),5.32
3,"ARN BUSTAMANTE, LUCAS MARTIN",ATENAS (C),4.44
19,"IBARGUEN ANDREWS, ANDRES FELIPE",BOCA,4.32
