# Proyecto de Data Science - Análisis de Básquet Argentino

## Abstract
Este proyecto tiene como objetivo analizar el rendimiento de los equipos de la Liga Nacional de Básquet de Argentina mediante un conjunto de datos con estadísticas de partidos. Se buscará extraer insights sobre la relación entre puntos, rebotes, asistencias y otros indicadores de desempeño. Además, se identificará la efectividad de los lanzamientos de tres puntos y su impacto en los resultados de los partidos. Finalmente, se evaluará la influencia de las pérdidas de balón en el rendimiento de los equipos.

## Preguntas de interés
- ¿Existe una correlación entre los triples encestados y la cantidad de puntos anotados?
- ¿Los equipos que toman más rebotes suelen ganar los partidos?
- ¿Qué relación hay entre las pérdidas y la cantidad de asistencias?

In [1]:

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# URL pública del archivo CSV en GitHub
csv_url = "https://raw.githubusercontent.com/Leanpicazoo/analisis-basquet-arg/refs/heads/main/Dataset_de_B_squet_Argentino.csv"

# Cargar el dataset directamente desde GitHub
df = pd.read_csv(csv_url)

# Mostrar las primeras filas
df.head()


Unnamed: 0,Partido_ID,Equipo_Local,Equipo_Visitante,Puntos_Local,Puntos_Visitante,Rebotes_Local,Rebotes_Visitante,Asistencias_Local,Asistencias_Visitante,Pérdidas_Local,Pérdidas_Visitante,Triples_Intentados_Local,Triples_Encestados_Local,Triples_Intentados_Visitante,Triples_Encestados_Visitante
0,1,Comunicaciones,Hispano Americano,76,83,27,31,28,17,9,17,28,9,22,20
1,2,Hispano Americano,Comunicaciones,94,67,26,32,16,27,6,15,33,29,14,28
2,3,Hispano Americano,Peñarol,61,91,41,35,24,18,13,14,22,15,38,28
3,4,Comunicaciones,Hispano Americano,117,115,49,46,26,29,10,8,26,29,30,26
4,5,Atenas,Ferro,67,61,29,31,20,12,13,12,38,27,11,24


In [None]:

# Identificación de valores perdidos
missing_values = df.isnull().sum()
print("Valores perdidos en cada columna:")
print(missing_values)


In [None]:

plt.figure(figsize=(10, 6))
sns.scatterplot(x=df['Triples_Encestados_Local'] + df['Triples_Encestados_Visitante'],
                y=df['Puntos_Local'] + df['Puntos_Visitante'])
plt.xlabel("Triples Encestados (Totales)")
plt.ylabel("Puntos Totales")
plt.title("Relación entre Triples Encestados y Puntos")
plt.show()


In [None]:

df['Ganador'] = np.where(df['Puntos_Local'] > df['Puntos_Visitante'], df['Equipo_Local'], df['Equipo_Visitante'])
rebotes_por_victoria = df.groupby("Ganador")[['Rebotes_Local', 'Rebotes_Visitante']].mean()
rebotes_por_victoria.plot(kind='bar', figsize=(12,6))
plt.ylabel("Promedio de Rebotes")
plt.title("Promedio de Rebotes por Equipo Ganador")
plt.show()


In [None]:

plt.figure(figsize=(10, 6))
sns.scatterplot(x=df['Pérdidas_Local'] + df['Pérdidas_Visitante'],
                y=df['Asistencias_Local'] + df['Asistencias_Visitante'])
plt.xlabel("Pérdidas Totales")
plt.ylabel("Asistencias Totales")
plt.title("Relación entre Pérdidas y Asistencias")
plt.show()
