### Librerias

In [None]:
import numpy as np
import pandas as pd 
import matplotlib.pyplot as plt
import seaborn as sns

In [None]:
import warnings
warnings.filterwarnings("ignore")

### Importamos las tablas a usar en nuestra Análisis Exploratorio

In [None]:
games_lakers = pd.read_csv("../ETL/games_lakers_reordenado.csv")

In [None]:
games_lakers

In [None]:
lakers_21_24 = pd.read_csv("../ETL/lakers_21_24.csv")

In [None]:
lakers_21_24

### Gráficos de EDA de la tabla games_lakers

- Grafico de calor para comparar las victorias y derrotas de LAL como visitante y como local

In [None]:
# Asegúrate de que game_date esté en formato datetime y extrae el año
games_lakers['game_date'] = pd.to_datetime(games_lakers['game_date'])
games_lakers['year'] = games_lakers['game_date'].dt.year

# Filtrar solo los registros donde team_name_home sea "Los Angeles Lakers"
lakers_home_games = games_lakers[games_lakers['team_name_home'] == 'Los Angeles Lakers']

# Crear una tabla de contingencia con wl_home y año
heatmap_home_data = pd.crosstab(lakers_home_games['year'], lakers_home_games['wl_home'])

# Crear un mapa de calor
plt.figure(figsize=(10, 6))
sns.heatmap(heatmap_home_data, annot=True, cmap='coolwarm', fmt='d', linewidths=0.5)
plt.title('Mapa de Calor: Resultados en Casa de Los Angeles Lakers por Año', fontsize=14)
plt.xlabel('Resultado (W o L)', fontsize=12)
plt.ylabel('Año', fontsize=12)
plt.show()


In [None]:
# Filtrar solo los registros donde team_name_away sea "Los Angeles Lakers"
lakers_away_games = games_lakers[games_lakers['team_name_away'] == 'Los Angeles Lakers']

# Crear una tabla de contingencia con wl_away y año
heatmap_away_data = pd.crosstab(lakers_away_games['year'], lakers_away_games['wl_away'])

# Crear un mapa de calor
plt.figure(figsize=(10, 6))
sns.heatmap(heatmap_away_data, annot=True, cmap='coolwarm', fmt='d', linewidths=0.5)
plt.title('Mapa de Calor: Resultados como Visitante de Los Angeles Lakers por Año', fontsize=14)
plt.xlabel('Resultado (W o L)', fontsize=12)
plt.ylabel('Año', fontsize=12)
plt.show()

In [None]:
# Crear subplots para los mapas de calor
fig, axes = plt.subplots(1, 2, figsize=(16, 6), sharey=True)

# Mapa de calor: Resultados en casa
sns.heatmap(heatmap_home_data, annot=True, fmt='d', cmap='coolwarm', cbar=False, ax=axes[0], linewidths=0.5, 
            annot_kws={"size": 14})
axes[0].set_title('Resultados en Casa de Los Angeles Lakers', fontsize=18)
axes[0].set_xlabel('Resultado (W o L)', fontsize=16)
axes[0].set_ylabel('Año', fontsize=16)

# Mapa de calor: Resultados como visitante
sns.heatmap(heatmap_away_data, annot=True, fmt='d', cmap='coolwarm', cbar=False, ax=axes[1], linewidths=0.5, 
            annot_kws={"size": 16})
axes[1].set_title('Resultados como Visitante de Los Angeles Lakers', fontsize=18)
axes[1].set_xlabel('Resultado (W o L)', fontsize=16)
axes[1].set_ylabel('') 
plt.tight_layout()
plt.show()


- Gráfico de barra donde se aprecia una comparación entre promedio de distintas metricas cuando LAL juega como local y como visitante

In [None]:
# Filtrar los juegos donde team_name_home y team_name_away sean "Los Angeles Lakers"
lakers_home_games = games_lakers[games_lakers['team_name_home'] == 'Los Angeles Lakers']
lakers_away_games = games_lakers[games_lakers['team_name_away'] == 'Los Angeles Lakers']

# Seleccionar las columnas relevantes para casa y visitante
columns_home = [
    'fgm_home', 'fga_home', 'fg_pct_home', 'fg3m_home', 'fg3a_home', 'fg3_pct_home',
    'ftm_home', 'fta_home', 'ft_pct_home', 'oreb_home', 'dreb_home', 'reb_home',
    'ast_home', 'stl_home', 'blk_home', 'tov_home', 'pf_home', 'pts_home'
]
columns_away = [
    'fgm_away', 'fga_away', 'fg_pct_away', 'fg3m_away', 'fg3a_away', 'fg3_pct_away',
    'ftm_away', 'fta_away', 'ft_pct_away', 'oreb_away', 'dreb_away', 'reb_away',
    'ast_away', 'stl_away', 'blk_away', 'tov_away', 'pf_away', 'pts_away'
]

# Calcular los promedios
averages_home = lakers_home_games[columns_home].mean()
averages_away = lakers_away_games[columns_away].mean()

# Renombrar las columnas para que sean comparables
averages_home.index = [col.replace('_home', '') for col in averages_home.index]
averages_away.index = [col.replace('_away', '') for col in averages_away.index]

# Crear un DataFrame combinado
averages_combined = pd.DataFrame({'Local': averages_home, 'Visitante': averages_away})

# Crear un gráfico de barras agrupadas
plt.figure(figsize=(14, 7))
averages_combined.plot(kind='bar', width=0.8, color=['#020940', '#dd4605'], edgecolor='black')
plt.title('Promedio de Métricas - Los Angeles Lakers (Local vs Visitante)', fontsize=16)
plt.xlabel('Métricas', fontsize=12)
plt.ylabel('Promedio', fontsize=12)
plt.xticks(rotation=45, ha='right')
plt.legend(title='Condición')
plt.grid(axis='y', alpha=0.5)
plt.tight_layout()
plt.show()


In [None]:
# Filtrar los datos según las condiciones dadas
lakers_lost = games_lakers[(games_lakers['team_name_home'] == 'Los Angeles Lakers') & (games_lakers['wl_home'] == 'L')]

# Contar las ocurrencias de cada equipo en team_name_away
away_team_counts = lakers_lost['team_name_away'].value_counts().reset_index()
away_team_counts.columns = ['team_name_away', 'count']

# Crear el gráfico de barras
plt.figure(figsize=(14, 8))
sns.barplot(data=away_team_counts, x='count', y='team_name_away', palette="Oranges")
plt.title("Cantidad de Veces que los Equipos Visitantes Perdieron contra los Lakers en Casa", fontsize=20)
plt.xlabel("Cantidad de Veces", fontsize=16)
plt.ylabel("Equipo Visitante", fontsize=16)
plt.xticks(fontsize=14)
plt.yticks(fontsize=14)
plt.grid(axis="x", linestyle="--", alpha=0.7)
plt.tight_layout()
plt.show()

### Gráficos de EDA de la tabla lakers_21_24

- Gráfico de barras que muestra el promedio de LAL de diferentes Métricas por temporada

In [None]:
# Seleccionar métricas relevantes
metrics = ["PTS", "AST", "TRB", "FG%", "3P%", "FT%"]

# Calcular promedios por temporada
average_metrics = lakers_21_24.groupby("season_year")[metrics].mean().reset_index()

# Transformar los datos para facilitar la visualización
average_metrics_melted = average_metrics.melt(id_vars=["season_year"], 
                                               var_name="Métrica", 
                                               value_name="Promedio")

# Crear el gráfico con ajustes de tamaño de letra
plt.figure(figsize=(14, 8))
sns.barplot(data=average_metrics_melted, x="season_year", y="Promedio", hue="Métrica", palette="coolwarm")
plt.title("Promedio de Métricas por Temporada", fontsize=20)
plt.xlabel("Temporada", fontsize=16)
plt.ylabel("Promedio", fontsize=16)
plt.legend(title="Métrica", fontsize=14, title_fontsize=16)
plt.xticks(fontsize=14, rotation=45)
plt.yticks(fontsize=14)

# Ajustes de cuadrícula y espacio
plt.grid(axis="y", linestyle="--", alpha=0.7)
plt.tight_layout()
plt.show()

- Gráfico de Barras que muestra el promedio de eficiencia de tiros filtrados por la posición que ocupan los jugadores

In [None]:
# Seleccionar las columnas relevantes
columns = ["Pos", "FG%", "3P%", "FT%"]

# Calcular el promedio de eficiencia de tiros por posición
efficiency_by_pos = lakers_21_24.groupby("Pos")[["FG%", "3P%", "FT%"]].mean().reset_index()

# Graficar el promedio de eficiencia
efficiency_by_pos_melted = efficiency_by_pos.melt(id_vars=["Pos"], value_vars=["FG%", "3P%", "FT%"],
                                                  var_name="Métrica", value_name="Porcentaje")

plt.figure(figsize=(12, 6))
sns.barplot(data=efficiency_by_pos_melted, x="Pos", y="Porcentaje", hue="Métrica", palette="Oranges")

# Aumentar tamaño de las letras
plt.title("Promedio de Eficiencia de Tiros por Posición", fontsize=20)
plt.xlabel("Posición", fontsize=16)
plt.ylabel("Porcentaje (%)", fontsize=16)
plt.legend(title="Métricas de Tiro", fontsize=14, title_fontsize=16)
plt.xticks(fontsize=14)
plt.yticks(fontsize=14)

# Agregar cuadrícula y mostrar
plt.grid(axis="y", linestyle="--", alpha=0.7)
plt.tight_layout()
plt.show()

- Diágrama de dispersión que relaciona la Edad de los jugadores y los puntos realizados en las temporadas 21-24. Se puede apreciar también la posicion que ocupan dichos jugadores

In [None]:
plt.figure(figsize=(10, 6))
sns.scatterplot(data=lakers_21_24, x="Age", y="PTS", hue="Pos", palette="coolwarm", s=100)
plt.title("Relación entre Edad y Puntos Realizados")
plt.xlabel("Edad")
plt.ylabel("Puntos (PTS)")
plt.legend(title="Posición")
plt.grid(True)
plt.show()

### ====================================================================================

- Gráfico de barras horizontales que muestra la eficiencia de tiro de los 5 mejores anotadores etre las temporadas que abaran 2021-204

In [None]:
# Filtrar por las posiciones que interesan (PG, SG, SF)
posiciones_validas_of = ["PG", "SG", "SF"]

# Calcular el promedio de puntos por jugador y seleccionar el top 5
top_5_scorers = lakers_21_24.groupby("Player")["PTS"].mean().nlargest(6).index
top_5_data = lakers_21_24[lakers_21_24["Player"].isin(top_5_scorers)]

# Filtrar para incluir solo jugadores con posiciones (PG, SG, SF)
top_5_data = top_5_data[top_5_data["Pos"].isin(posiciones_validas_of)]

# Obtener la posición principal de cada jugador
player_positions = (top_5_data.groupby("Player")["Pos"]
                    .agg(lambda x: x.mode().iloc[0])
                    .reset_index())

# Crear un DataFrame con los promedios de eficiencia
efficiency_metrics = ["FG%", "3P%", "FT%"]
top_5_efficiency = top_5_data.groupby("Player")[efficiency_metrics].mean().reset_index()

# Unir la posición al dataframe
top_5_efficiency = top_5_efficiency.merge(player_positions, on="Player")

# Crear una columna combinada: Jugador (Pos)
top_5_efficiency["Jugador_Pos"] = top_5_efficiency["Player"] + " (" + top_5_efficiency["Pos"] + ")"

# Transformar los datos para graficar
top_5_efficiency_melted = top_5_efficiency.melt(id_vars=["Jugador_Pos"], 
                                                value_vars=efficiency_metrics, 
                                                var_name="Métrica", 
                                                value_name="Valor")

# Ordenar los datos de mayor a menor por la columna "Valor"
top_5_efficiency_melted = top_5_efficiency_melted.sort_values(by="Valor", ascending=False)

# Crear el gráfico de barras agrupadas horizontal
plt.figure(figsize=(22, 16))
sns.barplot(data=top_5_efficiency_melted, y="Jugador_Pos", x="Valor", hue="Métrica", palette="YlOrRd")

# Personalizar etiquetas y diseño
plt.title("Eficiencia de Tiros de los 5 Mejores Anotadores", fontsize=24)
plt.ylabel("Jugador (Pos)", fontsize=22)  
plt.xlabel("Porcentaje (%)", fontsize=22)
plt.legend(title="Métrica", fontsize=20, title_fontsize=20) 
plt.xticks(fontsize=20, rotation=45)  
plt.yticks(fontsize=20)

# Cuadrícula y diseño
plt.grid(axis="y", linestyle="--", alpha=0.7)
plt.tight_layout()
plt.show()


- Gráfico de barras horizontales que muestra la eficiencia de tiro de los 5 peores anotadores etre las temporadas que abarcan 2021-204

In [None]:
# Filtrar por las posiciones que interesan (PG, SG, SF)
posiciones_validas_of = ["PG", "SG", "SF"]

# Calcular el promedio de puntos por jugador y seleccionar el bottom 5 de los peores jugadores
bottom_5_scorers = (lakers_21_24.loc[lakers_21_24["PTS"] > 0]
                .groupby("Player")["PTS"]
                .mean()
                .nsmallest(6)
                .index)

bottom_5_data = lakers_21_24[lakers_21_24["Player"].isin(bottom_5_scorers)]

efficiency_metrics = ["FG%", "3P%", "FT%"]

# Filtrar para incluir solo jugadores con posiciones (PG, SG, SF)
bottom_5_data = bottom_5_data[bottom_5_data["Pos"].isin(posiciones_validas_of)]

# Obtener la posición de cada jugador (tomando la más frecuente en caso de que cambie)
player_positions = (bottom_5_data.groupby("Player")["Pos"]
                    .agg(lambda x: x.mode().iloc[0])
                    .reset_index())

# Calcular promedio de métricas
bottom_5_efficiency = bottom_5_data.groupby("Player")[efficiency_metrics].mean().reset_index()

# Unir posición al dataframe de eficiencia
bottom_5_efficiency = bottom_5_efficiency.merge(player_positions, on="Player")

# Crear columna combinada: "Jugador (Pos)"
bottom_5_efficiency["Jugador_Pos"] = bottom_5_efficiency["Player"] + " (" + bottom_5_efficiency["Pos"] + ")"

# Transformar para graficar
bottom_5_efficiency_melted = bottom_5_efficiency.melt(id_vars=["Jugador_Pos"], 
                                                    value_vars=efficiency_metrics, 
                                                    var_name="Métrica", 
                                                    value_name="Valor")

# Ordenar los datos de mayor a menor por la columna "Valor"
bottom_5_efficiency_melted = bottom_5_efficiency_melted.sort_values(by="Valor", ascending=False)

# Gráfico de barras agrupadas horizontal
plt.figure(figsize=(22, 16))
sns.barplot(data=bottom_5_efficiency_melted, y="Jugador_Pos", x="Valor", hue="Métrica", palette="YlGnBu")

# Diseño
plt.title("Eficiencia de tiros de los 5 Peores Anotadores", fontsize=24)  
plt.xlabel("Porcentaje (%)", fontsize=22)  
plt.ylabel("Jugador (Pos)", fontsize=22) 
plt.legend(title="Métrica", fontsize=20, title_fontsize=20, loc='lower right')
plt.xticks(fontsize=20, rotation=45)  
plt.yticks(fontsize=20)  

plt.grid(axis="y", linestyle="--", alpha=0.7)
plt.tight_layout()
plt.show()


- Matriz de correlación que muestra las relaciones entre diferentes métricas clave de desempeño para los Los Angeles Lakers.

In [None]:
# Filtrar solo las columnas deseadas
selected_columns = ["FG%", "3P%", "2P%", "eFG%", "FT%", "ORB", "DRB", "TRB", "AST", "STL", "BLK", "TOV", "PF", "PTS"]
filtered_data = lakers_21_24[selected_columns]

# Calcular la matriz de correlación
correlation_matrix = filtered_data.corr()

# Crear el heatmap
plt.figure(figsize=(14, 10))
sns.heatmap(correlation_matrix, annot=True, cmap="coolwarm", fmt=".2f", linewidths=0.5)
plt.title("Matriz de Correlación de Estadísticas Clave de los Lakers", fontsize=20)
plt.xticks(fontsize=12, rotation=45)
plt.yticks(fontsize=12)
plt.tight_layout()
plt.show()

- Diágrama de dispersión que explora la relacióes entre dos métricas que mostraron tener alta relación en la Matriz de correlación.

In [None]:
sns.scatterplot(data=lakers_21_24, x="BLK", y="PTS", hue="Pos")

plt.title('Relacion entre puntos y bloqueos por posicion')
plt.xlabel('Rebotes')
plt.ylabel('Puntos')
plt.legend(loc="lower right", bbox_to_anchor=(1, 0))

In [None]:
sns.scatterplot(data=lakers_21_24, x="TRB", y="PTS", hue="Pos")

plt.title('Relacion entre puntos y rebotes defensivos/ofensivos por posicion')
plt.xlabel('Rebotes')
plt.ylabel('Puntos')
plt.legend(loc="lower right", bbox_to_anchor=(1, 0))

- Grafico barras horizontales del top de Jugadores de LAL con mejor promedio de puntos, triples, asistencias y robos.

In [None]:
# Filtrar por las posiciones que interesan (PG, SG, SF)
posiciones_validas_of = ["PG", "SG", "SF"]

# Seleccionar el top 3 de jugadores para cada métrica
top_3_pts = (lakers_21_24.loc[lakers_21_24["PTS"] > 0]
                .groupby("Player")["PTS"]
                .mean()
                .nlargest(4)
                .index)

top_3_3p = (lakers_21_24.loc[lakers_21_24["3P"] > 0]
                .groupby("Player")["3P"]
                .mean()
                .nlargest(4)
                .index)

top_3_ast = (lakers_21_24.loc[lakers_21_24["AST"] > 0]
                .groupby("Player")["AST"]
                .mean()
                .nlargest(4)
                .index)

top_3_stl = (lakers_21_24.loc[lakers_21_24["STL"] > 0]
                .groupby("Player")["STL"]
                .mean()
                .nlargest(4)
                .index)

# Consolidar los datos del top 3 de cada métrica
top_players = set(top_3_pts).union(set(top_3_3p)).union(set(top_3_ast)).union(set(top_3_stl))
top_data = lakers_21_24[lakers_21_24["Player"].isin(top_players)]

# Filtrar para incluir solo jugadores con posiciones (PG, SG, SF)
top_data = top_data[top_data["Pos"].isin(posiciones_validas_of)]

# Obtener posición principal de cada jugador (valor más frecuente)
player_positions = (top_data.groupby("Player")["Pos"]
                    .agg(lambda x: x.mode().iloc[0])
                    .reset_index())

# Crear un DataFrame con los promedios
metrics = ["PTS", "3P", "AST", "STL"]
top_metrics = top_data.groupby("Player")[metrics].mean().reset_index()

# Unir la posición al dataframe
top_metrics = top_metrics.merge(player_positions, on="Player")

# Crear columna "Jugador (Pos)"
top_metrics["Jugador_Pos"] = top_metrics["Player"] + " (" + top_metrics["Pos"] + ")"

# Transformar los datos para graficar
top_metrics_melted = top_metrics.melt(id_vars=["Jugador_Pos"], 
                                            value_vars=metrics, 
                                            var_name="Métrica", 
                                            value_name="Valor")

# Ordenar los datos de mayor a menor por la columna "Valor"
top_metrics_melted = top_metrics_melted.sort_values(by="Valor", ascending=False)

# Crear el gráfico de barras agrupadas horizontal
plt.figure(figsize=(16, 10))
sns.barplot(data=top_metrics_melted, y="Jugador_Pos", x="Valor", hue="Métrica", palette="YlOrRd")

# Personalizar etiquetas y diseño
plt.title("Atacantes con las mejores estadisticas en Puntos, Triples, Asistencias y Robos", fontsize=20)
plt.ylabel("Jugador (Pos)", fontsize=16)
plt.xlabel("Promedio", fontsize=16)
plt.legend(title="Métrica", fontsize=12, title_fontsize=14)
plt.yticks(fontsize=14)
plt.xticks(fontsize=14)
plt.grid(axis="x", linestyle="--", alpha=0.7)
plt.tight_layout()
plt.show()

Original

In [None]:
# Seleccionar el top 3 de jugadores para cada métrica
top_3_pts = lakers_21_24.groupby("Player")["PTS"].mean().nlargest(3).index
top_3_3p = lakers_21_24.groupby("Player")["3P"].mean().nlargest(3).index
top_3_ast = lakers_21_24.groupby("Player")["AST"].mean().nlargest(3).index

# Consolidar los datos del top 3 de cada métrica
top_players = set(top_3_pts).union(set(top_3_3p)).union(set(top_3_ast))
top_data = lakers_21_24[lakers_21_24["Player"].isin(top_players)]

# Obtener posición principal de cada jugador (el valor más frecuente)
player_positions = (top_data.groupby("Player")["Pos"]
                    .agg(lambda x: x.mode().iloc[0])
                    .reset_index())

# Crear un DataFrame con los promedios
metrics = ["PTS", "3P", "AST"]
top_metrics = top_data.groupby("Player")[metrics].mean().reset_index()

# Unir la posición al dataframe
top_metrics = top_metrics.merge(player_positions, on="Player")

# Crear columna "Jugador (Pos)"
top_metrics["Jugador_Pos"] = top_metrics["Player"] + " (" + top_metrics["Pos"] + ")"

# Transformar los datos para graficar
top_metrics_melted = top_metrics.melt(id_vars=["Jugador_Pos"], 
                                    value_vars=metrics, 
                                    var_name="Métrica", 
                                    value_name="Valor")

# Crear el gráfico de barras agrupadas horizontal
plt.figure(figsize=(16, 10))
sns.barplot(data=top_metrics_melted, y="Jugador_Pos", x="Valor", hue="Métrica", palette="Blues")

# Personalizar etiquetas y diseño
plt.title("Top de Jugadores en Puntos, Triples y Asistencias", fontsize=20)
plt.ylabel("Jugador (Pos)", fontsize=16)
plt.xlabel("Promedio", fontsize=16)
plt.legend(title="Métrica", fontsize=12, title_fontsize=14)
plt.yticks(fontsize=14)
plt.xticks(fontsize=14)
plt.grid(axis="x", linestyle="--", alpha=0.7)
plt.tight_layout()
plt.show()


2da opcion (Elimino las posiciones que son defensivas y ordeno de mayor a menor)

In [None]:
# Filtrar solo jugadores con posición SF, SG y PG
filtered_data = lakers_21_24[lakers_21_24["Pos"].isin(["SF", "SG", "PG"])]

# Seleccionar el top 3 de jugadores para cada métrica
top_3_pts = filtered_data.groupby("Player")["PTS"].mean().nlargest(3).index
top_3_3p = filtered_data.groupby("Player")["3P"].mean().nlargest(3).index
top_3_ast = filtered_data.groupby("Player")["AST"].mean().nlargest(3).index

# Consolidar los datos del top 3 de cada métrica
top_players = set(top_3_pts).union(set(top_3_3p)).union(set(top_3_ast))
top_data = filtered_data[filtered_data["Player"].isin(top_players)]

# Obtener posición principal de cada jugador (el valor más frecuente)
player_positions = (top_data.groupby("Player")["Pos"]
                    .agg(lambda x: x.mode().iloc[0])
                    .reset_index())

# Crear un DataFrame con los promedios
metrics = ["PTS", "3P", "AST"]
top_metrics = top_data.groupby("Player")[metrics].mean().reset_index()

# Unir la posición al dataframe
top_metrics = top_metrics.merge(player_positions, on="Player")

# Crear columna "Jugador (Pos)"
top_metrics["Jugador_Pos"] = top_metrics["Player"] + " (" + top_metrics["Pos"] + ")"

# Calcular el promedio total de las métricas para cada jugador
top_metrics["Promedio_Total"] = top_metrics[metrics].mean(axis=1)

# Ordenar de mayor a menor según el promedio total
top_metrics_sorted = top_metrics.sort_values(by="Promedio_Total", ascending=False)

# Transformar los datos para graficar
top_metrics_melted = top_metrics_sorted.melt(id_vars=["Jugador_Pos"], 
                                            value_vars=metrics, 
                                            var_name="Métrica", 
                                            value_name="Valor")

# Crear el gráfico de barras agrupadas horizontal
plt.figure(figsize=(16, 10))
sns.barplot(data=top_metrics_melted, y="Jugador_Pos", x="Valor", hue="Métrica", palette="Blues")

# Personalizar etiquetas y diseño
plt.title("Top de Jugadores en Puntos, Triples y Asistencias", fontsize=20)
plt.ylabel("Jugador (Pos)", fontsize=16)
plt.xlabel("Promedio", fontsize=16)
plt.legend(title="Métrica", fontsize=12, title_fontsize=14)
plt.yticks(fontsize=14)
plt.xticks(fontsize=14)
plt.grid(axis="x", linestyle="--", alpha=0.7)
plt.tight_layout()
plt.show()



- Grafico de Barras horizontales de Top de Jugadores con los peores promedios en puntos, triples y asistencias. 

In [None]:
lakers_21_24

In [None]:
# Filtrar por las posiciones que interesan (PG, SG, SF)
posiciones_validas_of = ["PG", "SG", "SF"]

# Seleccionar el bottom 3 de jugadores para cada métrica
bottom_3_pts = (lakers_21_24.loc[lakers_21_24["PTS"] > 0]
                .groupby("Player")["PTS"]
                .mean()
                .nsmallest(3)
                .index)

bottom_3_3p = (lakers_21_24.loc[lakers_21_24["3P"] > 0]
                .groupby("Player")["3P"]
                .mean()
                .nsmallest(3)
                .index)

bottom_3_ast = (lakers_21_24.loc[lakers_21_24["AST"] > 0]
                .groupby("Player")["AST"]
                .mean()
                .nsmallest(3)
                .index)

bottom_3_stl = (lakers_21_24.loc[lakers_21_24["STL"] > 0]
                .groupby("Player")["STL"]
                .mean()
                .nsmallest(3)
                .index)

# Consolidar los datos del bottom 3 de cada métrica
bottom_players = set(bottom_3_pts).union(set(bottom_3_3p)).union(set(bottom_3_ast)).union(set(bottom_3_stl))
bottom_data = lakers_21_24[lakers_21_24["Player"].isin(bottom_players)]

# Filtrar para incluir solo jugadores con posiciones (PG, SG, SF)
bottom_data = bottom_data[bottom_data["Pos"].isin(posiciones_validas_of)]

# Obtener posición principal de cada jugador (valor más frecuente)
player_positions = (bottom_data.groupby("Player")["Pos"]
                    .agg(lambda x: x.mode().iloc[0])
                    .reset_index())

# Crear un DataFrame con los promedios
metrics = ["PTS", "3P", "AST", "STL"]
bottom_metrics = bottom_data.groupby("Player")[metrics].mean().reset_index()

# Unir la posición al dataframe
bottom_metrics = bottom_metrics.merge(player_positions, on="Player")

# Crear columna "Jugador (Pos)"
bottom_metrics["Jugador_Pos"] = bottom_metrics["Player"] + " (" + bottom_metrics["Pos"] + ")"

# Transformar los datos para graficar
bottom_metrics_melted = bottom_metrics.melt(id_vars=["Jugador_Pos"], 
                                            value_vars=metrics, 
                                            var_name="Métrica", 
                                            value_name="Valor")

# Ordenar los datos de mayor a menor por la columna "Valor"
bottom_metrics_melted = bottom_metrics_melted.sort_values(by="Valor", ascending=False)

# Crear el gráfico de barras agrupadas horizontal
plt.figure(figsize=(16, 10))
sns.barplot(data=bottom_metrics_melted, y="Jugador_Pos", x="Valor", hue="Métrica", palette="YlOrRd")

# Personalizar etiquetas y diseño
plt.title("Atacantes con peores estadisticas en Puntos, Triples, Asistencias y Robos", fontsize=20)
plt.ylabel("Jugador (Pos)", fontsize=16)
plt.xlabel("Promedio", fontsize=16)
plt.legend(title="Métrica", fontsize=12, title_fontsize=14)
plt.yticks(fontsize=14)
plt.xticks(fontsize=14)
plt.grid(axis="x", linestyle="--", alpha=0.7)
plt.tight_layout()
plt.show()


- Grafico de barras horizontales de Jugadores con peor desempeño en metricas defensivas.

In [None]:
# Filtrar por las posiciones que interesan (C, SF, PF)
posiciones_validas = ["C", "SF", "PF"]

# Seleccionar el top 3 de jugadores para cada métrica
top_3_drb = lakers_21_24.groupby("Player")["DRB"].mean().nsmallest(5).index
top_3_blk = lakers_21_24.groupby("Player")["BLK"].mean().nsmallest(5).index
top_3_stl = lakers_21_24.groupby("Player")["PTS"].mean().nsmallest(5).index

# Consolidar los datos del top 3 de cada métrica
top_players = set(top_3_drb).union(set(top_3_blk)).union(set(top_3_stl))
top_data = lakers_21_24[lakers_21_24["Player"].isin(top_players)]

# Filtrar para incluir solo jugadores con posiciones C, SF, PF
top_data = top_data[top_data["Pos"].isin(posiciones_validas)]

# Obtener la posición principal de cada jugador
player_positions = (top_data.groupby("Player")["Pos"]
                    .agg(lambda x: x.mode().iloc[0])
                    .reset_index())

# Crear un DataFrame con los promedios
metrics = ["DRB", "BLK", "PTS"]
top_metrics = top_data.groupby("Player")[metrics].mean().reset_index()

# Unir la posición al dataframe
top_metrics = top_metrics.merge(player_positions, on="Player")

# Crear una columna combinada: Jugador (Pos)
top_metrics["Jugador_Pos"] = top_metrics["Player"] + " (" + top_metrics["Pos"] + ")"

# Transformar los datos para graficar
top_metrics_melted = top_metrics.melt(id_vars=["Jugador_Pos"], 
                                    value_vars=metrics, 
                                    var_name="Métrica", 
                                    value_name="Valor")

# Ordenar los datos de mayor a menor por la columna "Valor"
top_metrics_melted = top_metrics_melted.sort_values(by="Valor", ascending=False)

# Crear el gráfico de barras agrupadas horizontal
plt.figure(figsize=(16, 10))
sns.barplot(data=top_metrics_melted, y="Jugador_Pos", x="Valor", hue="Métrica", palette="Blues")

# Personalizar etiquetas y diseño
plt.title("Defensores con peores estadísticas en Puntos, Bloqueos y Robos", fontsize=22)
plt.ylabel("Jugador (Pos)", fontsize=18)
plt.xlabel("Promedio", fontsize=20)
plt.legend(title="Métrica", fontsize=18, title_fontsize=20)
plt.yticks(fontsize=14)
plt.xticks(fontsize=14)
plt.grid(axis="x", linestyle="--", alpha=0.7)
plt.tight_layout()
plt.show()

- Gráfico de barras horizontales de los Jugadores con mejor promedio en metricas defensivas.

In [None]:
# Filtrar por las posiciones que interesan (C, SF, PF)
posiciones_validas = ["C", "SF", "PF"]

# Seleccionar el top 3 de jugadores para cada métrica
top_3_drb = lakers_21_24.groupby("Player")["DRB"].mean().nlargest(5).index
top_3_blk = lakers_21_24.groupby("Player")["BLK"].mean().nlargest(5).index
top_3_stl = lakers_21_24.groupby("Player")["PTS"].mean().nlargest(5).index

# Consolidar los datos del top 3 de cada métrica
top_players = set(top_3_drb).union(set(top_3_blk)).union(set(top_3_stl))
top_data = lakers_21_24[lakers_21_24["Player"].isin(top_players)]

# Filtrar para incluir solo jugadores con posiciones C, SF, PF
top_data = top_data[top_data["Pos"].isin(posiciones_validas)]

# Obtener la posición principal de cada jugador
player_positions = (top_data.groupby("Player")["Pos"]
                    .agg(lambda x: x.mode().iloc[0])
                    .reset_index())

# Crear un DataFrame con los promedios
metrics = ["DRB", "BLK", "PTS"]
top_metrics = top_data.groupby("Player")[metrics].mean().reset_index()

# Unir la posición al dataframe
top_metrics = top_metrics.merge(player_positions, on="Player")

# Crear una columna combinada: Jugador (Pos)
top_metrics["Jugador_Pos"] = top_metrics["Player"] + " (" + top_metrics["Pos"] + ")"

# Transformar los datos para graficar
top_metrics_melted = top_metrics.melt(id_vars=["Jugador_Pos"], 
                                    value_vars=metrics, 
                                    var_name="Métrica", 
                                    value_name="Valor")

# Ordenar los datos de mayor a menor por la columna "Valor"
top_metrics_melted = top_metrics_melted.sort_values(by="Valor", ascending=False)

# Crear el gráfico de barras agrupadas horizontal
plt.figure(figsize=(16, 10))
sns.barplot(data=top_metrics_melted, y="Jugador_Pos", x="Valor", hue="Métrica", palette="Blues")

# Personalizar etiquetas y diseño
plt.title("Defensores con mejores estadísticas en Puntos, Bloqueos y Robos", fontsize=22)
plt.ylabel("Jugador (Pos)", fontsize=18)
plt.xlabel("Promedio", fontsize=20)
plt.legend(title="Métrica", fontsize=18, title_fontsize=20)
plt.yticks(fontsize=14)
plt.xticks(fontsize=14)
plt.grid(axis="x", linestyle="--", alpha=0.7)
plt.tight_layout()
plt.show()


In [None]:
# Filtrar por las posiciones que interesan (C, SF, PF)
posiciones_validas = ["C", "SF", "PF"]

# Seleccionar el top 3 de jugadores para cada métrica
top_3_drb = lakers_21_24.groupby("Player")["DRB"].mean().nlargest(5).index
top_3_blk = lakers_21_24.groupby("Player")["BLK"].mean().nlargest(5).index
top_3_stl = lakers_21_24.groupby("Player")["PTS"].mean().nlargest(5).index

# Consolidar los datos del top 3 de cada métrica
top_players = set(top_3_drb).union(set(top_3_blk)).union(set(top_3_stl))
top_data = lakers_21_24[lakers_21_24["Player"].isin(top_players)]

# Filtrar para incluir solo jugadores con posiciones C, SF, PF
top_data = top_data[top_data["Pos"].isin(posiciones_validas)]

# Obtener la posición principal de cada jugador
player_positions = (top_data.groupby("Player")["Pos"]
                    .agg(lambda x: x.mode().iloc[0])
                    .reset_index())

# Crear un DataFrame con los promedios
metrics = ["DRB", "BLK", "PTS"]
top_metrics = top_data.groupby("Player")[metrics].mean().reset_index()

# Unir la posición al dataframe
top_metrics = top_metrics.merge(player_positions, on="Player")

# Crear una columna combinada: Jugador (Pos)
top_metrics["Jugador_Pos"] = top_metrics["Player"] + " (" + top_metrics["Pos"] + ")"

# Transformar los datos para graficar
top_metrics_melted = top_metrics.melt(id_vars=["Jugador_Pos"], 
                                    value_vars=metrics, 
                                    var_name="Métrica", 
                                    value_name="Valor")

# Crear el gráfico de barras agrupadas horizontal
plt.figure(figsize=(16, 10))
sns.barplot(data=top_metrics_melted, y="Jugador_Pos", x="Valor", hue="Métrica", palette="Blues")

# Personalizar etiquetas y diseño
plt.title("Defensores con mejores estadísticas en Puntos, Bloqueos y Robos", fontsize=22)
plt.ylabel("Jugador (Pos)", fontsize=18)
plt.xlabel("Promedio", fontsize=20)
plt.legend(title="Métrica", fontsize=18, title_fontsize=20)
plt.yticks(fontsize=14)
plt.xticks(fontsize=14)
plt.grid(axis="x", linestyle="--", alpha=0.7)
plt.tight_layout()
plt.show()


### Evolucion por temporada Lakers (DEFENSIVO)

In [None]:
lakers_21_24

## Grafico 1

In [None]:

# Verificar que 'Pos' es válida y filtrar solo C, SF y PF
posiciones_validas = lakers_21_24.groupby('Player')['Pos'].unique()
valid_players = [player for player, pos in posiciones_validas.items() if set(pos).intersection({'C', 'SF', 'PF'})]
df_filtered = lakers_21_24[lakers_21_24['Player'].isin(valid_players)]

# Crear una columna donde se combinen todas las posiciones en las que jugó cada jugador
df_filtered['Pos_Merged'] = df_filtered.groupby('Player')['Pos'].transform(lambda x: ', '.join(sorted(set(x))))

# Obtener los 3 mejores jugadores por posición en base a la suma total de DRB, BLK y STL
top_players_def = []
for pos in ['C', 'SF', 'PF']:
    top_pos = (
        df_filtered[df_filtered['Pos'].str.contains(pos, regex=False)]  # Filtrar jugadores que jugaron en la posición actual
        .groupby('Player')[['DRB', 'BLK', 'STL']].mean()
        .sum(axis=1)  # Sumar todas las estadísticas defensivas
        .nlargest(3)
        .index
    )
    top_players_def.extend(top_pos)

# Filtrar los datos solo para los jugadores seleccionados
df_best = df_filtered[df_filtered['Player'].isin(top_players_def)].copy()

# Asignar la columna de posiciones combinadas
df_best['Player_Pos'] = df_best['Player'] + " (" + df_best['Pos_Merged'] + ")"

# Reorganizar los datos para la visualización
df_melted = df_best.melt(id_vars=['season_year', 'Player_Pos'], value_vars=['DRB', 'BLK', 'STL'],
                        var_name='Estadística', value_name='Valor')

# Graficar
plt.figure(figsize=(14, 12))
sns.set_palette("husl")
sns.lineplot(data=df_melted, x="season_year", y="Valor", hue="Player_Pos", style="Estadística", 
            markers=True, dashes=False, linewidth=2.5, markersize=8)

plt.title("Evolución de estadísticas de los mejores jugadores defensivos (C, SF y PF)")
plt.xlabel("Temporada")
plt.ylabel("Valor de Estadísticas")
plt.legend(loc='center left', bbox_to_anchor=(1, 0.5), title="Jugador (Posición)")
plt.grid(True, linestyle='--', alpha=0.6)
plt.xticks(rotation=45)
plt.ylim(0, 12)
plt.show()


## Grafico 2

In [None]:
# Verificar que 'Pos' es válida y filtrar solo C, SF y PF
posiciones_validas = lakers_21_24.groupby('Player')['Pos'].unique()
valid_players = [player for player, pos in posiciones_validas.items() if set(pos).intersection({'C', 'SF', 'PF'})]
df_filtered = lakers_21_24[lakers_21_24['Player'].isin(valid_players)]

# Crear una columna donde se combinen todas las posiciones en las que jugó cada jugador
df_filtered['Pos_Merged'] = df_filtered.groupby('Player')['Pos'].transform(lambda x: ', '.join(sorted(set(x))))

# Obtener los 3 mejores jugadores por posición en base a la suma total de DRB, BLK y STL
top_players_def = []
for pos in ['C', 'SF', 'PF']:
    top_pos = (
        df_filtered[df_filtered['Pos'].str.contains(pos, regex=False)]  # Filtrar jugadores que jugaron en la posición actual
        .groupby('Player')[['DRB', 'BLK', 'STL']].mean()
        .sum(axis=1)  # Sumar todas las estadísticas defensivas
        .nlargest(3)
        .index
    )
    top_players_def.extend(top_pos)

# Filtrar los datos solo para los jugadores seleccionados
df_best = df_filtered[df_filtered['Player'].isin(top_players_def)].copy()

# Asignar la columna de posiciones combinadas
df_best['Player_Pos'] = df_best['Player'] + " (" + df_best['Pos_Merged'] + ")"

# Reorganizar los datos para la visualización
df_melted = df_best.melt(id_vars=['season_year', 'Player_Pos'], value_vars=['DRB', 'BLK', 'STL'],
                        var_name='Estadística', value_name='Valor')

# Graficar
plt.figure(figsize=(14, 8))

# Barplot para las barras con diferentes colores por posición/jugador
sns.set_palette("Set2")  # Usar una paleta de colores con más variedad
sns.barplot(data=df_melted, x="season_year", y="Valor", hue="Player_Pos", ci=None)

# Agregar la línea para recorrer las barras
mean_values = df_melted.groupby('season_year')['Valor'].mean()

# Trazar la línea en el gráfico de barras
plt.plot(mean_values.index, mean_values.values, color='red', marker='o', linestyle='-', linewidth=2.5, markersize=8, label='Promedio')

# Ajustar la visualización
plt.title("Evolución de estadísticas de los mejores jugadores defensivos (C, SF y PF)")
plt.xlabel("Temporada")
plt.ylabel("Valor de Estadísticas")
plt.legend(loc='center left', bbox_to_anchor=(1, 0.5), title="Jugador (Posición)")
plt.grid(True, linestyle='--', alpha=0.6)
plt.xticks(rotation=45)
plt.ylim(0, 6)
plt.show()


Evolución de estadísticas de los peores jugadores defensivos (C, SF y PF)

In [None]:
# Verificar que 'Pos' es válida y filtrar solo C, SF y PF
posiciones_validas = lakers_21_24.groupby('Player')['Pos'].unique()
valid_players = [player for player, pos in posiciones_validas.items() if set(pos).intersection({'C', 'SF', 'PF'})]
df_filtered = lakers_21_24[lakers_21_24['Player'].isin(valid_players)]

# Crear una columna donde se combinen todas las posiciones en las que jugó cada jugador
df_filtered['Pos_Merged'] = df_filtered.groupby('Player')['Pos'].transform(lambda x: ', '.join(sorted(set(x))))

# Obtener los 3 mejores jugadores por posición en base a la suma total de DRB, BLK y STL
top_players_def = []
for pos in ['C', 'SF', 'PF']:
    top_pos = (
        df_filtered[df_filtered['Pos'].str.contains(pos, regex=False)]  # Filtrar jugadores que jugaron en la posición actual
        .groupby('Player')[['DRB', 'BLK', 'STL']].mean()
        .sum(axis=1)  # Sumar todas las estadísticas defensivas
        .nsmallest(3)
        .index
    )
    top_players_def.extend(top_pos)

# Filtrar los datos solo para los jugadores seleccionados
df_best = df_filtered[df_filtered['Player'].isin(top_players_def)].copy()

# Asignar la columna de posiciones combinadas
df_best['Player_Pos'] = df_best['Player'] + " (" + df_best['Pos_Merged'] + ")"

# Reorganizar los datos para la visualización
df_melted = df_best.melt(id_vars=['season_year', 'Player_Pos'], value_vars=['DRB', 'BLK', 'STL'],
                        var_name='Estadística', value_name='Valor')

# Graficar
plt.figure(figsize=(14, 8))

# Barplot para las barras con diferentes colores por posición/jugador
sns.set_palette("Set2")  # Usar una paleta de colores con más variedad
sns.barplot(data=df_melted, x="season_year", y="Valor", hue="Player_Pos", ci=None)

# Agregar la línea para recorrer las barras
mean_values = df_melted.groupby('season_year')['Valor'].mean()

# Trazar la línea en el gráfico de barras
plt.plot(mean_values.index, mean_values.values, color='red', marker='o', linestyle='-', linewidth=2.5, markersize=8, label='Promedio')

# Ajustar la visualización
plt.title("Evolución de estadísticas de los peores jugadores defensivos (C, SF y PF)")
plt.xlabel("Temporada")
plt.ylabel("Valor de Estadísticas")
plt.legend(loc='center left', bbox_to_anchor=(1, 0.5), title="Jugador (Posición)")
plt.grid(True, linestyle='--', alpha=0.6)
plt.xticks(rotation=45)
plt.ylim(0, 2)
plt.show()

### Evolucion por temporada Lakers (OFENSIVO)

In [None]:
lakers_21_24

In [None]:
# Verificar que 'Pos' es válida y filtrar solo C, SF y PF
posiciones_validas = lakers_21_24.groupby('Player')['Pos'].unique()
valid_players = [player for player, pos in posiciones_validas.items() if set(pos).intersection({'PG', 'SG', 'PF'})]
df_filtered = lakers_21_24[lakers_21_24['Player'].isin(valid_players)]

# Crear una columna donde se combinen todas las posiciones en las que jugó cada jugador
df_filtered['Pos_Merged'] = df_filtered.groupby('Player')['Pos'].transform(lambda x: ', '.join(sorted(set(x))))

# Obtener los 3 mejores jugadores por posición en base a la suma total de DRB, BLK y STL
top_players_of = []
for pos in ['PG', 'SG', 'PF']:
    top_pos = (
        df_filtered[df_filtered['Pos'].str.contains(pos, regex=False)]  # Filtrar jugadores que jugaron en la posición actual
        .groupby('Player')[['FG%', '3P%', 'FT%', 'eFG%']].mean()
        .sum(axis=1)  # Sumar todas las estadísticas defensivas
        .nlargest(3)
        .index
    )
    top_players_of.extend(top_pos)

# Filtrar los datos solo para los jugadores seleccionados
df_best = df_filtered[df_filtered['Player'].isin(top_players_of)].copy()

# Asignar la columna de posiciones combinadas
df_best['Player_Pos'] = df_best['Player'] + " (" + df_best['Pos_Merged'] + ")"

# Reorganizar los datos para la visualización
df_melted = df_best.melt(id_vars=['season_year', 'Player_Pos'], value_vars=['FG%', '3P%', 'FT%', 'eFG%'],
                        var_name='Estadística', value_name='Valor')

# Graficar
plt.figure(figsize=(14, 12))
sns.set_palette("husl")
sns.lineplot(data=df_melted, x="season_year", y="Valor", hue="Player_Pos", style="Estadística", 
            markers=True, dashes=False, linewidth=2.5, markersize=8)

plt.title("Evolución de estadísticas de los mejores jugadores ofensivos (PF, SG, PG)")
plt.xlabel("Temporada")
plt.ylabel("Valor de Estadísticas")
plt.legend(loc='center left', bbox_to_anchor=(1, 0.5), title="Jugador (Posición)")
plt.grid(True, linestyle='--', alpha=0.6)
plt.xticks(rotation=45)
plt.ylim(0, 1.2)
plt.show()


In [None]:
# Verificar que 'Pos' es válida y filtrar solo C, SF y PF
posiciones_validas = lakers_21_24.groupby('Player')['Pos'].unique()
valid_players = [player for player, pos in posiciones_validas.items() if set(pos).intersection({'PG', 'SG', 'PF'})]
df_filtered = lakers_21_24[lakers_21_24['Player'].isin(valid_players)]

# Crear una columna donde se combinen todas las posiciones en las que jugó cada jugador
df_filtered['Pos_Merged'] = df_filtered.groupby('Player')['Pos'].transform(lambda x: ', '.join(sorted(set(x))))

# Obtener los 3 mejores jugadores por posición en base a la suma total de DRB, BLK y STL
top_players_of = []
for pos in ['PG', 'SG', 'PF']:
    top_pos = (
        df_filtered[df_filtered['Pos'].str.contains(pos, regex=False)]  # Filtrar jugadores que jugaron en la posición actual
        .groupby('Player')[['FG%', '3P%', 'FT%', 'eFG%']].mean()
        .sum(axis=1)  # Sumar todas las estadísticas defensivas
        .nlargest(3)
        .index
    )
    top_players_of.extend(top_pos)

# Filtrar los datos solo para los jugadores seleccionados
df_best = df_filtered[df_filtered['Player'].isin(top_players_of)].copy()

# Asignar la columna de posiciones combinadas
df_best['Player_Pos'] = df_best['Player'] + " (" + df_best['Pos_Merged'] + ")"

# Reorganizar los datos para la visualización
df_melted = df_best.melt(id_vars=['season_year', 'Player_Pos'], value_vars=['FG%', '3P%', 'FT%', 'eFG%'],
                        var_name='Estadística', value_name='Valor')

mean_values = df_melted.groupby('season_year')['Valor'].mean()

# Graficar
plt.figure(figsize=(14, 8))
sns.set_palette("husl")
sns.barplot(data=df_melted, x="season_year", y="Valor", hue="Player_Pos")

plt.plot(mean_values.index, mean_values.values, color='red', marker='o', linestyle='-', linewidth=2, markersize=6, label='Promedio')
plt.title("Comparación de estadísticas ofensivas de los mejores jugadores (PG, SG, PF)")
plt.xlabel("Temporada")
plt.ylabel("Valor de Estadísticas")
plt.legend(loc='upper left', bbox_to_anchor=(1, 1), title="Jugador (Posición)")
plt.xticks(rotation=45)
plt.ylim(0, 1.2)
plt.grid(axis='y', linestyle='--', alpha=0.6)
plt.show()

