# Análise de dados ofensivos NBA 2023-24

## Objetivo do projeto
1. Testar meus conhecimentos em análise de dados utilizando python, sendo o meu primeiro projeto
2. Esse pequeno projeto tem como analisar estatísticas ofensivas e retirar alguns insights para entender melhor o posicionamento que está acontecendo atualmente nos playoffs da NBA

In [None]:
#Importando as bibliotecas necessárias

import pandas as pd
pd.plotting.register_matplotlib_converters()
import matplotlib.pyplot as plt
%matplotlib inline
import seaborn as sns
print("Setup Complete")

# Importando o dataset e realizando a limpeza de dados

In [None]:
#Importando o dataset
nba_df = pd.read_csv('/kaggle/input/nba-boxscore-season-2023-2024/NBA-BoxScores-2023-2024.csv', index_col = 0)

#Observando o dataset e as colunas mais interessantes a ser analisadas
display(nba_df.head())

In [None]:
#Quais campos são nulos e quantos campos estão nulos?
print(nba_df.isnull().sum())

### Percebendo que os valores nulos nos fundamentos do jogo seria por conta de jogadores que não jogaram


In [None]:
#Pegando o nome das colunas do dataset
print(nba_df.columns)

In [None]:
#Removendo as colunas com valores nulos que não fazem parte dos fundamentos
nba_df.drop(['START_POSITION', 'COMMENT'], axis = 1, inplace = True)
nba_df.head()

In [None]:
#Removendo as linhas com valores nulos
nba_df.dropna(axis = 0, inplace = True)
nba_df.isnull().sum()

# Análise das estatísticas ofensivas
### Separando os Top 10 de pontuadores, assistências e reboteiros

In [None]:
#Top 10 pontuadores
top10_pontuadores = nba_df.groupby(['TEAM_ABBREVIATION', 'PLAYER_NAME']).PTS.sum().sort_values(ascending = False).nlargest(10)
top10_pontuadores = pd.DataFrame(top10_pontuadores).reset_index().set_index('TEAM_ABBREVIATION')
display(top10_pontuadores)

#Plotando o gráfico
plt.figure(figsize = (14,6))
plt.title('Top 10 pontuadores da temporada regular')
sns.barplot(x = top10_pontuadores['PTS'], y = top10_pontuadores['PLAYER_NAME'])

In [None]:
#Top 10 pontuadores
top10_assist = nba_df.groupby(['TEAM_ABBREVIATION', 'PLAYER_NAME']).AST.sum().sort_values(ascending = False).nlargest(10)
top10_assist = pd.DataFrame(top10_assist).reset_index().set_index('TEAM_ABBREVIATION')
display(top10_assist)

#Plotando o gráfico
plt.figure(figsize = (14,6))
plt.title('Top 10 passadores da temporada regular')
sns.barplot(x = top10_assist['AST'], y = top10_assist['PLAYER_NAME'])

In [None]:
#Top 10 reboteiros
top10_reboteiro = nba_df.groupby(['TEAM_ABBREVIATION', 'PLAYER_NAME']).REB.sum().sort_values(ascending = False).nlargest(10)
top10_reboteiro = pd.DataFrame(top10_reboteiro).reset_index().set_index('TEAM_ABBREVIATION')
display(top10_reboteiro)

#Plotando o gráfico
plt.figure(figsize = (14,6))
plt.title('Top 10 reboteiro da temporada regular')
sns.barplot(x = top10_reboteiro['REB'], y = top10_reboteiro['PLAYER_NAME'])

### Top 5 das equipes em estatísticas ofensivas

In [None]:
#Separando o top 5 das equipes com melhores desempenhos em pontos assistências e rebotes
offensive_stats_team = nba_df.groupby(['TEAM_ABBREVIATION']).agg({'PTS' : 'sum', 'OREB' : 'sum', 'AST' : 'sum'})

teams = nba_df['TEAM_ABBREVIATION'].unique()

#Pegar as estatísticas ofensivas de cada time
all_teams_offensive = [offensive_stats_team.loc[team] for team in teams]
all_teams_offensive = pd.DataFrame(all_teams_offensive)
display(all_teams_offensive)

In [None]:
#Mostrando o top 5 de pontos, rebotes e assistências
plt.figure(figsize = (14,6))

top5_pontos = all_teams_offensive['PTS'].sort_values(ascending = False).nlargest(5)
plt.subplot(1,3,1)
sns.barplot(x = top5_pontos.index, y = top5_pontos.values)

top5_rebotes = all_teams_offensive['OREB'].sort_values(ascending = False).nlargest(5)
plt.subplot(1,3,2)
sns.barplot(x = top5_rebotes.index, y = top5_rebotes.values)

top5_assist = all_teams_offensive['AST'].sort_values(ascending = False).nlargest(5)
plt.subplot(1,3,3)
sns.barplot(x = top5_assist.index, y = top5_assist.values)

# Análise das estatísticas defensivas
### Top 10 de tocos, roubos de bola e rebotes defensivos

In [None]:
#Top 10 tocos
top10_tocos = nba_df.groupby(['TEAM_ABBREVIATION','PLAYER_NAME'])['BLK'].sum().sort_values(ascending = False).nlargest(10)
top10_tocos = top10_tocos.reset_index().set_index('TEAM_ABBREVIATION')
display(top10_tocos)

plt.figure(figsize = (14,6))
sns.barplot(x = top10_tocos['BLK'], y = top10_tocos['PLAYER_NAME'])

In [None]:
#Top 10 roubos de bola
top10_roubos = nba_df.groupby(['TEAM_ABBREVIATION', 'PLAYER_NAME'])['STL'].sum().sort_values(ascending = False).nlargest(10)
top10_roubos = pd.DataFrame(top10_roubos).reset_index().set_index('TEAM_ABBREVIATION')
display(top10_roubos)


plt.figure(figsize = (14,6))
sns.barplot(x = top10_roubos['STL'], y = top10_roubos['PLAYER_NAME'])

In [None]:
#Top 10 rebotes defensivos
top10_dReb = nba_df.groupby(['TEAM_ABBREVIATION', 'PLAYER_NAME'])['DREB'].sum().sort_values(ascending = False).nlargest(10)
top10_dReb = pd.DataFrame(top10_dReb).reset_index().set_index('TEAM_ABBREVIATION')
display(top10_dReb)


plt.figure(figsize = (14,6))
sns.barplot(x = top10_dReb['DREB'], y = top10_dReb['PLAYER_NAME'])

In [None]:
#Criando um Dataframe das equipes com estatísticas de defesa
defensive_stats_teams = nba_df.groupby(['TEAM_ABBREVIATION']).agg({'BLK' : 'sum', 'STL' : 'sum', 'DREB' : 'sum'})

all_teams_defensive = [defensive_stats_teams.loc[team] for team in teams]
all_teams_defensive = pd.DataFrame(all_teams_defensive)
display(all_teams_defensive)
'''for def_stats in defensive_stats:
    print('Top 5 {}\n'.format(def_stats), all_teams_defensive[def_stats].sort_values(ascending = False).nlargest(5), '\n')'''

In [None]:
#Definindo o tamanho da figura
plt.figure(figsize = (14,6))

#Top 5 times em tocos
top5_tocos = all_teams_defensive['BLK'].sort_values(ascending = False).nlargest(5)
plt.subplot(1,3,1)
plt.title('Top 5 tocos')
sns.barplot(x = top5_tocos.index, y = top5_tocos.values)

#Top 5 times em roubos de bola
top5_roubos = all_teams_defensive['STL'].sort_values(ascending = False).nlargest(5)
plt.subplot(1,3,2)
plt.title('Top 5 Roubos de bola')
sns.barplot(x = top5_roubos.index, y = top5_roubos.values)

#Top 5 times em rebotes defensivos
top5_dReb = all_teams_defensive['DREB'].sort_values(ascending = False).nlargest(5)
plt.subplot(1,3,3)
plt.title('Top 5 rebotes defensivos')
sns.barplot(x = top5_dReb.index, y = top5_dReb.values)

# Insights e conclusões
1. Pacers foi o time mais agressivo da temporada, sendo o top 1 em pontos e assistências. Porém, apenas um atleta está no top 10 (Tyrese Haliburton), ou seja, o time foi bem equilibrado e possui uma distribuição entres os atletas.
2. Celtics veio para a pós-temporada com um time bem forte, já que está no Top 5 em pontos, rebotes defensivos e tocos.
3. Timberwolves com um time bem focado em defesa, marcando presença no Top 5 de tocos e rebotes defensivos.
4. Thunder com o time mais jovem da NBA e possuindo uma das melhores estratégias já que possui boas posições em estatísticas ofensivas e defensivas.
5. Suns foi um time que investiram muito pesado na pré-temporada, porém não teve um bom aproveitamento durante a temporado e muito menos nos playoffs.