# 🏀 Análise Exploratória — NBA 2024

Este desafio tem como objetivo praticar **análise exploratória de dados (EDA)** utilizando o dataset `nba2024.csv`, que contém estatísticas de partidas da NBA 2024.  
Cada linha representa o desempenho de um jogador em um jogo.

---

## 📊 Informações do Dataset

- **Linhas:** 16.512  
- **Colunas:** 25  
- **Principais campos:** `Player`, `Tm`, `Opp`, `Res`, `MP`, `PTS`, `TRB`, `AST`, `FG%`, `3P%`, `FT%`, `GmSc`, `Data`

---

## 🔹 Parte 1 — Entendimento do Dataset

1. Liste todas as colunas e seus tipos de dados.  
2. Há valores ausentes? Se sim, quais colunas são mais afetadas?  
3. Quantos jogos únicos existem no dataset?  
   *Dica:* cada combinação de `Tm`, `Opp` e `Data` representa uma partida.

---

## 🔹 Parte 2 — Estatísticas Gerais

4. Qual é a média e o desvio padrão de pontos (`PTS`) por jogador?  
5. Quem são os **5 jogadores** com maior média de pontos por jogo?  
6. Quais times têm a **maior média de pontos por jogador**?  
7. Qual é a correlação entre `FG%`, `3P%`, `FT%` e `PTS`?  
8. Qual a média de minutos jogados (`MP`) por partida e seu valor máximo e mínimo?

---

## 🔹 Parte 3 — Desempenho Individual

9. Qual jogador teve o **maior GmSc** em uma única partida?  
10. Para esse jogador, em quantas partidas ele ultrapassou **30 pontos**?  
11. Quem são os jogadores mais consistentes — isto é, com **menor desvio padrão em PTS** (mínimo de 10 jogos)?

---

## 🔹 Parte 4 — Comparações por Times

12. Qual time mais venceu partidas?  
    *(Dica: use `Res == "W"` e agrupe por `Tm`)*  
13. Qual time tem a maior média de rebotes (`TRB`) e assistências (`AST`) por jogo?  
14. Quais times cometem mais turnovers (`TOV`) em média?

---

## 🔹 Parte 5 — Análise Temporal

15. Quantos jogos ocorreram por mês?  
16. Existe variação significativa na média de pontos ao longo do tempo?  
17. Quais jogadores participaram de mais jogos em sequência (sem faltar)?

---

## 🔹 Parte 6 — Desafios Avançados

18. Crie um ranking de eficiência por jogador com base em uma métrica combinada, por exemplo:

   ```
   Eficiência = (PTS + TRB + AST + STL + BLK - TOV) / MP
   ```

19. Encontre os **top 10 mais eficientes** de acordo com essa métrica.  
20. Compare a eficiência média entre jogadores vencedores (`Res == 'W'`) e perdedores (`Res == 'L'`).


## 🔹 Parte 7 — Métricas Avançadas e Análises Estilo NBA

### 📈 Eficiência Ofensiva

21. **True Shooting Percentage (TS%)** — calcular por jogador para cada partida:
TS% = PTS / (2 * (FGA + 0.44 * FTA))
- Quem são os **10 jogadores mais eficientes** em arremessos (por TS% médio)?
- Existe correlação entre `TS%` e `PTS`?

---

22. **Effective Field Goal Percentage (eFG%)**:
eFG% = (FG + 0.5 * 3P) / FGA
- Qual time possui a melhor eFG% média?
- Jogadores com alta eFG% também têm altos `GmSc`?

---

23. **Assist-to-Turnover Ratio (AST/TOV)** — por jogador:
AST/TOV = AST / TOV
- Quem são os principais *playmakers* (maior AST/TOV — considerar somente jogadores com mínimo de N jogos)?
- Há times que se destacam por baixo índice de turnovers?

---

### 💪 Controle de Jogo e Volume de Uso

24. **Usage Rate (USG%) — versão simplificada por jogador em cada jogo**:
Primeiro calcule as tentativas do time no jogo:
team_attempts = team_FGA + 0.44 * team_FTA + team_TOV

Depois, para cada jogador:
USG% = 100 * (FGA + 0.44 * FTA + TOV) / team_attempts

- Quais jogadores mais “dominam a bola” (USG% mais alto)?
- Existe relação entre USG% e eficiência (TS%)?

---

25. **Impacto em vitórias**:
- Compare as médias de `PTS`, `AST`, `TRB`, `GmSc` e `TS%` entre jogos vencidos (`Res == 'W'`) e perdidos (`Res == 'L'`) para cada jogador.
- Quais jogadores têm desempenho significativamente melhor em vitórias?

---

### 🧱 Defesa e Controle de Rebotes

26. **Percentuais de Rebote** (simples — por jogo / por jogador):
DRB% = DRB / TRB
ORB% = ORB / TRB

- Quais jogadores dominam cada tipo de rebote (maior DRB% e maior ORB%)?
- Há times com perfil fortemente defensivo (maior média de DRB%) ou ofensivo (maior média de ORB%)?

> Observação: se `ORB` não existir no dataset, calcule somente `DRB% = DRB / TRB` e interprete `ORB` como `TRB - DRB`.

---

27. **Stock Total** (impacto defensivo) — por jogo e por jogador:
Stock = STL + BLK
- Quem são os jogadores com maior média de `Stock` por jogo?
- Qual time soma mais `Stock` por partida em média?

---

### 🔄 Consistência e Volume

28. **Coeficiente de variação de PTS** (medida de consistência):
Coef_var = std(PTS) / mean(PTS)
- Quem são os jogadores mais consistentes (menor coeficiente de variação), considerando só jogadores com mínimo de 10 jogos?
- Quem são os mais imprevisíveis?

---

29. **Eficiência por minuto**:
PTS_per_min = PTS / MP
GmSc_per_min = GmSc / MP

- Qual jogador tem maior média de `PTS_per_min` (considerar filtro por minutos mínimos por jogo)?
- E `GmSc_per_min`?

---

30. **Impact Score** (métrica composta simplificada — inspirada em PER):
Impact = ((PTS + TRB + AST + STL + BLK) - ((FGA - FG) + (FTA - FT) + TOV)) / MP

- Quem são os 10 jogadores mais impactantes segundo essa métrica (filtrar por mínimo de jogos/minutos)?
- Existe correlação entre `Impact` e `GmSc`?

---

## ✅ Observações e dicas de implementação

- Ao calcular médias por jogador, considere agregar por `Player` e usar filtros por número mínimo de jogos para evitar vieses (ex.: `min_games = 10`).
- Para métricas por time no nível de jogo (ex.: `team_attempts`), agrupe por `Tm` e `Data`.
- Trate `MP` corretamente: se estiver em formato `MM.SS` (ex.: `30.30`), converta para minutos decimais reais (ex.: `30 + 30/60 = 30.5`) antes de usar `MP` em divisões.
- Documente todos os filtros (mínimos de jogos, como tratar zeros e ausentes) — isso é crucial para reprodutibilidade.