# Quem É O Melhor Jogador de Basquete de Todos os Tempos?

## Parte A:

### Escolha da Base de Dados:

Minha ideia inicial era comparar apenas o [LeBron James](https://www.nba.com/player/2544/lebron-james) e o [Michael Jordan](https://www.nba.com/stats/player/893/career), porém dei uma olhada no Kaggle, e mesmo que nenhuma base disponível lá tenha atendido os meus interesses, eu pude perceber que essa é uma discussão maior. Portanto vou analisar três jogadores, além dos dois já citados, [Kobe Bryant](https://www.nba.com/stats/player/977/career) será analisado. Uma crítica válida seria a ausência de outros jogadores, como [Larry Bird](https://www.nba.com/stats/player/1449/career) e [Magic Johnson](https://www.nba.com/stats/player/77142/career), porém esses são jogadores de uma basquete mais antigo e aplicar uma comparação estatística com jogadores de épocas tão diferentes seria um erro. Quanto a extração dos dados, ela terá que ser de certa forma manual. No site da NBA tenho todos os dados que preciso, vou apenas copiá-los, formatá-los e transformá-los em arquivos CSV convenientes. 

### Formulação da Hipótese:

A formulação da hipótese de certa forma da foi anunciada, porém o meu objetivo, de maneira mais direta, é provar que LeBron James é o melhor jogador de basquete de todos os tempos. Indo contra um olhar saudosista que recusa o novo e se abraça de maneira irracional ao passado. 

### Referências Visuais e Rascunhos:

![Rascunho 1](imagens/rascunho2.jpeg "Minha Primeira Referência.")
<img align="left" width="100" height="100">

![Inspirações](imagens/inspiracoes.png "Inspirações Para a Peça Gráfica.")

## Parte B:

### Extraíndo as Bases de Dados:

Incialmente, vamos importar as bibliotecas que vamos utilizar ao longo da análise, e depois criar os dataframes com os quais vamos trabalhar. Esses dataframes são criados a partir dos nossos arquivos csv criados com os dados extraídos do site da NBA. 

In [1]:
import pandas as pd 

In [2]:
temporada_regular = pd.read_csv("bases_de_dados/stats_regular_season.csv")
playoffs = pd.read_csv("bases_de_dados/stats_playoffs.csv")

### Análise Unidimensional dos Dados:

Nesse momento, vamos classificar as variáveis de acordo com o seu tipo. Essa classificação vai ser crucial e vai determinar qual tipo de análise teremos que fazer em cada uma. Além de entender o que cada coluna significa na nossa base de dados. Vale destacar que será feita uma análise para cada jogador. 

| **Nome da Variável** | **Classificação** | **Class. Específica** |      **Siginficado**      |
|----------------------|-------------------|-----------------------|---------------------------|
| PLAYER               | Qualitativa       | Nominal               |Nome do Jogador            |
| SEASON               | Qualitativa       | Ordinal               |Temporada                  |
| TEAM                 | Qualitativa       | Nominal               |Time                       |
| AGE                  | Quantitativa      | Discreta              |Idade                      |
| GP                   | Quantitativa      | Discreta              |Jogos Disputados           |
| GS                   | Quantitativa      | Discreta              |Jogos de Titular           |
| MIN                  | Quantitativa      | Contínua              |Minutos Jogados            |
| PTS                  | Quantitativa      | Contínua              |Pontos Totais              |
| FGM                  | Quantitativa      | Contínua              |Arremessos Convertidos     |
| FGA                  | Quantitativa      | Contínua              |Arremessos Tentados        |
| FG%                  | Quantitativa      | Contínua              |Porce. Arreme. Conver.     |
| 3PM                  | Quantitativa      | Contínua              |Arre.3Pts Convertidos      |
| 3PA                  | Quantitativa      | Contínua              |Arre. 3Pts Tentados        |
| 3P%                  | Quantitativa      | Contínua              |Porce. Arreme. 3Pts Conver.|
| FTM                  | Quantitativa      | Contínua              |Lances Livres Convertidos  |
| FTA                  | Quantitativa      | Contínua              |Lances Livres Tentados     |
| FT%                  | Quantitativa      | Contínua              |Porce. Lances Liv. Conver. |
| OREB                 | Quantitativa      | Contínua              |Rebotes Ofensivos          |
| DREB                 | Quantitativa      | Contínua              |Rebotes Defensivos         |
| REB                  | Quantitativa      | Contínua              |Rebotes Totais             |
| AST                  | Quantitativa      | Contínua              |Assistências               |
| STL                  | Quantitativa      | Contínua              |Roubadas de Bolas          |
| BLK                  | Quantitativa      | Contínua              |Bloqueios ou "Tocos"       |
| TOV                  | Quantitativa      | Contínua              |Perdas de Bolas            |
| PF                   | Quantitativa      | Contínua              |Faltas Pessoais            |

In [3]:
import funcoes_estatistica

#### Análise Das Variáveis Qualitativas:

Para as variáveis qualitativas, o ideal é que seja feita contagem. Pois elas poderão nos retornar quantas temporadas cada jogador jogou e quantas temporadas ele atuou em cada time. Lembrando que nesse caso a diferença entre temporada regular e playoffs não importa. A função que vai fazer a contagem foi feita por mim e importada acima para retornar exatamente o que eu desejava.

#### Contagem Das Temporadas:

In [4]:
funcoes_estatistica.contagem(temporada_regular, ["PLAYER"])

PLAYER:
O item LEBRON JAMES tem 20 ocorrências nessa base de dados.
O item MICHAEL JORDAN tem 15 ocorrências nessa base de dados.
O item KOBE BRYANT tem 20 ocorrências nessa base de dados.


Nessa chunck, vamos contar quantos registros cada jogador tem. Isso vai indicar quantas temporadas de NBA ele disputou, note que Michael, embora tenha atuado até os 40 anos, não chega perto da longevidade de Kobe e Lebron. O desempate se dá pelo fato de LeBron ainda estar em atividade e possuir mais dois anos de contrato com o Los Angeles Lakers, portanto se tornará, com toda a certeza, o jogador mais longevo entre os três. Portanto, ponto para LeBron James!

#### Criação de Uma Base Para Cada Jogador:

In [5]:

kobe_df_rs = temporada_regular[temporada_regular["PLAYER"] == "KOBE BRYANT"] 
kobe_df_po = playoffs[playoffs["PLAYER"] == "KOBE BRYANT"] 
lebron_df_rs = temporada_regular[temporada_regular["PLAYER"] == "LEBRON JAMES"] 
lebron_df_po = playoffs[playoffs["PLAYER"] == "LEBRON JAMES"] 
jordan_df_rs = temporada_regular[temporada_regular["PLAYER"] == "MICHAEL JORDAN"] 
jordan_df_po = playoffs[playoffs["PLAYER"] == "MICHAEL JORDAN"] 

#### Contagem Dos Times Por Jogador:

* KOBE BRYANT

In [6]:
funcoes_estatistica.contagem(kobe_df_rs, ["TEAM"])

TEAM:
O item LAL tem 20 ocorrências nessa base de dados.


* LEBRON JAMES

In [7]:
funcoes_estatistica.contagem(lebron_df_rs, ["TEAM"])

TEAM:
O item CLE tem 11 ocorrências nessa base de dados.
O item MIA tem 4 ocorrências nessa base de dados.
O item LAL tem 5 ocorrências nessa base de dados.


* MICHAEL JORDAN

In [8]:
funcoes_estatistica.contagem(jordan_df_rs, ["TEAM"])

TEAM:
O item CHI tem 13 ocorrências nessa base de dados.
O item WAS tem 2 ocorrências nessa base de dados.


Nessa chucnk, vamos apenas analisar quantas temporadas cada jogador passou em cada time. Kobe, ficou a carreira toda em LA onde teve muito sucesso, porém concentrado nos anos 2000's. LeBron jogou em três equipes e teve destaque ao longo de todos esses 20 anos, foi campeão em todas elas e espalhou a sua dominância pela liga. Jordan jogou a grande parte da carreira pelos Bulls, onde conquistou 6 títulos nos anos 90, por isso tem a carreira mais vitoriosa entre os jogadores citados aqui, porém sua passagem por Washington foi muito decepcionante, tendo sequer se classificado para os playoff, os oito melhores times da temporada regular. Nessa etapa não existe uma vantagem clara para nenhum deles, existem vantagens em ficar a vida inteira em uma mesma equipe, e existem vantagens em se provar em várias equipes.

#### Análise Das Variáveis Quantitativas:

A análise da variáeis quantitativas foi o que me fez escolher o python. Eu criei uma função, assim como nas contagens acima, que recebe bases de dados e retorna os dados já sumarizados dentro de uma tabela. Essa função foi feita especialmente para esse trabalho para retornar a tabela do jeito que eu imaginava. As tabelas possuem as seguintes colunas:`VARIÁVEL`, `MÉDIA_RS`, `MEDIANA_RS`, `DP_RS`, `VAR_RS_LOG100`, `MÁX_RS`, `MÍN_RS`, `MÉDIA_PO`, `MEDIANA_PO`, `DP_PO`, `VAR_PO_LOG100`, `MÁX_PO`, `MÍN_PO`, nessa ordem. Elas representam a medida indicada e qual a origem dos dados, PO ou RS. Logo abaixo, na tag `Conclusões`, vou analisar variável por variável e descobrir qual jogador se destaca em cada uma. 

In [9]:
lista_variaveis_quant = ["GP", "GS", "MIN", "PTS", "FGM", "FGA", "FG%", "3PM", "3PA", "3P%", "FTM",
                          "FTA", "FT%", "OREB", "DREB", "REB", "AST", "STL", "BLK", "TOV", "PF"]

In [10]:
funcoes_estatistica.medidas_de_resumo(kobe_df_rs, kobe_df_po,lista_variaveis_quant, "Medidas de Resumo Kobe Bryant RS X PO")

In [11]:
funcoes_estatistica.medidas_de_resumo(lebron_df_rs, lebron_df_po, lista_variaveis_quant, "Medidas de Resumo LeBron James RS X PO")

In [12]:
funcoes_estatistica.medidas_de_resumo(jordan_df_rs, jordan_df_po, lista_variaveis_quant, "Medidas de Resumo Michael Jordan RS X PO")

* **GP**: No critério de jogos disputados, LeBron e Jordan disputaram praticamente o mesmo número de jogos por temporada ao longo da carreira, porém a constância do LeBron é maior, uma vez que a sua variância e o seu desvio padrão são menores que o do Jordan. Quando o assunto é playoffs, LeBron leva uma grande vantagem. 
* **GP**: No critério de jogos como titular, a situação é a mesma. Na temporada regular, existe certa disputa entre James e Jordan, porém contando a constância maior de LeBron e melhores números nos playoffs, fica claro que LeBron leva vantagem. Vale destacar que Kobe Bryant não entra sequer na disputa, muito por conta de suas lesões. Por exemplo, Lebron e Jordan começaram todos os jogos de playoffs na carreira, Kobe foi reserva em alguns jogos e perdeu muitos outros na temporada regular.
* **MIN**: O normal, até porque estão relacionados, é que os minutos acompanhem os números de jogos. Isso de fato é visto. Assim como nas análises acima, contando a temporada regular e os playoffs, quem leva vantagem é LeBron "King" James. Analisando essas três variáveis, a conclusão é que a condição atlética de LeBron é um grande destaque e isso pode explicar a sua grande longevidade, que já foi destacada acima.
* **PTS**: Esse talvez seja um dos principais critérios, pois são os pontos que decidem jogos. Antes de analisar os números, é válido lembrar, que na temporada 2022-23, LeBron ultrapassou Kareem Abdul-Jabbar como maior pontuador da história da liga. Porém, quando olhamos para os pontos na temporada regular, Jordan leva vantagem, nos playoffs a vantagem é de LeBron. Kobe, por sua vez, fica um pouco pra trás em relação aos outros dois. Analisando os fatos, considerando que as diferenças são mínimas entre os dois, podemos considerá-los igualmente letais, ou favorecer James por ter essa grande marca de maior pontuador da história. Eu daria a vitória para LeBron James pela constância, expressa na variância e no desvio padrão, e pelo recorde citado acima.
* **FGM**: O número de arremessos convertidos por jogo pode não ser muito importante, o ideal é analisar a porcentagem de acerto. Assim, será possível identificar qual dos três jogadores é o melhor arremessador de quadra.
* **FGA**: Novamente, o número de arremessos tentado pode indicar muito pouco, talvez apenas que aquele jogador é de fato o centro dos arremessos do time. Como todos eles foram referências absolutas em todas as suas equipes, eles eram de fato os principais arremessadores da equipe. Quem tentava mais arremessos dentre os três era o Jordan, mas a diferença não significa muita coisa. 
* **FG%**: Esse dado sim pode ser um grande indicador. Analisando apenas a média de aproveitamento, vemos que LeBron James possui o melhor aproveitamento, com cerca de 50%. Além disso é o mais contante, ou seja, manteve praticamente a mesma média durante toda a carreira. Isso pode explicar, talvez, o fato dele ser ligeiramente um melhor pontuador que o Jordan. 
* **3PM**: Diferente dos arremessos de quadra, é possível tirar uma boa conclusão do número de arremessos de três pontos convertidos. Analisando os dados, Kobe e LeBron se destacam, mas novamente James leva vantagem. Portanto, teoricamente, ele é o que joga mais fora do garrafão e longe da cesta. Isso torna ainda mais impressionante o seu número de pontos, uma vez que pontuar de mais longe é algo bem mais difícil.
* **3PA**: Como era de se esperar pela análise acima, LeBron é o que mais tenta arremessos de três pontos. Inicialmente, isso não indica muita coisa, apenas que ele é o que mais tenta os arremessos. Isso corrobora ainda mais para a tese levantada acima. 
* **3P%**: Esse critério, de fato, pode indicar quais dos três foi o melhor arremessador de três. Vale destacar o que nenhum deles tinha como grande característica o arremesso de três. Existem vários jogadores ao longo da história, com carreiras bem menos brilhantes, que possuem aproveitamento melhor. Porém, analisando apenas os três, o melhor aproveitamento é o do LeBron, quase 35%, como dito anteriormente, não é nada grandioso, mas fica longe de ser ruim. LeBron por exemplo tem várias bolas de três importantes. 
* **FTM**: O número de lances livres convertido pode não dizer muita coisa, portanto vou seguara as análises mais profundas para as variáveis a seguir. 
* **FTA**: Analisando o número de arremessos de lances livres tentados, podemos de alguma forma, mensurar quais dos times sofriam mais faltas. Não necessariamente teremos grande precisão, pois temos vários tipos de falta, mas pode ser um indicativo. Quem se destaca nesse fator é o Jordan. 
* **FT%**: No aproveitamento dos lances livres, temos uma disputa acirradíssima entre Kobe e Jordan. Porém, vemos que o Kobe leva uma ligeira vantagem, além de ser o mais constante. Portanto, nos lances livres, que são parte fundamental do jogo, o mais confiável era Kobe Bryant. Esse é o primeiro critério em que Kobe leva vantagem sobre os demais. 
* **OREB**: Nos rebotes ofensivos a análise é bem simples. Michael Jordan leva uma vantagem confortável sobre os outros dois. Uma ressalva importante é de que nenhum deles são pivôs, que são os maiores e mais fortes jogadores em quadra, que lutam por esse tipo de bola. 
* **DREB**: Nos rebotes defensivos, temos LeBron James como o maior contribuidor disparado. Isso aponta para um compromentimento defesivo bem maior que os outros dois atletas. Apenas reforçando a ideia, que é defendida por alguns, de que LeBron James é o jogador mais completo da história do basquete, uma vez que como já vimos ele é um grande atleta ofensivo e os números apontam para um grande atleta defensivo.
* **REB**: Nos rebotes gerais, LeBron vai levar vantagem. Muito por sua destacável contribuição defensiva que o destacae o difere de Michael Jordan e Kobe Bryant.  
* **AST**: Analisando de maneira simples, como essa análise pede, LeBron James é de longe o maior assitente. Isso corrobora para a nossa tese de que ele é extremamente completo. Além de ser um grande pontuador e ter uma boa contribuição defensiva, ele é um grande assistente. Isso aponta para o fato de que James é um grande tomador de decisão e joga para o time, saber a hora de arremessar ou passar a bola é uma das principais valências de um jogador de basquete, além de ser extremamente rara. 
* **STL**: No número de roubadas de bola, temos algo surpreendente. Michael Jordan se destaca nas roubadas de bola de maneira impressionante. Apontando para uma contribuição relevante do jordan na fase defensiva, talvez não tão grande quanto à do LeBron, mas relevante. 
* **BLK**: Nos bloqueios, popularmente conhecidos como "tocos", Jordan novamente se destaca, dessa vez com uma vantagem pequena em relação a James, mas mesmo assim à frente. Kobe fica em terceiro lugar nessas estatísticas defensivas, podemos tentar explicar isso pelo fato dele ser o menos prvilegiado atleticamente entre os três.
* **TOV**: Nas perdas de bola, que é uma parte negativa, temos LeBron como o que cuida pior da bola. Quase 250 perdas de bola por temporada regular e 65 nos playoffs é um número de fato impressionante. Talvez seja possível explicar pelo fato de que a estrela do time, assim como em todos os esportes, é o personagem que tenta as jogadas mais difíceis e fica mais vunerável à perdas de bola.
* **PF**: Nas faltas pessoais temos algo diferente, Kobe se destaca negativamente nos playoffs e Jordan na temporada regular. Porém, a diferença é mínima nos playoffs e muito maior na temporada regular, portanto, podemos afirmar que Michael Jordan é o principal cometedor de faltas dentre os três.

### Análise Bidimensional dos Dados:

#### Idade X Média de Pontos:

##### Temporada Regular:

![Gráfico de Correlação Média de Pontos Por Jogo (Regular Season) / Idade](imagens/graf_1.png "Primeiro Gráfico")

##### Playoffs:

![Gráfico de Correlação Média de Pontos Por Jogo (Playoffs) / Idade](imagens/graf_2.png "Primeiro Gráfico")

Antes de tudo, quero destacar que a linha pontilhada, ou "target line, foi uma opção gráfica minha para conseguir visualizar melhor em quais temporadas eles de fato alcançaram uma marca expressiva, esse recursp foi utilizado em todos os gráficos, no caso dos pontos a linha está nos 30 pontos por jogo, uma marca extremamente impressionante e digna de todos os louros. Compreendo que o gráfico de linhas seja o mais recomendado para visualizar a passagem do tempo, mas como eu queria dar um destaque para os times com as cores, o gráfico de linhas não ficava legal, portanto apenas no caso dos pontos eu preferi o gráfico de dispersão. Primeiramente, gostaria de destacar que nesse gráfico não estamos analisando o número de pontos totais por temporada, como foi feito na análise unidimensional, estamos analisando a média de pontos por partida. Isso gera uma análise um pouco diferente da análise já feita. Primeiramente, temos que destacar que todos tem ótimos números e por isso estão nessa análise, mas vamos ser um pouco mais criteriosos. Olhando friamente para as médias, Jordan é o que possui melhores médias ao longo da carreira, tanto em temporada regular, quanto em playoffs. Porém, quando olhamos para a regularidade, vemos que LeBron leva vatagem, sua média de pontuação ao longo da temporada regular é extremamente constante, algo que já constatamos acima. Contudo, nos playoffs, Jordan foi ainda mais constante, com apenas uma temporada abaixo de 30 pontos. Vemos na média de pontos, de fato, o vencedor seria Jordan. Para finalizar, faço um ponto para a carreira do Kobe, que claramente possui uma curva no formato de pico. Isso incida que quando mais novo não tinha números tão expressivos, evoluiu e atingiu seu melhor momento por volta dos 25 anos, e iniciou seu declínio a partir dos 30 anos. 

#### Idade X Média de Assistências:

![Gráfico de Correlação Média de Assistência Por Jogo (Temporada Regular) / Idade](imagens/graf_3.png "Primeiro Gráfico")

![Gráfico de Correlação Média de Assistência Por Jogo (Playoffs) / Idade](imagens/graf_4.png "Primeiro Gráfico")

Inicialmente, destaco que a linha pontilhada representa 7 assistências por jogo. Essa marca não é algo gritante, mas é extremamente relevante. Analisando as curvas, vemos que novamente, Kobe Bryant não consegue disputar com Michael e LeBron. Olhando apenas para os dois, podemos perceber que na grande maioria do tempo, James leva grande vantagem sobre Jordan. Contatação que apenas reforça a nossa tese explicitada acima de que, dentre os jogadores analisados, LeBron era o melhor passador. Isso fica bem claro. Outro fato interessante é que o pico do Michael Jordan foi entre 25-30 anos, o do LeBron foi depois dos 30 anos. A partir disso podemos, mais uma vez, valorizar sua longevidade e ressaltar que o seu jogo amadureceu, pois como explicamos acima, para uma estrela, distribuir assistências significa tomar a decisão correta, uma vez que esperamos principalmente pontos de jogadores desse calibre. 

#### Idade X Média de Rebotes:

![Gráfico de Correlação Média de Rebotes Por Jogo (Playoffs) / Idade](imagens/graf_5.png "Primeiro Gráfico")

![Gráfico de Correlação Média de Rebotes Por Jogo (Playoffs) / Idade](imagens/graf_6.png "Primeiro Gráfico")

Para finalizar, depois de ter analisado um atributo de ataque e um de armação, vamos analisar um parâmetro defensivo. Destaco que, assim como nos gráficos das assistências, a linha pontilhada representa os 7 rebotes por jogo. Essa análise é a mais óbvia das três, visto que existe um amplo domínio de LeBron James no critério defensivo. Enquanto 7 rebotes por jogo para Kobe Bryant e Michael Jordan foi praticamente o máximo de suas carreiras, LeBron James mateve essa marca em praticamente todos os anos em que jogou. Podemos afirmar com toda a certeza, que o melhor defensor dentre os três é o LeBron. 

## Parte C:

### Público Alvo:

Para a peça gráfica, que será o resultado final do trabalho, o público seria geral, qualquer desconhecedor do assunto poderia compreender do que se trata e qual a mensagem que ela transmite. Quanto ao arquvio notebook, acredito que seja necessário algum conhecimento prévio, não muito, embora eu tenha explicado todos os pontos. 

### Qualidade Expressiva:

Meu objetivo é produzir algo dramático, inicialmente seria alguma montagem, isso ainda fará parte do trabalho, mas mudei a minha rota e vou tentar entregar um html. A peça se resume ao LeBron tentando fazer sua enterrada característica em um plano mais alto, indicando sua superioridade em relação aos outros dois, e em um plano mais baixo Michael e Kobe tentando impedir o movimento plástico do jogador do Lakers. As imagens que serão usadas estão acima na parte das inspirações.

### Representatividade:

Como dito acima, meu objetivo é entregar uma página html, que além da imagem explique um poucoi da análise. Vou tentar inserir interatividade com o css, para que ao passar o mouse sobre o jogador você consiga ver um resumo da sua carreira e em que pontos ele vence os demais. 

### Ferramentas:

As ferramentas serão simples, apenas um software de photoshop para editar as imagens e uma IDE, provavelmente VS Code, que me permita criar a página html. Para a parte de iteratividade, que é sustentada pelo css, irei usar a ajuda do Chat GPT, não para criar a página, mas para me fornecer funções e comandos que possam atender minhas necessidades quando usados de forma própria. Farei uso da ferramenta, pois não sou um grande conhecedor de html e nunca programei com css.

## Parte D: