# Projeto 9 - Vizualização de dados com Python

# Campeonato de Futebol Brasileiro 

## Importando Bibliotecas e Dados

In [48]:
import pandas as pd
import plotly.express as px


In [49]:
df = pd.read_csv('Tabela_Clubes.csv')

In [50]:
df.head()

Unnamed: 0.1,Unnamed: 0,Ano,Pos.,Clubes,Vitorias,Derrotas,Empates,GolsF/S,Saldo,Qtd_Jogadores,Idade_Media,Estrangeiros,Valor_total,Media_Valor
0,0,2017,18,America-MG,10,10,18,30:47,-17,51,248,0,27350000,536000
1,1,2017,7,Athletico-PR,16,9,13,54:37,17,52,24,3,37650000,724000
2,2,2017,6,Atletico-MG,17,8,13,56:43,13,50,234,6,61350000,1230000
3,3,2017,11,Bahia,12,12,14,39:41,-2,48,232,2,34900000,727000
4,4,2017,9,Botafogo,13,12,13,38:46,-8,45,231,4,25550000,568000


## Gráficos

## 1. Análises Gerais (Distribuição e Resumo)

| Objetivo                                   | Colunas       | Tipo de Gráfico             | Sugestão                                                 |
| ------------------------------------------ | ------------- | --------------------------- | -------------------------------------------------------- |
| Distribuição de vitórias                   | `Vitorias`    | Histograma (`sns.histplot`) | Ver quantas vitórias os times costumam ter               |
| Distribuição de derrotas                   | `Derrotas`    | Histograma                  | Ver se a distribuição é simétrica em relação às vitórias |
| Distribuição da idade média                | `Idade_Media` | Histograma ou boxplot       | Analisar a idade média dos elencos                       |
| Distribuição de valores de mercado         | `Valor_total` | Histograma ou boxplot       | Ver se há grande disparidade entre clubes                |



### Distribuição de vitórias



In [51]:
px.bar(df, x='Clubes', y='Vitorias')

### Distribuição de derrotas

In [52]:
px.histogram(df, x='Clubes', y='Vitorias')

### Distribuição da idade média 

In [53]:
df['Idade_Media'] = df['Idade_Media'].apply(lambda x: float(x.replace(',', '.')))

In [54]:
df_aux =df.groupby('Clubes')['Idade_Media'].mean().reset_index()

px.histogram(df_aux, x='Clubes', y='Idade_Media')



### Distribuição de valores de mercado

In [55]:
px.histogram(df, x='Clubes', y='Valor_total', color='Clubes')

## 2. Comparações Entre Clubes

| Objetivo                                  | Colunas                     | Tipo de Gráfico              | Sugestão                                     |
| ----------------------------------------- | --------------------------- | ---------------------------- | -------------------------------------------- |
| Top 10 clubes com mais vitórias em um ano | `Ano`, `Clubes`, `Vitorias` | Gráfico de barras            | Usar `sns.barplot` com ordenação decrescente |
| Clubes com melhor saldo de gols           | `Saldo`                     | Gráfico de barras horizontal | Facilita a leitura dos nomes dos clubes      |
| Clubes com maior valor de elenco          | `Valor_total`               | Barras ou barras horizontais | Mostrar a diferença financeira entre times   |
| Clubes com mais estrangeiros              | `Estrangeiros`              | Barras                       | Pode revelar políticas de contratação        |


### Top 10 clubes com mais vitórias em um ano

In [58]:
ano = 2009
df_aux = df[df['Ano'] == ano].sort_values('Vitorias', ascending=False)
px.histogram(df_aux.sort_values('Vitorias', ascending=True).head(10), x='Vitorias', y='Clubes', orientation='h')


### Clubes com melhor saldo de gols

In [70]:
df_aux = df.groupby('Clubes')['Saldo'].sum().reset_index().sort_values('Saldo', ascending=False).head(10)
px.histogram(df_aux.sort_values('Saldo'), x='Saldo', y='Clubes')


### Clubes com maior valor de elenco

In [72]:
df_aux = df.groupby('Clubes')['Valor_total'].sum().sort_values(ascending=False).reset_index()
px.bar(df_aux, x='Clubes', y='Valor_total',title='Soma de gasto com elenco de 2008 até 2017')

### Clubes com mais estrangeiros

In [75]:
df_aux = df.groupby('Clubes')['Estrangeiros'].sum().sort_values(ascending=False).reset_index()
px.bar(df_aux, x='Clubes', y='Estrangeiros')

## 3. Análises Temporais (Evolução ao Longo dos Anos)

| Objetivo                                            | Colunas               | Tipo de Gráfico                  | Sugestão                                                       |
| --------------------------------------------------- | --------------------- | -------------------------------- | -------------------------------------------------------------- |
| Evolução do valor total do elenco ao longo dos anos | `Ano`, `Valor_total`  | Linha (`sns.lineplot`)           | Pode ser média por ano ou de clubes específicos                |
| Evolução do número de estrangeiros                  | `Ano`, `Estrangeiros` | Linha ou área                    | Ver tendência de internacionalização                           |
| Variação da posição de um clube específico          | `Ano`, `Pos.`         | Linha invertida (menor é melhor) | Ideal para analisar desempenho ao longo do tempo               |


### Evolução do valor total do elenco ao longo dos anos

In [79]:
time = 'Santos'
df_aux = df[df['Clubes'] == time]
df_aux = df_aux.groupby('Ano')['Valor_total'].sum().reset_index()
px.line(df_aux, x='Ano', y='Valor_total')

### Evolução do número de estrangeiros

In [88]:

df_aux = df.groupby('Ano')['Estrangeiros'].sum().reset_index()
px.line(df_aux, x='Ano', y='Estrangeiros')

In [91]:
time = 'Sao Paulo'
df_aux = df[df['Clubes'] == time].sort_values('Ano')
px.line(df_aux, x='Ano', y='Estrangeiros')

### Variação da posição de um clube específico

In [93]:
time = 'Bahia'
df_aux = df[df['Clubes'] == time].sort_values('Ano')
px.line(df_aux, x='Ano', y='Pos.', markers=True)

## 4. Relações Entre Variáveis

| Objetivo                                      | Colunas               | Tipo de Gráfico                          | Sugestão                                                  |
| --------------------------------------------- | --------------------- | ---------------------------------------- | --------------------------------------------------------- |
| Relação entre valor do elenco e posição final | `Valor_total`, `Pos.` | Dispersão (`sns.scatterplot`)            | Testar se times mais caros terminam melhor                |
| Relação entre vitórias e saldo de gols        | `Vitorias`, `Saldo`   | Dispersão                                | Espera-se uma correlação positiva                         |



### Relação entre valor do elenco e posição final

In [94]:
px.scatter(df, x='Valor_total', y='Pos.', color='Clubes')

### Relação entre vitórias e saldo de gols

In [95]:
px.scatter(df, x='Pos.', y='Vitorias', color='Clubes')

## 5. Rankings e Destaques

| Objetivo                                            | Colunas                  | Tipo de Gráfico  | Sugestão                                                 |
| --------------------------------------------------- | ------------------------ | ---------------- | -------------------------------------------------------- |
| Clubes com melhor saldo médio por ano               | `Saldo`, `Ano`           | Barras agrupadas | Comparar desempenho em diferentes temporadas             |
| Clubes com maior média de estrangeiros              | `Estrangeiros`, `Clubes` | Barras           | Ver clubes com mais jogadores estrangeiros por temporada |


### Clubes com melhor saldo médio por ano

In [96]:
ano = 2010
df_aux = df[df['Ano'] == ano].sort_values('Saldo', ascending=False).head()
px.bar(df_aux.sort_values('Saldo'), x='Saldo', y='Clubes')

### Clubes com maior média de estrangeiros

In [116]:
df_aux = df.groupby('Clubes')['Estrangeiros'].mean().reset_index()
px.bar(df_aux.sort_values('Estrangeiros'), x='Estrangeiros', y='Clubes', height=700)