# Projeto 9 - Vizualização de dados com Python

# Campeonato de Futebol Brasileiro 

## Importando Bibliotecas e Dados

In [1]:
import pandas as pd
import plotly.express as px

In [2]:
df = pd.read_csv('Tabela_Clubes.csv')

## Gráficos

## 1. Análises Gerais (Distribuição e Resumo)

| Objetivo                                   | Colunas       | Tipo de Gráfico             | Sugestão                                                 |
| ------------------------------------------ | ------------- | --------------------------- | -------------------------------------------------------- |
| Distribuição de vitórias                   | `Vitorias`    | Histograma (`sns.histplot`) | Ver quantas vitórias os times costumam ter               |
| Distribuição de derrotas                   | `Derrotas`    | Histograma                  | Ver se a distribuição é simétrica em relação às vitórias |
| Distribuição da idade média                | `Idade_Media` | Histograma ou boxplot       | Analisar a idade média dos elencos                       |
| Distribuição de valores de mercado         | `Valor_total` | Histograma ou boxplot       | Ver se há grande disparidade entre clubes                |



### Distribuição de vitórias



In [3]:
px.histogram(df, x='Clubes', y= 'Vitorias')

### Distribuição de derrotas

In [4]:
px.histogram(df, x='Clubes', y='Derrotas')

### Distribuição da idade média 

In [5]:
px.bar(df, x='Clubes', y='Idade_Media')

### Distribuição de valores de mercado

In [8]:
px.histogram(df, x='Clubes', y='Valor_total')

In [7]:
df.columns

Index(['Unnamed: 0', 'Ano', 'Pos.', 'Clubes', 'Vitorias', 'Derrotas',
       'Empates', 'GolsF/S', 'Saldo', 'Qtd_Jogadores', 'Idade_Media',
       'Estrangeiros', 'Valor_total', 'Media_Valor'],
      dtype='object')

## 2. Comparações Entre Clubes

| Objetivo                                  | Colunas                     | Tipo de Gráfico              | Sugestão                                     |
| ----------------------------------------- | --------------------------- | ---------------------------- | -------------------------------------------- |
| Top 10 clubes com mais vitórias em um ano | `Ano`, `Clubes`, `Vitorias` | Gráfico de barras            | Usar `sns.barplot` com ordenação decrescente |
| Clubes com melhor saldo de gols           | `Saldo`                     | Gráfico de barras horizontal | Facilita a leitura dos nomes dos clubes      |
| Clubes com maior valor de elenco          | `Valor_total`               | Barras ou barras horizontais | Mostrar a diferença financeira entre times   |
| Clubes com mais estrangeiros              | `Estrangeiros`              | Barras                       | Pode revelar políticas de contratação        |


### Top 10 clubes com mais vitórias em um ano

In [10]:
df1 = df[df['Ano'] == 2017]
px.bar(df1, x='Clubes', y='Vitorias')

### Clubes com melhor saldo de gols

In [17]:
px.bar(df, x='Clubes', y='GolsF/S')

### Clubes com maior valor de elenco

In [14]:
px.bar(df, x='Clubes', y='Valor_total')

### Clubes com mais estrangeiros

In [13]:
px.bar(df, x='Clubes', y='Estrangeiros')

## 3. Análises Temporais (Evolução ao Longo dos Anos)

| Objetivo                                            | Colunas               | Tipo de Gráfico                  | Sugestão                                                       |
| --------------------------------------------------- | --------------------- | -------------------------------- | -------------------------------------------------------------- |
| Evolução do valor total do elenco ao longo dos anos | `Ano`, `Valor_total`  | Linha (`sns.lineplot`)           | Pode ser média por ano ou de clubes específicos                |
| Evolução do número de estrangeiros                  | `Ano`, `Estrangeiros` | Linha ou área                    | Ver tendência de internacionalização                           |
| Variação da posição de um clube específico          | `Ano`, `Pos.`         | Linha invertida (menor é melhor) | Ideal para analisar desempenho ao longo do tempo               |


### Evolução do valor total do elenco ao longo dos anos

In [26]:
df1 = df[df['Clubes'] == 'Sao Paulo']
px.line(df1, x='Ano', y='Valor_total', title= 'Evolução do valor total do elemco ao longo dos anos')

### Evolução do número de estrangeiros

In [27]:
df1 = df[df['Clubes'] == 'Sao Paulo']
px.line(df1, x='Ano', y='Estrangeiros', title= 'Numero de estrangeiros ')

### Variação da posição de um clube específico

In [None]:
df1 = df[df['Clubes'] == 'Sao Paulo']
px.line(df1, x='Ano', y='')

## 4. Relações Entre Variáveis

| Objetivo                                      | Colunas               | Tipo de Gráfico                          | Sugestão                                                  |
| --------------------------------------------- | --------------------- | ---------------------------------------- | --------------------------------------------------------- |
| Relação entre valor do elenco e posição final | `Valor_total`, `Pos.` | Dispersão (`sns.scatterplot`)            | Testar se times mais caros terminam melhor                |
| Relação entre vitórias e saldo de gols        | `Vitorias`, `Saldo`   | Dispersão                                | Espera-se uma correlação positiva                         |



### Relação entre valor do elenco e posição final

In [29]:
px.scatter(df, x='Valor_total', y='Pos.')

### Relação entre vitórias e saldo de gols

In [30]:
df.columns

Index(['Unnamed: 0', 'Ano', 'Pos.', 'Clubes', 'Vitorias', 'Derrotas',
       'Empates', 'GolsF/S', 'Saldo', 'Qtd_Jogadores', 'Idade_Media',
       'Estrangeiros', 'Valor_total', 'Media_Valor'],
      dtype='object')

In [31]:
px.scatter(df, x='Vitorias', y='GolsF/S')

## 5. Rankings e Destaques

| Objetivo                                            | Colunas                  | Tipo de Gráfico  | Sugestão                                                 |
| --------------------------------------------------- | ------------------------ | ---------------- | -------------------------------------------------------- |
| Clubes com melhor saldo médio por ano               | `Saldo`, `Ano`           | Barras agrupadas | Comparar desempenho em diferentes temporadas             |
| Clubes com maior média de estrangeiros              | `Estrangeiros`, `Clubes` | Barras           | Ver clubes com mais jogadores estrangeiros por temporada |


### Clubes com melhor saldo médio por ano

In [9]:
#px.histogram(df, x='Saldo', y='Ano')
df1 = df[df['Ano'] == 2009]
df1 = df1.sort_values('Saldo', ascending=False).head(10)

px.bar(df1.sort_values('Saldo', ascending=True), x='Saldo', y='Clubes')

### Clubes com maior média de estrangeiros

In [10]:
#px.bar(df, x='Estrangeiros', y='Clubes')
df1 = df.groupby('Clubes')['Estrangeiros'].mean().reset_index().sort_values('Estrangeiros', ascending=False).head()
px.bar(df1.sort_values('Estrangeiros', ascending=True), x='Estrangeiros', y='Clubes')