# Projeto 9 - Vizualização de dados com Python

# Campeonato de Futebol Brasileiro 

## Importando Bibliotecas e Dados

In [2]:
import pandas as pd
import plotly.express as px

In [3]:
df = pd.read_csv('Tabela_Clubes.csv')

In [10]:
df['Idade_Media'] = df['Idade_Media'].apply(lambda x: float(x.replace(',','.')))

## Gráficos

## 1. Análises Gerais (Distribuição e Resumo)

| Objetivo                                   | Colunas       | Tipo de Gráfico             | Sugestão                                                 |
| ------------------------------------------ | ------------- | --------------------------- | -------------------------------------------------------- |
| Distribuição de vitórias                   | `Vitorias`    | Histograma (`sns.histplot`) | Ver quantas vitórias os times costumam ter               |
| Distribuição de derrotas                   | `Derrotas`    | Histograma                  | Ver se a distribuição é simétrica em relação às vitórias |
| Distribuição da idade média                | `Idade_Media` | Histograma ou boxplot       | Analisar a idade média dos elencos                       |
| Distribuição de valores de mercado         | `Valor_total` | Histograma ou boxplot       | Ver se há grande disparidade entre clubes                |



### Distribuição de vitórias



In [11]:
px.histogram(df , x='Clubes', y = 'Vitorias', color='Clubes')

### Distribuição de derrotas

In [14]:
px.histogram(df, x='Clubes', y= 'Derrotas')

### Distribuição da idade média 

In [None]:
df_aux= df.groupby('Clubes')['Idades_media'].mean().reset_index()
px.histogram

### Distribuição de valores de mercado

## 2. Comparações Entre Clubes

| Objetivo                                  | Colunas                     | Tipo de Gráfico              | Sugestão                                     |
| ----------------------------------------- | --------------------------- | ---------------------------- | -------------------------------------------- |
| Top 10 clubes com mais vitórias em um ano | `Ano`, `Clubes`, `Vitorias` | Gráfico de barras            | Usar `sns.barplot` com ordenação decrescente |
| Clubes com melhor saldo de gols           | `Saldo`                     | Gráfico de barras horizontal | Facilita a leitura dos nomes dos clubes      |
| Clubes com maior valor de elenco          | `Valor_total`               | Barras ou barras horizontais | Mostrar a diferença financeira entre times   |
| Clubes com mais estrangeiros              | `Estrangeiros`              | Barras                       | Pode revelar políticas de contratação        |


### Top 10 clubes com mais vitórias em um ano

### Clubes com melhor saldo de gols

In [15]:
df_aux = df.groupby('Clubes')['Saldo'].sum().reset_index().sort_values ('Saldo', ascending=False).head(10)
px.histogram(df_aux.sort_values('Saldo'), x='Saldo', y='Clubes')

### Clubes com maior valor de elenco

In [28]:
df_aux=df.groupby('Clubes')['Valor_total'].sum().sort_values(ascending=False).reset_index()
px.bar(df_aux,x='Clubes', y='Valor_total', title='soma do gasto elenco de 2008 até 2017')

### Clubes com mais estrangeiros

In [19]:
df_aux = df.groupby ('Clubes')['Estrangeiros'].sum().sort_values(ascending=False).reset_index()
px.bar(df_aux, x='Clubes', y='Estrangeiros')

## 3. Análises Temporais (Evolução ao Longo dos Anos)

| Objetivo                                            | Colunas               | Tipo de Gráfico                  | Sugestão                                                       |
| --------------------------------------------------- | --------------------- | -------------------------------- | -------------------------------------------------------------- |
| Evolução do valor total do elenco ao longo dos anos | `Ano`, `Valor_total`  | Linha (`sns.lineplot`)           | Pode ser média por ano ou de clubes específicos                |
| Evolução do número de estrangeiros                  | `Ano`, `Estrangeiros` | Linha ou área                    | Ver tendência de internacionalização                           |
| Variação da posição de um clube específico          | `Ano`, `Pos.`         | Linha invertida (menor é melhor) | Ideal para analisar desempenho ao longo do tempo               |


### Evolução do valor total do elenco ao longo dos anos

In [32]:
time = 'Flamengo'
df_aux = df[df['Clubes']== time]
df_aux = df.groupby('Ano')['Valor_total'].sum().reset_index()
px.line(df_aux, x ='Ano', y='Valor_total')


### Evolução do número de estrangeiros

In [36]:
time='Palmeiras'
df_aux=df[df['Clubes'] == time].sort_values('Ano')
px.line(df_aux, x='Ano', y='Estrangeiros', markers=True)


### Variação da posição de um clube específico

In [50]:
time='Palmeiras'
df_aux=df[df['Clubes'] == time].sort_values('Ano')
px.line(df_aux, x='Ano', y='pos', markers=True)

ValueError: Value of 'y' is not the name of a column in 'data_frame'. Expected one of ['Unnamed: 0', 'Ano', 'Pos.', 'Clubes', 'Vitorias', 'Derrotas', 'Empates', 'GolsF/S', 'Saldo', 'Qtd_Jogadores', 'Idade_Media', 'Estrangeiros', 'Valor_total', 'Media_Valor'] but received: pos

## 4. Relações Entre Variáveis

| Objetivo                                      | Colunas               | Tipo de Gráfico                          | Sugestão                                                  |
| --------------------------------------------- | --------------------- | ---------------------------------------- | --------------------------------------------------------- |
| Relação entre valor do elenco e posição final | `Valor_total`, `Pos.` | Dispersão (`sns.scatterplot`)            | Testar se times mais caros terminam melhor                |
| Relação entre vitórias e saldo de gols        | `Vitorias`, `Saldo`   | Dispersão                                | Espera-se uma correlação positiva                         |



### Relação entre valor do elenco e posição final

In [40]:
px.scatter(df, x='Valor_total', y='Pos.', color='Clubes' )

### Relação entre vitórias e saldo de gols

In [41]:
px.scatter(df,x='Pos.',y='Vitorias',color='Clubes')

## 5. Rankings e Destaques

| Objetivo                                            | Colunas                  | Tipo de Gráfico  | Sugestão                                                 |
| --------------------------------------------------- | ------------------------ | ---------------- | -------------------------------------------------------- |
| Clubes com melhor saldo médio por ano               | `Saldo`, `Ano`           | Barras agrupadas | Comparar desempenho em diferentes temporadas             |
| Clubes com maior média de estrangeiros              | `Estrangeiros`, `Clubes` | Barras           | Ver clubes com mais jogadores estrangeiros por temporada |


### Clubes com melhor saldo médio por ano

In [None]:
ano = 2009
df_aux=df[df['Ano'] == ano].sort_values('Saldo', ascending=False).head()

px.bar(df_aux.sort_values('Saldo'), x='Saldo' , y='Clubes')


### Clubes com maior média de estrangeiros

In [None]:
df.groupby('Clubes')['Estrangeiros'].mean().sort_values(ascending=False)
px.bar(df_aux, x='Estrangeiros', y='Clubes',height=650)
