In [1]:
import pandas as pd
import plotly.express as px

In [2]:
df = pd.read_csv('brasileirao_2012_a_2023.csv')
df.head()

Unnamed: 0,Ano,Colocação,Clube,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
0,2012,1,Fluminense - RJ,77,22,11,5,61,33,28,85,3,67
1,2012,2,Atlético - MG,72,20,12,6,64,37,27,104,10,63
2,2012,3,Grêmio - RS,71,20,11,7,56,33,23,102,9,62
3,2012,4,São Paulo - SP,66,20,6,12,59,37,22,93,6,57
4,2012,5,Vasco da Gama - RJ,58,16,10,12,45,44,1,91,3,50


In [3]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 240 entries, 0 to 239
Data columns (total 13 columns):
 #   Column              Non-Null Count  Dtype 
---  ------              --------------  ----- 
 0   Ano                 240 non-null    int64 
 1   Colocação           240 non-null    int64 
 2   Clube               240 non-null    object
 3   Pontos              240 non-null    int64 
 4   Vitórias            240 non-null    int64 
 5   Empates             240 non-null    int64 
 6   Derrotas            240 non-null    int64 
 7   Gols Feitos         240 non-null    int64 
 8   Gols Sofridos       240 non-null    int64 
 9   Saldos de Gols      240 non-null    int64 
 10  Cartões Amarelos    240 non-null    int64 
 11  Cartões Vermelhos   240 non-null    int64 
 12  Aproveitamento (%)  240 non-null    int64 
dtypes: int64(12), object(1)
memory usage: 24.5+ KB


<h2>Normalizando clubes</h2>
<p>Alguns clubes aparecem com nomes distintos, a depender do ano. A tarefa aqui é identificar esses times e agrupá-los devidamente.</p>

In [4]:
df.groupby('Clube').sum()

Unnamed: 0_level_0,Ano,Colocação,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
Clube,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1
America - MG,2021,8,53,13,14,11,41,37,4,66,2,46
America Fc - MG,2018,17,40,10,10,18,30,47,-17,84,8,35
América - MG,2016,20,28,7,7,24,23,58,-35,66,3,24
América Fc Saf - MG,2022,10,53,15,8,15,40,40,0,88,5,46
América Saf - MG,2023,20,24,5,9,24,42,81,-39,86,11,21
Athletico Paranaense - PR,12123,49,335,92,59,77,283,241,42,550,26,292
Atletico - PR,2014,8,54,15,9,14,43,42,1,72,1,47
Atlético - GO,10092,79,205,49,58,83,187,261,-74,469,31,177
Atlético - MG,18144,52,551,154,89,99,506,399,107,777,46,481
Atlético - PR,6048,27,159,45,24,45,126,123,3,239,11,138


In [5]:
def agrupar_nomes(lista_com_nomes: list, nome_correto: str):
    for nome in lista_com_nomes:
        df.loc[df['Clube'] == nome, 'Clube'] = nome_correto

nomes_incorretos = {
    "América - MG": ["America - MG", "America Fc - MG", "América Fc Saf - MG", "América Saf - MG"],
    "Athletico Paranaense - PR": ["Atletico - PR", "Atlético - PR", "Atlético Paranaense - PR"],
    "Atlético Mineiro - MG": ["Atlético - MG", "Atlético Mineiro Saf - MG"],
    "Atlético Goianiense - GO": ["Atlético - GO"],
    "Coritiba - PR": ["Coritiba S.a.f. - PR"],
    "Cruzeiro - MG": ["Cruzeiro Saf - MG"],
    "Vasco da Gama - RJ": ["Vasco da Gama S.a.f. - RJ"],
    "Cuiabá - MT": ["Cuiabá Saf - MT"],
}

for nome_correto in nomes_incorretos.keys():
    agrupar_nomes(nomes_incorretos[nome_correto], nome_correto)

In [6]:
sorted(df['Clube'].unique())

['América - MG',
 'Athletico Paranaense - PR',
 'Atlético Goianiense - GO',
 'Atlético Mineiro - MG',
 'Avaí - SC',
 'Bahia - BA',
 'Botafogo - RJ',
 'Ceará - CE',
 'Chapecoense - SC',
 'Corinthians - SP',
 'Coritiba - PR',
 'Criciuma - SC',
 'Cruzeiro - MG',
 'Csa - AL',
 'Cuiabá - MT',
 'Figueirense - SC',
 'Flamengo - RJ',
 'Fluminense - RJ',
 'Fortaleza - CE',
 'Goiás - GO',
 'Grêmio - RS',
 'Internacional - RS',
 'Joinville - SC',
 'Juventude - RS',
 'Náutico - PE',
 'Palmeiras - SP',
 'Paraná - PR',
 'Ponte Preta - SP',
 'Portuguesa - SP',
 'Red Bull Bragantino - SP',
 'Santa Cruz - PE',
 'Santos - SP',
 'Sport - PE',
 'São Paulo - SP',
 'Vasco da Gama - RJ',
 'Vitória - BA']

In [7]:
len(df['Clube'].unique())

36

<h2>1 - Total da soma de cada coluna de cada time.</h2>

In [8]:
soma_colunas_por_time = df.groupby('Clube').sum().drop(columns=['Ano', 'Aproveitamento (%)', 'Colocação']).copy()
soma_colunas_por_time

Unnamed: 0_level_0,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos
Clube,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1
América - MG,198,50,48,92,176,263,-87,390,29
Athletico Paranaense - PR,612,170,102,146,517,455,62,953,43
Atlético Goianiense - GO,205,49,58,83,187,261,-74,469,31
Atlético Mineiro - MG,759,214,117,125,670,502,168,1066,60
Avaí - SC,140,33,41,78,119,230,-111,382,22
Bahia - BA,410,104,98,140,378,424,-46,826,54
Botafogo - RJ,500,136,92,152,434,453,-19,880,47
Ceará - CE,222,52,66,72,195,209,-14,484,31
Chapecoense - SC,287,70,77,119,261,362,-101,566,28
Corinthians - SP,707,188,143,125,548,429,119,916,44


<h2>2 - Média de cada coluna de cada time.</h2>

In [9]:
media_colunas_por_time = df.groupby('Clube').mean().drop(columns=['Ano']).round(1).copy()
media_colunas_por_time

Unnamed: 0_level_0,Colocação,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
Clube,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1
América - MG,15.0,39.6,10.0,9.6,18.4,35.2,52.6,-17.4,78.0,5.8,34.4
Athletico Paranaense - PR,7.9,55.6,15.5,9.3,13.3,47.0,41.4,5.6,86.6,3.9,48.5
Atlético Goianiense - GO,15.8,41.0,9.8,11.6,16.6,37.4,52.2,-14.8,93.8,6.2,35.4
Atlético Mineiro - MG,5.2,63.2,17.8,9.8,10.4,55.8,41.8,14.0,88.8,5.0,55.1
Avaí - SC,18.5,35.0,8.2,10.2,19.5,29.8,57.5,-27.8,95.5,5.5,30.0
Bahia - BA,14.1,45.6,11.6,10.9,15.6,42.0,47.1,-5.1,91.8,6.0,39.4
Botafogo - RJ,10.5,50.0,13.6,9.2,15.2,43.4,45.3,-1.9,88.0,4.7,43.3
Ceará - CE,14.0,44.4,10.4,13.2,14.4,39.0,41.8,-2.8,96.8,6.2,38.4
Chapecoense - SC,14.4,41.0,10.0,11.0,17.0,37.3,51.7,-14.4,80.9,4.0,35.7
Corinthians - SP,7.0,58.9,15.7,11.9,10.4,45.7,35.8,9.9,76.3,3.7,51.3


<h2>3 - Soma das informações de cada ano.</h2>

In [10]:
somas_colunas_por_ano = df.groupby('Ano').sum().drop(columns=['Clube', 'Aproveitamento (%)', 'Colocação']).copy()
somas_colunas_por_ano

Unnamed: 0_level_0,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos
Ano,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1
2012,1035,275,210,275,940,940,0,1893,112
2013,1024,272,216,272,936,936,0,1683,107
2014,1048,288,184,288,860,860,0,1657,82
2015,1049,289,182,289,897,897,0,1824,109
2016,1043,285,188,287,912,918,-6,1693,86
2017,1037,277,206,277,923,923,0,1777,77
2018,1027,270,220,270,827,827,0,1815,101
2019,1042,282,196,282,875,875,0,1703,116
2020,1032,272,216,272,944,944,0,1730,133
2021,1027,267,226,267,842,842,0,1803,116


<p>Em 2016, na última rodada do Brasileirão, houve um W.O duplo entre Chapecoense x Atlético-MG. Devido à isso, o saldo de gols é negativo.</p>

<h2>4 - Média de cada informação de cada ano</h2>

In [11]:
media_colunas_por_anos = df.groupby('Ano').mean(numeric_only=True).drop(columns="Colocação").round(1).copy()
media_colunas_por_anos

Unnamed: 0_level_0,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
Ano,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
2012,51.8,13.8,10.5,13.8,47.0,47.0,0.0,94.6,5.6,45.0
2013,51.2,13.6,10.8,13.6,46.8,46.8,0.0,84.2,5.4,44.5
2014,52.4,14.4,9.2,14.4,43.0,43.0,0.0,82.8,4.1,45.6
2015,52.4,14.4,9.1,14.4,44.8,44.8,0.0,91.2,5.4,45.4
2016,52.2,14.2,9.4,14.4,45.6,45.9,-0.3,84.6,4.3,45.4
2017,51.8,13.8,10.3,13.8,46.2,46.2,0.0,88.8,3.8,45.0
2018,51.4,13.5,11.0,13.5,41.4,41.4,0.0,90.8,5.0,44.6
2019,52.1,14.1,9.8,14.1,43.8,43.8,0.0,85.2,5.8,45.2
2020,51.6,13.6,10.8,13.6,47.2,47.2,0.0,86.5,6.6,44.6
2021,51.4,13.4,11.3,13.4,42.1,42.1,0.0,90.2,5.8,44.6


<h2>5 - Identificar A MENOR e A MAIOR pontuação do 17 colocado no Brasileirão.</h2>

In [12]:
def devolve_maior_e_menor_pontuacao(colocacao: int | float):
    tabela = df.loc[df['Colocação'] == colocacao, :].copy()
    if tabela.empty:     
        return None
    tabela = tabela.sort_values('Pontos', ascending=False)
    return {"maior": tabela.head(1), "menor": tabela.tail(1)}

In [13]:
colocacoes_17 = devolve_maior_e_menor_pontuacao(17)
colocacoes_17['maior']

Unnamed: 0,Ano,Colocação,Clube,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
36,2013,17,Portuguesa - SP,44,12,12,14,50,46,4,89,9,38


In [14]:
colocacoes_17['menor']

Unnamed: 0,Ano,Colocação,Clube,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
156,2019,17,Cruzeiro - MG,36,7,15,16,27,46,-19,81,6,31


<h2>5.1 - Média de pontuação do 17 colocado.</h2>

In [81]:
df.loc[df['Colocação'] == 17, 'Pontos'].mean()

40.916666666666664

<h2>6 - Identificar A MENOR e A MAIOR pontuação do lanterna do Brasileirão.</h2>

In [15]:
colocacoes_20 = devolve_maior_e_menor_pontuacao(20)
colocacoes_20['maior']

Unnamed: 0,Ano,Colocação,Clube,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
119,2017,20,Atlético Goianiense - GO,36,9,9,20,38,56,-18,83,3,31


In [16]:
colocacoes_20['menor']

Unnamed: 0,Ano,Colocação,Clube,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
199,2021,20,Chapecoense - SC,15,1,12,25,27,67,-40,82,10,13


<h2>6.1 - Média de pontuação do lanterna.</h2>

In [82]:
df.loc[df['Colocação'] == 20, 'Pontos'].mean()

25.666666666666668

<h2>7 - Identificar A MENOR e A MAIOR pontuação do campeão no Brasileirão.</h2>

In [17]:
colocacoes_1 = devolve_maior_e_menor_pontuacao(1)
colocacoes_1['maior']

Unnamed: 0,Ano,Colocação,Clube,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
140,2019,1,Flamengo - RJ,90,28,6,4,86,37,49,90,3,78


In [18]:
colocacoes_1['menor']

Unnamed: 0,Ano,Colocação,Clube,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
220,2023,1,Palmeiras - SP,70,20,10,8,64,33,31,101,7,61


<h2>7.1 - Média de pontuação do campeão.</h2>

In [83]:
df.loc[df['Colocação'] == 1, 'Pontos'].mean()

78.5

<h2>8 - Identificar o time que MAIS TOMOU CARTÃO AMARELO e o que MAIS TOMOU CARTÃO VERMELHO em UM ANO, e vice-versa.</h2>

In [19]:
#time que mais tomou cartões amarelos em uma edição
df.loc[df['Cartões Amarelos'] == df['Cartões Amarelos'].max(), :]

Unnamed: 0,Ano,Colocação,Clube,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
226,2023,7,Fluminense - RJ,56,16,8,14,51,47,4,130,12,49


In [20]:
#time que menos tomou cartões amarelos em uma edição
df.loc[df['Cartões Amarelos'] == df['Cartões Amarelos'].min(), :]

Unnamed: 0,Ano,Colocação,Clube,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
184,2021,5,Corinthians - SP,57,15,12,11,40,36,4,61,3,50


In [21]:
#time que mais tomou cartões vermelhos em uma edição
df.loc[df['Cartões Vermelhos'] == df['Cartões Vermelhos'].max(), :]

Unnamed: 0,Ano,Colocação,Clube,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
77,2015,18,Vasco da Gama - RJ,41,10,11,17,28,54,-26,108,14,35


In [22]:
#time que menos tomou cartões vermelhos em uma edição
df.loc[df['Cartões Vermelhos'] == df['Cartões Vermelhos'].min(), :]

Unnamed: 0,Ano,Colocação,Clube,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
80,2016,1,Palmeiras - SP,80,24,8,6,62,32,30,95,0,70


<h2>8.1 O time que mais tomou cartões amarelos e o que mais tomou vermelhos em todo o registro</h2>

In [23]:
#Mais sofreu cartões amarelos
soma_colunas_por_time.loc[soma_colunas_por_time['Cartões Amarelos'] == soma_colunas_por_time['Cartões Amarelos'].max()]

Unnamed: 0_level_0,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos
Clube,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1
São Paulo - SP,697,188,133,135,572,473,99,1092,72


In [24]:
#Mais sofreu cartões vermelhos
soma_colunas_por_time.loc[soma_colunas_por_time['Cartões Vermelhos'] == soma_colunas_por_time['Cartões Vermelhos'].max()]

Unnamed: 0_level_0,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos
Clube,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1
Fluminense - RJ,663,183,114,159,577,529,48,1085,82


<h2>9 - Identificar os times com as maiores e menores médias de cartões amarelos e cartões vermelhos por campeonato.</h2>
<p>Estabelecido um filtro mínimo de 3 campeonatos, isto é, apenas equipes que jogaram pelo menos 3 vezes o Brasileirão, nesse registro, serão contabilizados no cálculo.</p>

In [25]:
filtro_minimo = soma_colunas_por_time[soma_colunas_por_time['Vitórias'] + soma_colunas_por_time['Empates'] + soma_colunas_por_time['Derrotas'] <= 76].index
filtro_minimo

Index(['Criciuma - SC', 'Csa - AL', 'Joinville - SC', 'Juventude - RS',
       'Náutico - PE', 'Paraná - PR', 'Portuguesa - SP', 'Santa Cruz - PE'],
      dtype='object', name='Clube')

In [26]:
media_com_filtro = media_colunas_por_time.drop(filtro_minimo)

In [27]:
#clube com a maior média de cartões amarelos
media_com_filtro[media_com_filtro['Cartões Amarelos'] == media_com_filtro['Cartões Amarelos'].max()]

Unnamed: 0_level_0,Colocação,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
Clube,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1
Internacional - RS,7.5,58.5,15.9,10.8,11.3,47.8,39.3,8.5,99.2,6.4,51.0


In [28]:
#clube com a menor média de cartões amarelos
media_com_filtro[media_com_filtro['Cartões Amarelos'] == media_com_filtro['Cartões Amarelos'].min()]

Unnamed: 0_level_0,Colocação,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
Clube,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1
Corinthians - SP,7.0,58.9,15.7,11.9,10.4,45.7,35.8,9.9,76.3,3.7,51.3


In [29]:
#clube com a maior média de cartões amarelos
media_com_filtro[media_com_filtro['Cartões Vermelhos'] == media_com_filtro['Cartões Vermelhos'].max()]

Unnamed: 0_level_0,Colocação,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
Clube,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1
Fortaleza - CE,9.4,52.2,14.4,9.0,14.6,43.8,44.2,-0.4,90.0,8.2,45.2


In [30]:
#clube com a menor média de cartões amarelos
media_com_filtro[media_com_filtro['Cartões Vermelhos'] == media_com_filtro['Cartões Vermelhos'].min()]

Unnamed: 0_level_0,Colocação,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
Clube,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1
Corinthians - SP,7.0,58.9,15.7,11.9,10.4,45.7,35.8,9.9,76.3,3.7,51.3


In [31]:
def plotar_grafico_de_cartoes(dataframe: pd.DataFrame, coluna: str, tipo: str):
    title = f"Média de {coluna} por Clube"
    if tipo == "Ano":
        title += " por Ano"
    fig = px.bar(dataframe, x=dataframe.index, y=coluna, title=title, color=dataframe.index)
    fig.update_layout(
        showlegend=False,
        xaxis_title='',
        yaxis_title=f"Média de {coluna}"
        )
    fig.update_traces(
        hovertemplate="%{x}<br>%{y}<extra></extra>"
    )
    fig.show()

In [32]:
plotar_grafico_de_cartoes(media_com_filtro, "Cartões Amarelos", "Clube")

In [33]:
plotar_grafico_de_cartoes(media_com_filtro, "Cartões Vermelhos", "Clube")

In [34]:
plotar_grafico_de_cartoes(media_colunas_por_anos, "Cartões Amarelos", "Ano")

In [35]:
plotar_grafico_de_cartoes(media_colunas_por_anos, "Cartões Vermelhos", "Ano")

<h2>10 - Identificar o time com MAIS GOLS FEITOS em uma edição.</h2>

In [36]:
df.loc[df['Gols Feitos'] == df['Gols Feitos'].max(), ['Ano', 'Colocação', 'Clube', 'Pontos', 'Gols Feitos']]

Unnamed: 0,Ano,Colocação,Clube,Pontos,Gols Feitos
140,2019,1,Flamengo - RJ,90,86


<h2>10.1 - Identificar o time com MENOS GOLS FEITOS em uma edição.</h2>

In [37]:
df.loc[df['Gols Feitos'] == df['Gols Feitos'].min(), ['Ano', 'Colocação', 'Clube', 'Pontos', 'Gols Feitos']]

Unnamed: 0,Ano,Colocação,Clube,Pontos,Gols Feitos
139,2018,20,Paraná - PR,23,18
159,2019,20,Avaí - SC,20,18


<h2>11 - Identificar o time com MAIS GOLS SOFRIDOS em uma edição</h2>

In [38]:
df.loc[df['Gols Sofridos'] == df['Gols Sofridos'].max(), ['Ano', 'Colocação', 'Clube', 'Pontos', 'Gols Sofridos']]

Unnamed: 0,Ano,Colocação,Clube,Pontos,Gols Sofridos
239,2023,20,América - MG,24,81


<h2>11.1 - Identificar o time com MENOS GOLS SOFRIDOS em uma edição</h2>

In [39]:
df.loc[df['Gols Sofridos'] == df['Gols Sofridos'].min(), ['Ano', 'Colocação', 'Clube', 'Pontos', 'Gols Sofridos']]

Unnamed: 0,Ano,Colocação,Clube,Pontos,Gols Sofridos
29,2013,10,Corinthians - SP,50,22


<h2>12 - Identificar o time com o MAIOR SALDO DE GOLS em uma edição</h2>

In [40]:
df.loc[df['Saldos de Gols'] == df['Saldos de Gols'].max(), ['Ano', 'Colocação', 'Clube', 'Pontos', 'Saldos de Gols']]

Unnamed: 0,Ano,Colocação,Clube,Pontos,Saldos de Gols
140,2019,1,Flamengo - RJ,90,49


<h2>12.1 - Identificar o time com o MENOR SALDO DE GOLS em uma edição</h2>

In [41]:
df.loc[df['Saldos de Gols'] == df['Saldos de Gols'].min(), ['Ano', 'Colocação', 'Clube', 'Pontos', 'Saldos de Gols']]

Unnamed: 0,Ano,Colocação,Clube,Pontos,Saldos de Gols
39,2013,20,Náutico - PE,20,-57


<h2>13 - Identificar OS TIMES que MAIS FIZERAM GOLS no TOTAL.</h2>

In [42]:
soma_colunas_por_time.sort_values('Gols Feitos', ascending=False).head()

Unnamed: 0_level_0,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos
Clube,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1
Flamengo - RJ,755,216,111,129,672,496,176,950,58
Atlético Mineiro - MG,759,214,117,125,670,502,168,1066,60
Palmeiras - SP,699,200,99,119,620,439,181,1035,61
Santos - SP,673,182,127,147,579,494,85,1072,69
Fluminense - RJ,663,183,114,159,577,529,48,1085,82


<h2>14 - Identificar OS TIMES que MAIS SOFRERAM GOLS no TOTAL.</h2>

In [43]:
soma_colunas_por_time.sort_values('Gols Sofridos', ascending=False).head()

Unnamed: 0_level_0,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos
Clube,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1
Fluminense - RJ,663,183,114,159,577,529,48,1085,82
Atlético Mineiro - MG,759,214,117,125,670,502,168,1066,60
Flamengo - RJ,755,216,111,129,672,496,176,950,58
Santos - SP,673,182,127,147,579,494,85,1072,69
São Paulo - SP,697,188,133,135,572,473,99,1092,72


Nos cálculos de média a seguir, assim como nos anteriores, apenas serão consideradas equipes que jogaram, pelo menos, 3 vezes o campeonato.

<h2>15 - Identificar OS TIMES que MAIS FAZEM GOLS na MÉDIA.</h2>

In [44]:
media_com_filtro.sort_values('Gols Feitos', ascending=False).head()

Unnamed: 0_level_0,Colocação,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
Clube,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1
Palmeiras - SP,5.6,63.5,18.2,9.0,10.8,56.4,39.9,16.5,94.1,5.5,55.3
Flamengo - RJ,6.1,62.9,18.0,9.2,10.8,56.0,41.3,14.7,79.2,4.8,54.7
Atlético Mineiro - MG,5.2,63.2,17.8,9.8,10.4,55.8,41.8,14.0,88.8,5.0,55.1
Red Bull Bragantino - SP,9.0,53.8,13.8,12.5,11.8,50.8,45.0,5.8,94.8,5.2,46.8
Grêmio - RS,5.5,61.9,17.4,9.8,10.8,50.4,37.9,12.5,88.5,4.7,53.8


<h2>15.1 - Identificar OS TIMES que MENOS FAZEM GOLS na MÉDIA.</h2>

In [45]:
media_com_filtro.sort_values('Gols Feitos').head()

Unnamed: 0_level_0,Colocação,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
Clube,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1
Avaí - SC,18.5,35.0,8.2,10.2,19.5,29.8,57.5,-27.8,95.5,5.5,30.0
Cuiabá - MT,14.3,46.3,11.3,12.3,14.3,35.0,39.3,-4.3,89.3,7.3,40.0
América - MG,15.0,39.6,10.0,9.6,18.4,35.2,52.6,-17.4,78.0,5.8,34.4
Figueirense - SC,16.8,39.2,9.8,10.0,18.2,35.5,54.8,-19.2,96.0,8.0,34.0
Chapecoense - SC,14.4,41.0,10.0,11.0,17.0,37.3,51.7,-14.4,80.9,4.0,35.7


In [46]:
fig = px.bar(media_com_filtro, x=media_com_filtro.index, y="Gols Feitos", color=media_com_filtro.index, title="Média de Gols Feitos por Equipe")
fig.update_layout(
    showlegend=False,
    yaxis_title = "Média de Gols Feitos",
    xaxis_title = "",
)
fig.show()

<h2>16 - Identificar OS TIMES que MAIS SOFREM GOLS na MÉDIA.</h2>

In [47]:
media_com_filtro.sort_values('Gols Sofridos', ascending=False).head()

Unnamed: 0_level_0,Colocação,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
Clube,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1
Avaí - SC,18.5,35.0,8.2,10.2,19.5,29.8,57.5,-27.8,95.5,5.5,30.0
Vitória - BA,14.6,44.4,11.6,9.6,16.8,46.6,56.2,-9.6,89.8,4.6,38.4
Figueirense - SC,16.8,39.2,9.8,10.0,18.2,35.5,54.8,-19.2,96.0,8.0,34.0
América - MG,15.0,39.6,10.0,9.6,18.4,35.2,52.6,-17.4,78.0,5.8,34.4
Coritiba - PR,15.3,42.1,10.9,9.4,17.7,40.2,52.4,-12.2,97.0,5.9,36.6


<h2>16.1 - Identificar OS TIMES que MENOS SOFREM GOLS na MÉDIA.</h2>

In [48]:
media_com_filtro.sort_values('Gols Sofridos').head()

Unnamed: 0_level_0,Colocação,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
Clube,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1
Corinthians - SP,7.0,58.9,15.7,11.9,10.4,45.7,35.8,9.9,76.3,3.7,51.3
Grêmio - RS,5.5,61.9,17.4,9.8,10.8,50.4,37.9,12.5,88.5,4.7,53.8
Internacional - RS,7.5,58.5,15.9,10.8,11.3,47.8,39.3,8.5,99.2,6.4,51.0
Cuiabá - MT,14.3,46.3,11.3,12.3,14.3,35.0,39.3,-4.3,89.3,7.3,40.0
São Paulo - SP,7.5,58.1,15.7,11.1,11.2,47.7,39.4,8.2,91.0,6.0,50.4


In [49]:
fig = px.bar(media_com_filtro, x=media_com_filtro.index, y="Gols Sofridos", color=media_com_filtro.index, title="Média de Gols Sofridos por Equipe")
fig.update_layout(
    showlegend=False,
    yaxis_title = "Média de Gols Sofridos",
    xaxis_title = "",
)
fig.show()

<h2>17 - Identificar OS TIMES com MAIOR SALDO DE GOLS na MÉDIA.</h2>

In [50]:
media_com_filtro.sort_values('Saldos de Gols', ascending=False).head()

Unnamed: 0_level_0,Colocação,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
Clube,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1
Palmeiras - SP,5.6,63.5,18.2,9.0,10.8,56.4,39.9,16.5,94.1,5.5,55.3
Flamengo - RJ,6.1,62.9,18.0,9.2,10.8,56.0,41.3,14.7,79.2,4.8,54.7
Atlético Mineiro - MG,5.2,63.2,17.8,9.8,10.4,55.8,41.8,14.0,88.8,5.0,55.1
Grêmio - RS,5.5,61.9,17.4,9.8,10.8,50.4,37.9,12.5,88.5,4.7,53.8
Corinthians - SP,7.0,58.9,15.7,11.9,10.4,45.7,35.8,9.9,76.3,3.7,51.3


<h2>17.1 - Identificar OS TIMES com MENOR SALDO DE GOLS na MÉDIA.</h2>

In [51]:
media_com_filtro.sort_values('Saldos de Gols').head()

Unnamed: 0_level_0,Colocação,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
Clube,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1
Avaí - SC,18.5,35.0,8.2,10.2,19.5,29.8,57.5,-27.8,95.5,5.5,30.0
Figueirense - SC,16.8,39.2,9.8,10.0,18.2,35.5,54.8,-19.2,96.0,8.0,34.0
América - MG,15.0,39.6,10.0,9.6,18.4,35.2,52.6,-17.4,78.0,5.8,34.4
Atlético Goianiense - GO,15.8,41.0,9.8,11.6,16.6,37.4,52.2,-14.8,93.8,6.2,35.4
Chapecoense - SC,14.4,41.0,10.0,11.0,17.0,37.3,51.7,-14.4,80.9,4.0,35.7


In [52]:
fig = px.bar(media_com_filtro, x=media_com_filtro.index, y="Saldos de Gols", color=media_com_filtro.index, title="Média de Saldo de Gols por Equipe")
fig.update_layout(
    showlegend=False,
    yaxis_title = "Média de Saldo de Gols",
    xaxis_title = "",
)
fig.show()

<h2>18 - Identificar o time c/ mais vitórias em uma edição</h2>

In [53]:
df[df['Vitórias'] == df['Vitórias'].max()]

Unnamed: 0,Ano,Colocação,Clube,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
140,2019,1,Flamengo - RJ,90,28,6,4,86,37,49,90,3,78


<h2>19 - Identificar o time c/ mais empates em uma edição</h2>

In [54]:
df[df['Empates'] == df['Empates'].max()]

Unnamed: 0,Ano,Colocação,Clube,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
29,2013,10,Corinthians - SP,50,11,17,10,27,22,5,66,3,43
165,2020,6,Grêmio - RS,59,14,17,7,53,40,13,70,8,51
190,2021,11,Ceará - CE,50,11,17,10,39,38,1,90,5,43
194,2021,15,Cuiabá - MT,47,10,17,11,34,37,-3,84,7,41


<h2>20 - Identificar o time c/ mais derrotas em uma edição</h2>

In [55]:
df[df['Derrotas'] == df['Derrotas'].max()]

Unnamed: 0,Ano,Colocação,Clube,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
39,2013,20,Náutico - PE,20,5,5,28,22,79,-57,77,3,17


<h2>21 - Identificar OS TIMES C/ MAIS VITÓRIAS no TOTAL</h1>

In [56]:
soma_colunas_por_time.sort_values('Vitórias', ascending=False).head(5)

Unnamed: 0_level_0,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos
Clube,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1
Flamengo - RJ,755,216,111,129,672,496,176,950,58
Atlético Mineiro - MG,759,214,117,125,670,502,168,1066,60
Palmeiras - SP,699,200,99,119,620,439,181,1035,61
Grêmio - RS,681,191,108,119,554,417,137,974,52
São Paulo - SP,697,188,133,135,572,473,99,1092,72


<h2>22 - Identificar OS TIMES C/ MAIS EMPATES no TOTAL</h2>

In [57]:
soma_colunas_por_time.sort_values('Empates', ascending=False).head(5)

Unnamed: 0_level_0,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos
Clube,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1
Corinthians - SP,707,188,143,125,548,429,119,916,44
São Paulo - SP,697,188,133,135,572,473,99,1092,72
Santos - SP,673,182,127,147,579,494,85,1072,69
Internacional - RS,644,175,119,124,526,432,94,1091,70
Atlético Mineiro - MG,759,214,117,125,670,502,168,1066,60


<h2>23 - Identificar OS TIMES C/ MAIS DERROTAS no TOTAL</h2>

In [58]:
soma_colunas_por_time.sort_values('Derrotas', ascending=False).head(5)

Unnamed: 0_level_0,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos
Clube,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1
Coritiba - PR,379,98,85,159,362,472,-110,873,53
Fluminense - RJ,663,183,114,159,577,529,48,1085,82
Botafogo - RJ,500,136,92,152,434,453,-19,880,47
Santos - SP,673,182,127,147,579,494,85,1072,69
Athletico Paranaense - PR,612,170,102,146,517,455,62,953,43


<h2>24 - Identificar OS TIMES C/ MAIS VITÓRIAS na MÉDIA</h2>

In [59]:
media_com_filtro.sort_values('Vitórias', ascending=False).head(5)

Unnamed: 0_level_0,Colocação,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
Clube,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1
Palmeiras - SP,5.6,63.5,18.2,9.0,10.8,56.4,39.9,16.5,94.1,5.5,55.3
Flamengo - RJ,6.1,62.9,18.0,9.2,10.8,56.0,41.3,14.7,79.2,4.8,54.7
Atlético Mineiro - MG,5.2,63.2,17.8,9.8,10.4,55.8,41.8,14.0,88.8,5.0,55.1
Grêmio - RS,5.5,61.9,17.4,9.8,10.8,50.4,37.9,12.5,88.5,4.7,53.8
Internacional - RS,7.5,58.5,15.9,10.8,11.3,47.8,39.3,8.5,99.2,6.4,51.0


In [60]:
def media_de_equipe_da_estatistica(coluna):
    fig = px.bar(media_com_filtro, x=media_com_filtro.index, y=coluna, color=media_com_filtro.index, title=f"Média de {coluna} por Clube")
    fig.update_layout(
    showlegend=False,
    xaxis_title = "",
    yaxis_title = f"Média de {coluna}"
    )
    fig.show()

In [61]:
media_de_equipe_da_estatistica("Vitórias")

<h2>25 - Identificar OS TIMES C/ MAIS EMPATES na MÉDIA</h2>

In [62]:
media_com_filtro.sort_values('Empates', ascending=False).head(5)

Unnamed: 0_level_0,Colocação,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
Clube,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1
Ceará - CE,14.0,44.4,10.4,13.2,14.4,39.0,41.8,-2.8,96.8,6.2,38.4
Red Bull Bragantino - SP,9.0,53.8,13.8,12.5,11.8,50.8,45.0,5.8,94.8,5.2,46.8
Cuiabá - MT,14.3,46.3,11.3,12.3,14.3,35.0,39.3,-4.3,89.3,7.3,40.0
Corinthians - SP,7.0,58.9,15.7,11.9,10.4,45.7,35.8,9.9,76.3,3.7,51.3
Atlético Goianiense - GO,15.8,41.0,9.8,11.6,16.6,37.4,52.2,-14.8,93.8,6.2,35.4


In [63]:
media_de_equipe_da_estatistica("Empates")

<h2>26 - Identificar OS TIMES C/ MAIS DERROTAS na MÉDIA</h2>

In [64]:
media_com_filtro.sort_values('Derrotas', ascending=False).head(5)

Unnamed: 0_level_0,Colocação,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
Clube,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1
Avaí - SC,18.5,35.0,8.2,10.2,19.5,29.8,57.5,-27.8,95.5,5.5,30.0
América - MG,15.0,39.6,10.0,9.6,18.4,35.2,52.6,-17.4,78.0,5.8,34.4
Figueirense - SC,16.8,39.2,9.8,10.0,18.2,35.5,54.8,-19.2,96.0,8.0,34.0
Coritiba - PR,15.3,42.1,10.9,9.4,17.7,40.2,52.4,-12.2,97.0,5.9,36.6
Chapecoense - SC,14.4,41.0,10.0,11.0,17.0,37.3,51.7,-14.4,80.9,4.0,35.7


In [65]:
media_de_equipe_da_estatistica("Derrotas")

<h2>27 - Identificar OS TIMES que mais vezes ficaram no G4.</h2>

In [66]:
todas_as_equipes_do_g4 = df[df["Colocação"] < 5]
todas_as_equipes_do_g4 = todas_as_equipes_do_g4['Clube'].value_counts()

In [67]:
fig = px.bar(todas_as_equipes_do_g4, title="Times que mais vezes terminaram no G4")
fig.update_layout(
    showlegend=False,
    yaxis_title="Qtd. de Vezes",
    xaxis_title = "",
)
fig.update_traces(
    hovertemplate="Clube: %{x}<br>Frequência: %{y}<extra></extra>"
)
fig.show()

<h2>28 - Identificar OS TIMES com as melhores médias de colocação.</h2>

In [68]:
media_com_filtro.sort_values('Colocação').head()

Unnamed: 0_level_0,Colocação,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
Clube,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1
Atlético Mineiro - MG,5.2,63.2,17.8,9.8,10.4,55.8,41.8,14.0,88.8,5.0,55.1
Grêmio - RS,5.5,61.9,17.4,9.8,10.8,50.4,37.9,12.5,88.5,4.7,53.8
Palmeiras - SP,5.6,63.5,18.2,9.0,10.8,56.4,39.9,16.5,94.1,5.5,55.3
Flamengo - RJ,6.1,62.9,18.0,9.2,10.8,56.0,41.3,14.7,79.2,4.8,54.7
Corinthians - SP,7.0,58.9,15.7,11.9,10.4,45.7,35.8,9.9,76.3,3.7,51.3


In [69]:
media_de_equipe_da_estatistica('Colocação')

<h2>29 - Identificar OS TIMES com as melhores médias de aproveitamento.</h2>

In [70]:
media_com_filtro.sort_values('Aproveitamento (%)', ascending=False).head()

Unnamed: 0_level_0,Colocação,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
Clube,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1
Palmeiras - SP,5.6,63.5,18.2,9.0,10.8,56.4,39.9,16.5,94.1,5.5,55.3
Atlético Mineiro - MG,5.2,63.2,17.8,9.8,10.4,55.8,41.8,14.0,88.8,5.0,55.1
Flamengo - RJ,6.1,62.9,18.0,9.2,10.8,56.0,41.3,14.7,79.2,4.8,54.7
Grêmio - RS,5.5,61.9,17.4,9.8,10.8,50.4,37.9,12.5,88.5,4.7,53.8
Corinthians - SP,7.0,58.9,15.7,11.9,10.4,45.7,35.8,9.9,76.3,3.7,51.3


In [71]:
media_de_equipe_da_estatistica('Aproveitamento (%)')

<h2>30 - Agrupar os times pelo TOTAL de cada estado</h2>

In [72]:
df_com_estados = df.copy()
df_com_estados['Estado'] = df['Clube'].apply(lambda x: x[-2:])
df_com_estados

Unnamed: 0,Ano,Colocação,Clube,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%),Estado
0,2012,1,Fluminense - RJ,77,22,11,5,61,33,28,85,3,67,RJ
1,2012,2,Atlético Mineiro - MG,72,20,12,6,64,37,27,104,10,63,MG
2,2012,3,Grêmio - RS,71,20,11,7,56,33,23,102,9,62,RS
3,2012,4,São Paulo - SP,66,20,6,12,59,37,22,93,6,57,SP
4,2012,5,Vasco da Gama - RJ,58,16,10,12,45,44,1,91,3,50,RJ
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
235,2023,16,Bahia - BA,44,12,8,18,50,53,-3,96,8,38,BA
236,2023,17,Santos - SP,43,11,10,17,39,64,-25,103,9,37,SP
237,2023,18,Goiás - GO,38,9,11,18,36,53,-17,108,8,33,GO
238,2023,19,Coritiba - PR,30,8,6,24,41,73,-32,68,6,26,PR


In [73]:
soma_infos_por_estados = df_com_estados.groupby('Estado').sum().drop(columns=['Clube', 'Ano', 'Colocação', 'Aproveitamento (%)'])
soma_infos_por_estados.index.name = 'Estado'
soma_infos_por_estados

Unnamed: 0_level_0,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos
Estado,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1
AL,32,8,8,22,24,58,-34,90,4
BA,632,162,146,224,611,705,-94,1275,77
CE,483,124,111,145,414,430,-16,934,72
GO,522,132,126,198,475,627,-152,1131,70
MG,1464,402,258,328,1272,1126,146,2272,137
MT,139,34,37,43,105,118,-13,268,22
PE,463,123,97,198,424,596,-172,919,54
PR,1014,272,198,328,897,984,-87,1924,105
RJ,2295,631,406,559,2004,1884,120,3707,237
RS,1393,380,253,279,1145,962,183,2270,134


<h2>31 - Agrupar os times pela MÉDIA de cada estado</h2>

In [74]:
media_infos_por_estados = df_com_estados.groupby('Estado').mean(numeric_only=True).drop(columns=['Ano', 'Colocação']).round(1)
media_infos_por_estados.index.name = "Estado"
media_infos_por_estados

Unnamed: 0_level_0,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
Estado,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
AL,32.0,8.0,8.0,22.0,24.0,58.0,-34.0,90.0,4.0,28.0
BA,45.1,11.6,10.4,16.0,43.6,50.4,-6.7,91.1,5.5,39.1
CE,48.3,12.4,11.1,14.5,41.4,43.0,-1.6,93.4,7.2,41.8
GO,43.5,11.0,10.5,16.5,39.6,52.2,-12.7,94.2,5.8,37.7
MG,56.3,15.5,9.9,12.6,48.9,43.3,5.6,87.4,5.3,49.0
MT,46.3,11.3,12.3,14.3,35.0,39.3,-4.3,89.3,7.3,40.0
PE,42.1,11.2,8.8,18.0,38.5,54.2,-15.6,83.5,4.9,36.5
PR,48.3,13.0,9.4,15.6,42.7,46.9,-4.1,91.6,5.0,42.0
RJ,54.6,15.0,9.7,13.3,47.7,44.9,2.9,88.3,5.6,47.4
RS,58.0,15.8,10.5,11.6,47.7,40.1,7.6,94.6,5.6,50.5


<h2>32 - Agrupar os times pelo TOTAL de CADA REGIÃO</h2>

In [75]:
regioes = {
    "Norte": ["AC", "AM", "AP", "PA", "RO", "RR", "TO"],
    "Nordeste": ["AL", "BA", "CE", "MA", "PB", "PE", "PI", "RN", "SE"],
    "Centro-Oeste": ["DF", "GO", "MS", "MT"],
    "Sudeste": ["SP", "RJ", "ES", "MG"],
    "Sul": ["RS", "PR", "SC"]
}

In [76]:
def atribuir_regiao(x):
    for regiao in regioes.keys():
        if x in regioes[regiao]:
            return regiao

In [77]:
df_com_estados['Região'] = df_com_estados['Estado'].apply(lambda x: atribuir_regiao(x))

In [78]:
soma_infos_por_regiao = df_com_estados.groupby('Região').sum().drop(columns=['Clube', 'Ano', 'Colocação', 'Aproveitamento (%)', 'Estado'])
soma_infos_por_regiao

Unnamed: 0_level_0,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos
Região,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1
Centro-Oeste,661,166,163,241,580,745,-165,1399,92
Nordeste,1610,417,362,589,1473,1789,-316,3218,207
Sudeste,7067,1927,1294,1567,6087,5355,732,11108,677
Sul,3100,821,637,936,2667,2924,-257,5834,340


<h2>33 - Agrupar os times pela MÉDIA de CADA REGIÃO</h2>

In [79]:
media_infos_por_regiao = df_com_estados.groupby('Região').mean(numeric_only=True).drop(columns=['Ano', 'Colocação']).round(1)
media_infos_por_regiao

Unnamed: 0_level_0,Pontos,Vitórias,Empates,Derrotas,Gols Feitos,Gols Sofridos,Saldos de Gols,Cartões Amarelos,Cartões Vermelhos,Aproveitamento (%)
Região,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
Centro-Oeste,44.1,11.1,10.9,16.1,38.7,49.7,-11.0,93.3,6.1,38.1
Nordeste,44.7,11.6,10.1,16.4,40.9,49.7,-8.8,89.4,5.8,38.8
Sudeste,56.1,15.3,10.3,12.4,48.3,42.5,5.8,88.2,5.4,48.7
Sul,49.2,13.0,10.1,14.9,42.3,46.4,-4.1,92.6,5.4,42.8
