# História das Olimpíadas

Após um ano de atraso por conta da pandemia de Covid-19, as atenções do mundo todo se voltaram para Tóquio, no Japão, para acompanhar mais uma edição das Olimpíadas.

No Brasil não foi diferente, e muitos se uniram para torcer por nossos atletas em diferentes competições, tanto em esportes onde o Brasil já possui tradição quanto em novos esportes.

Vamos aproveitar o clima para estudar um pouco das Olimpíadas! Utilizaremos um _dataset_ com 120 anos de dados históricos das Olimpíadas, cobrindo desde os jogos de Atenas 1896 até Rio 2016. 

Faça o download do _dataset_ em https://www.kaggle.com/heesoo37/120-years-of-olympic-history-athletes-and-results e carregue o arquivo ```athlete_events.csv``` para um DataFrame utilizando Pandas. Aproveite para explorar seu DataFrame e se familiarizar com a sua estrutura. 

OBS: Fique à vontade para acrescentar mais células Python conforme necessário em qualquer etapa do exercício.

In [1]:
import pandas as pd
import numpy as np
pd.options.display.float_format = '{:,.2f}'.format

df_olimp = pd.read_csv('athlete_events.csv')

df_olimp

Unnamed: 0,ID,Name,Sex,Age,Height,Weight,Team,NOC,Games,Year,Season,City,Sport,Event,Medal
0,1,A Dijiang,M,24.00,180.00,80.00,China,CHN,1992 Summer,1992,Summer,Barcelona,Basketball,Basketball Men's Basketball,
1,2,A Lamusi,M,23.00,170.00,60.00,China,CHN,2012 Summer,2012,Summer,London,Judo,Judo Men's Extra-Lightweight,
2,3,Gunnar Nielsen Aaby,M,24.00,,,Denmark,DEN,1920 Summer,1920,Summer,Antwerpen,Football,Football Men's Football,
3,4,Edgar Lindenau Aabye,M,34.00,,,Denmark/Sweden,DEN,1900 Summer,1900,Summer,Paris,Tug-Of-War,Tug-Of-War Men's Tug-Of-War,Gold
4,5,Christine Jacoba Aaftink,F,21.00,185.00,82.00,Netherlands,NED,1988 Winter,1988,Winter,Calgary,Speed Skating,Speed Skating Women's 500 metres,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
271111,135569,Andrzej ya,M,29.00,179.00,89.00,Poland-1,POL,1976 Winter,1976,Winter,Innsbruck,Luge,Luge Mixed (Men)'s Doubles,
271112,135570,Piotr ya,M,27.00,176.00,59.00,Poland,POL,2014 Winter,2014,Winter,Sochi,Ski Jumping,"Ski Jumping Men's Large Hill, Individual",
271113,135570,Piotr ya,M,27.00,176.00,59.00,Poland,POL,2014 Winter,2014,Winter,Sochi,Ski Jumping,"Ski Jumping Men's Large Hill, Team",
271114,135571,Tomasz Ireneusz ya,M,30.00,185.00,96.00,Poland,POL,1998 Winter,1998,Winter,Nagano,Bobsleigh,Bobsleigh Men's Four,


## 1. O Brasil nas Olimpíadas

Vamos começar estudando o desempenho do nossos próprio país. Gere um DataFrame novo contendo apenas as informações sobre atletas brasileiros.

In [2]:
df_brazil = df_olimp[df_olimp['NOC'] == 'BRA']
df_brazil

Unnamed: 0,ID,Name,Sex,Age,Height,Weight,Team,NOC,Games,Year,Season,City,Sport,Event,Medal
665,386,Alexandre Abeid,M,22.00,194.00,92.00,Brazil,BRA,1972 Summer,1972,Summer,Munich,Volleyball,Volleyball Men's Volleyball,
666,386,Alexandre Abeid,M,26.00,194.00,92.00,Brazil,BRA,1976 Summer,1976,Summer,Montreal,Volleyball,Volleyball Men's Volleyball,
668,388,Abel Carlos da Silva Braga,M,19.00,190.00,73.00,Brazil,BRA,1972 Summer,1972,Summer,Munich,Football,Football Men's Football,
781,451,Diana Monteiro Abla,F,21.00,175.00,75.00,Brazil,BRA,2016 Summer,2016,Summer,Rio de Janeiro,Water Polo,Water Polo Women's Water Polo,
1005,565,Glauclio Serro Abreu,M,26.00,185.00,75.00,Brazil,BRA,2004 Summer,2004,Summer,Athina,Boxing,Boxing Men's Middleweight,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
268652,134400,"Maria Jos ""Zz"" Bertolotti",F,26.00,190.00,,Brazil,BRA,1992 Summer,1992,Summer,Barcelona,Basketball,Basketball Women's Basketball,
269745,134976,Sieglinda Lenk Zigler,F,17.00,,,Brazil,BRA,1936 Summer,1936,Summer,Berlin,Swimming,Swimming Women's 100 metres Backstroke,
269899,135037,Moacir Zimmermann,M,32.00,184.00,70.00,Brazil,BRA,2016 Summer,2016,Summer,Rio de Janeiro,Athletics,Athletics Men's 20 kilometres Walk,
270478,135289,Zzimo Alves Calazans,M,20.00,,,Brazil,BRA,1952 Summer,1952,Summer,Helsinki,Football,Football Men's Football,


### Medalhistas

Vamos focar um pouco nos casos de sucesso do Brasil. Use o seu DataFrame anterior para filtrar apenas informações sobre **medalhistas** brasileiros. 

**DICA:** observe como a coluna ```Medal``` é representada quando o atleta não ganhou medalha.

In [3]:
df_brazil_medal = df_brazil[~df_brazil['Medal'].isna()]

df_brazil_medal

Unnamed: 0,ID,Name,Sex,Age,Height,Weight,Team,NOC,Games,Year,Season,City,Sport,Event,Medal
1651,918,Ademir Roque Kaefer,M,24.00,179.00,74.00,Brazil,BRA,1984 Summer,1984,Summer,Los Angeles,Football,Football Men's Football,Silver
1652,918,Ademir Roque Kaefer,M,28.00,179.00,74.00,Brazil,BRA,1988 Summer,1988,Summer,Seoul,Football,Football Men's Football,Silver
1668,925,Adenzia Aparecida Ferreira da Silva,F,25.00,187.00,65.00,Brazil,BRA,2012 Summer,2012,Summer,London,Volleyball,Volleyball Women's Volleyball,Gold
1733,966,Daniel Adler,M,26.00,180.00,72.00,Brazil,BRA,1984 Summer,1984,Summer,Los Angeles,Sailing,Sailing Mixed Three Person Keelboat,Silver
1856,1020,Adriana Aparecida dos Santos,F,25.00,180.00,61.00,Brazil,BRA,1996 Summer,1996,Summer,Atlanta,Basketball,Basketball Women's Basketball,Silver
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
267709,133931,Arthur Nabarrete Zanetti,M,26.00,156.00,61.00,Brazil,BRA,2016 Summer,2016,Summer,Rio de Janeiro,Gymnastics,Gymnastics Men's Rings,Silver
268211,134186,"Jos Elias ""Z Elias"" Moedim Jnior",M,19.00,178.00,75.00,Brazil,BRA,1996 Summer,1996,Summer,Atlanta,Football,Football Men's Football,Bronze
268218,134190,"Jos Marco ""Z Marco"" Nobrega Ferreira de Melo",M,29.00,190.00,86.00,Brazil-1,BRA,2000 Summer,2000,Summer,Sydney,Beach Volleyball,Beach Volleyball Men's Beach Volleyball,Silver
268219,134191,"Jos Marcelo ""Z Maria"" Ferreira",M,22.00,175.00,71.00,Brazil,BRA,1996 Summer,1996,Summer,Atlanta,Football,Football Men's Football,Bronze


### Verão vs Inverno

Você deve ter notado que temos duas categorias distintas de jogos olímpicos, representados pela estação: temos os jogos de verão e os jogos de inverno, que ocorrem de maneira intercalada.

Agora que já conhecemos os medalhistas brasileiros, resposta: quantos atletas brasileiros receberam medalha nos jogos de verão e quantos receberam nos jogos de inverno?

In [4]:
df_bmv = df_brazil_medal[df_brazil_medal['Season'] == 'Summer']
print('Esses foram os medalhistas brasileiros dos jogos de verão:',len(df_bmv))


df_bmi = df_brazil_medal[df_brazil_medal['Season'] == 'Winter']
print('Esses foram os medalhistas brasileiros dos jogos de inverno:',len(df_bmi))

Esses foram os medalhistas brasileiros dos jogos de verão: 475
Esses foram os medalhistas brasileiros dos jogos de inverno: 0


Os jogos de verão são bem mais populares do que os jogos de inverno no Brasil. Portanto, deste ponto em diante iremos focar apenas nos jogos de verão. Descarte de seu DataFrame os dados dos jogos de inverno.



In [5]:
df_brazil_medal = df_bmv

df_brazil_medal

Unnamed: 0,ID,Name,Sex,Age,Height,Weight,Team,NOC,Games,Year,Season,City,Sport,Event,Medal
1651,918,Ademir Roque Kaefer,M,24.00,179.00,74.00,Brazil,BRA,1984 Summer,1984,Summer,Los Angeles,Football,Football Men's Football,Silver
1652,918,Ademir Roque Kaefer,M,28.00,179.00,74.00,Brazil,BRA,1988 Summer,1988,Summer,Seoul,Football,Football Men's Football,Silver
1668,925,Adenzia Aparecida Ferreira da Silva,F,25.00,187.00,65.00,Brazil,BRA,2012 Summer,2012,Summer,London,Volleyball,Volleyball Women's Volleyball,Gold
1733,966,Daniel Adler,M,26.00,180.00,72.00,Brazil,BRA,1984 Summer,1984,Summer,Los Angeles,Sailing,Sailing Mixed Three Person Keelboat,Silver
1856,1020,Adriana Aparecida dos Santos,F,25.00,180.00,61.00,Brazil,BRA,1996 Summer,1996,Summer,Atlanta,Basketball,Basketball Women's Basketball,Silver
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
267709,133931,Arthur Nabarrete Zanetti,M,26.00,156.00,61.00,Brazil,BRA,2016 Summer,2016,Summer,Rio de Janeiro,Gymnastics,Gymnastics Men's Rings,Silver
268211,134186,"Jos Elias ""Z Elias"" Moedim Jnior",M,19.00,178.00,75.00,Brazil,BRA,1996 Summer,1996,Summer,Atlanta,Football,Football Men's Football,Bronze
268218,134190,"Jos Marco ""Z Marco"" Nobrega Ferreira de Melo",M,29.00,190.00,86.00,Brazil-1,BRA,2000 Summer,2000,Summer,Sydney,Beach Volleyball,Beach Volleyball Men's Beach Volleyball,Silver
268219,134191,"Jos Marcelo ""Z Maria"" Ferreira",M,22.00,175.00,71.00,Brazil,BRA,1996 Summer,1996,Summer,Atlanta,Football,Football Men's Football,Bronze


### Atletas do Brasil

Vamos conhecer um pouco melhor nossos atletas. Descubra a altura e peso médio de nossos medalhistas.

In [6]:
print('Essa é a altura média dos medalhistas brasileiros:',df_brazil_medal['Height'].mean())

print('Essa é o peso médio dos medalhistas brasileiros:',df_brazil_medal['Weight'].mean())

Essa é a altura média dos medalhistas brasileiros: 182.4945295404814
Essa é o peso médio dos medalhistas brasileiros: 76.7069351230425


Imaginamos que diferentes esportes podem beneficiar diferentes tipos físicos, certo? Então refaça a análise anterior, mas obtendo os valores médios **por esporte**.

In [7]:
print('Essa é a altura média dos medalhistas brasileiros, por esporte:',df_brazil_medal.groupby(['Sport'])['Height'].mean())

print('Essa é o peso médio dos medalhistas brasileiros, por esporte:',df_brazil_medal.groupby(['Sport'])['Weight'].mean())

Essa é a altura média dos medalhistas brasileiros, por esporte: Sport
Athletics           181.00
Basketball          185.61
Beach Volleyball    184.88
Boxing              170.00
Canoeing            175.00
Equestrianism       179.67
Football            175.80
Gymnastics          162.75
Judo                176.67
Modern Pentathlon   166.00
Sailing             181.59
Shooting            175.00
Swimming            189.11
Taekwondo           184.00
Volleyball          190.59
Name: Height, dtype: float64
Essa é o peso médio dos medalhistas brasileiros, por esporte: Sport
Athletics           74.58
Basketball          78.48
Beach Volleyball    78.16
Boxing              64.00
Canoeing            83.25
Equestrianism       75.00
Football            69.96
Gymnastics          63.75
Judo                86.29
Modern Pentathlon   55.00
Sailing             80.41
Shooting            69.00
Swimming            81.56
Taekwondo           79.50
Volleyball          81.17
Name: Weight, dtype: float64


Será que os dados acima influenciaram no interesse geral dos atletas pelo esporte ou realmente impactaram no desempenho deles? Podemos tentar descobrir se há algum tipo de correlação.

Você ainda possui o dataframe original contendo todos os atletas brasileiros, incluindo os sem medalha? Obtenha os valores médios de peso e altura por esporte daquele dataframe e compare-o com os dos medalhistas. Há alguma diferença significativa em algum esporte?

In [8]:
print('Essa é a altura média dos brasileiros, por esporte:',df_brazil.groupby(['Sport'])['Height'].mean())

print('Essa é o peso médio dos brasileiros, por esporte:',df_brazil.groupby(['Sport'])['Weight'].mean())

Essa é a altura média dos brasileiros, por esporte: Sport
Alpine Skiing           176.63
Archery                 172.60
Art Competitions           NaN
Athletics               176.20
Badminton               175.50
Basketball              190.91
Beach Volleyball        185.70
Biathlon                170.00
Bobsleigh               182.64
Boxing                  171.99
Canoeing                177.79
Cross Country Skiing    173.00
Cycling                 174.24
Diving                  167.44
Equestrianism           177.43
Fencing                 179.20
Figure Skating          156.00
Football                173.37
Freestyle Skiing        154.00
Golf                    170.00
Gymnastics              157.27
Handball                181.47
Hockey                  177.44
Judo                    173.93
Luge                    175.00
Modern Pentathlon       168.60
Rhythmic Gymnastics     164.16
Rowing                  180.55
Rugby Sevens            171.24
Sailing                 179.68
Shooting    

In [9]:
print('Essa é a diferença de altura média dos medalhistas em relação a altura média de todos os atletas brasileiros:\n',(df_brazil_medal.groupby(['Sport'])['Height'].mean()) - (df_brazil.groupby(['Sport'])['Height'].mean()))

Essa é a diferença de altura média dos medalhistas em relação a altura média de todos os atletas brasileiros:
 Sport
Alpine Skiing             NaN
Archery                   NaN
Art Competitions          NaN
Athletics                4.80
Badminton                 NaN
Basketball              -5.30
Beach Volleyball        -0.82
Biathlon                  NaN
Bobsleigh                 NaN
Boxing                  -1.99
Canoeing                -2.79
Cross Country Skiing      NaN
Cycling                   NaN
Diving                    NaN
Equestrianism            2.24
Fencing                   NaN
Figure Skating            NaN
Football                 2.43
Freestyle Skiing          NaN
Golf                      NaN
Gymnastics               5.48
Handball                  NaN
Hockey                    NaN
Judo                     2.74
Luge                      NaN
Modern Pentathlon       -2.60
Rhythmic Gymnastics       NaN
Rowing                    NaN
Rugby Sevens              NaN
Sailing      

Vemos alguns esportes onde as alturas médias são menores do que a média geral. As maiores diferenças desse grupo são:
- Basquete (-5.30);
- Canoagem (-2.79);
- Pentathlon Moderno (-2.60).

E temos grandes disparidades em alguns esportes, onde a altura média dos medalhistas é bem representativa, como:
- Atletismo (4.80);
- Ginástica olímpica (5.48);
- Natação (7.93);
- Taekwondo (10.23).

In [10]:
print('Essa é a diferença de peso médio dos medalhistas em relação ao peso médio de todos os atletas brasileiros:\n',(df_brazil_medal.groupby(['Sport'])['Weight'].mean()) - (df_brazil.groupby(['Sport'])['Weight'].mean()))

Essa é a diferença de peso médio dos medalhistas em relação ao peso médio de todos os atletas brasileiros:
 Sport
Alpine Skiing             NaN
Archery                   NaN
Art Competitions          NaN
Athletics                6.78
Badminton                 NaN
Basketball              -7.42
Beach Volleyball        -0.46
Biathlon                  NaN
Bobsleigh                 NaN
Boxing                  -0.11
Canoeing                 5.85
Cross Country Skiing      NaN
Cycling                   NaN
Diving                    NaN
Equestrianism            2.69
Fencing                   NaN
Figure Skating            NaN
Football                 2.20
Freestyle Skiing          NaN
Golf                      NaN
Gymnastics              11.29
Handball                  NaN
Hockey                    NaN
Judo                     6.00
Luge                      NaN
Modern Pentathlon       -5.67
Rhythmic Gymnastics       NaN
Rowing                    NaN
Rugby Sevens              NaN
Sailing         

Quanto ao peso médio, temos como as maiores diferenças onde a média dos pesos dos medalhistas é menor nos esportes são:
- Basquete (-7.42);
- Pentathlon Moderno(-5.67);
- Tiro ao Alvo (-7.92).

Agora, as maiores diferenças onde a média dos pesos dos medalhistas é maior nos esportes são:
- Atletismo (6.78);
- Canoagem (5.85);
- Judô (6.00);
- Natação (6.97);
- Taekwondo (15.88).

Existe um detalhe importante passando batido até agora em nossa análise: as categorias esportivas costumam ser divididas por gênero justamente por conta de diferenças físicas entre homens e mulheres que poderiam influenciar no desempenho. Compare a altura e peso médios de atletas brasileiros por esporte segmentado por sexo.

In [11]:
print('Essa é a diferença de altura média dos medalhistas em relação a altura média de todos os atletas brasileiros, por sexo:\n',(df_brazil_medal.groupby(['Sex', 'Sport'])['Height'].mean()) - (df_brazil.groupby(['Sport'])['Height'].mean()))

print('Essa é a diferença de peso médio dos medalhistas em relação ao peso médio de todos os atletas brasileiros, por sexo:\n',(df_brazil_medal.groupby(['Sex', 'Sport'])['Weight'].mean()) - (df_brazil.groupby(['Sport'])['Weight'].mean()))

Essa é a diferença de altura média dos medalhistas em relação a altura média de todos os atletas brasileiros, por sexo:
 Sex  Sport            
F    Athletics            -3.20
     Basketball           -7.54
     Beach Volleyball    -10.70
     Boxing               -4.99
     Football             -6.40
     Judo                 -5.73
     Modern Pentathlon    -2.60
     Sailing              -9.18
     Swimming            -16.18
     Taekwondo             4.23
     Volleyball           -4.32
M    Athletics             5.12
     Basketball           -3.32
     Beach Volleyball      9.88
     Boxing               -1.24
     Canoeing             -2.79
     Equestrianism         2.24
     Football              5.62
     Gymnastics            5.48
     Judo                  5.39
     Sailing               3.39
     Shooting              0.96
     Swimming              9.27
     Taekwondo            16.23
     Volleyball            7.60
Name: Height, dtype: float64
Essa é a diferença de peso 

Qual foi (ou quais foram) o maior medalhista brasileiro em quantidade total de medalhas?

In [12]:
df_bm = df_brazil_medal.drop(['Sex', 'Age', 'Height', 'Weight', 'Team', 'NOC', 'Games', 'Year', 'Season', 'City', 'Sport', 'Event'], axis=1)

In [13]:
df_bm

Unnamed: 0,ID,Name,Medal
1651,918,Ademir Roque Kaefer,Silver
1652,918,Ademir Roque Kaefer,Silver
1668,925,Adenzia Aparecida Ferreira da Silva,Gold
1733,966,Daniel Adler,Silver
1856,1020,Adriana Aparecida dos Santos,Silver
...,...,...,...
267709,133931,Arthur Nabarrete Zanetti,Silver
268211,134186,"Jos Elias ""Z Elias"" Moedim Jnior",Bronze
268218,134190,"Jos Marco ""Z Marco"" Nobrega Ferreira de Melo",Silver
268219,134191,"Jos Marcelo ""Z Maria"" Ferreira",Bronze


In [15]:
df_bm.groupby(['ID'])['Medal'].count().reset_index()

Unnamed: 0,ID,Medal
0,918,2
1,925,1
2,966,1
3,1020,2
4,1023,1
...,...,...
355,133931,2
356,134186,1
357,134190,1
358,134191,1


In [16]:
df_bm.groupby(['ID']).sum()

Unnamed: 0_level_0,Name,Medal
ID,Unnamed: 1_level_1,Unnamed: 2_level_1
918,Ademir Roque KaeferAdemir Roque Kaefer,SilverSilver
925,Adenzia Aparecida Ferreira da Silva,Gold
966,Daniel Adler,Silver
1020,Adriana Aparecida dos SantosAdriana Aparecida ...,SilverBronze
1023,"Adriana ""Adrianinha"" Moiss Pinto",Bronze
...,...,...
133931,Arthur Nabarrete ZanettiArthur Nabarrete Zanetti,GoldSilver
134186,"Jos Elias ""Z Elias"" Moedim Jnior",Bronze
134190,"Jos Marco ""Z Marco"" Nobrega Ferreira de Melo",Silver
134191,"Jos Marcelo ""Z Maria"" Ferreira",Bronze


In [17]:
ID_maismed = df_bm.groupby(['ID']).size()[df_bm.groupby(['ID']).size() == df_bm.groupby(['ID']).size().max()].reset_index()
ID_maismed

Unnamed: 0,ID,0
0,42229,5
1,106683,5


In [18]:
print('Os maiores medalhistas brasileiros em quantidade total de medalhas foram:\n',df_bm[df_bm['ID'].isin(ID_maismed['ID'])]['Name'].drop_duplicates().reset_index()['Name'].tolist())

Os maiores medalhistas brasileiros em quantidade total de medalhas foram:
 ['Torben Schmidt Grael', 'Robert Scheidt']


In [19]:
print(df_bm[df_bm['ID'] == 42229].iloc[0,1])

print(df_bm[df_bm['ID'] == 106683].iloc[0,1])

Torben Schmidt Grael
Robert Scheidt


E o(s) maior(es) em quantidade de medalhas de ouro?

In [20]:
df_bm[df_bm['Medal'] == 'Gold'].groupby(['ID']).size()

ID
925       1
2758      1
3330      1
3790      1
5093      1
         ..
129573    1
129899    1
130541    1
133931    1
134211    1
Length: 96, dtype: int64

In [21]:
df_bm[df_bm['Medal'] == 'Gold'].groupby(['ID']).size().max()

2

In [22]:
df_bm[df_bm['Medal'] == 'Gold'].groupby(['ID']).size()[(df_bm[df_bm['Medal'] == 'Gold'].groupby(['ID']).size()).values == 2].count()

13

In [23]:
ID_ouro = df_bm[df_bm['Medal'] == 'Gold']. groupby(['ID']).size()[(df_bm[df_bm['Medal'] == 'Gold'].groupby(['ID']).size()).values == df_bm[df_bm['Medal'] == 'Gold'].groupby(['ID']).size().max()].keys().tolist()
ID_ouro

[24678,
 33095,
 33630,
 33638,
 34995,
 40494,
 42229,
 53867,
 76846,
 92177,
 106683,
 109482,
 119466]

In [24]:
print('Os maiores medalhistas brasileiros em quantidade total de medalhas de ouro foram:\n',df_bm[df_bm['ID'].isin(ID_ouro)]['Name'].drop_duplicates().reset_index()['Name'].tolist())

Os maiores medalhistas brasileiros em quantidade total de medalhas de ouro foram:
 ['Adhemar Ferreira da Silva', 'Srgio "Escadinha" Dutra dos Santos', 'Fabiana "Fabi" Alvim de Oliveira', 'Fabiana Marcelino Claudino', 'Marcelo Bastos Ferreira', 'Giovane Farinazzo Gvio', 'Torben Schmidt Grael', 'Jaqueline Maria "Jaque" Pereira de Carvalho Endres', 'Maurcio Camargo Lima', 'Paula Renata Marques Pequeno', 'Robert Scheidt', 'Sheilla Tavares de Castro Blassioli', 'Thasa Daher de Menezes']


In [25]:
print(df_bm[df_bm['ID'] == 24678].iloc[0,1])
print(df_bm[df_bm['ID'] == 33095].iloc[0,1])
print(df_bm[df_bm['ID'] == 33630].iloc[0,1])
print(df_bm[df_bm['ID'] == 33638].iloc[0,1])
print(df_bm[df_bm['ID'] == 34995].iloc[0,1])
print(df_bm[df_bm['ID'] == 40494].iloc[0,1])
print(df_bm[df_bm['ID'] == 42229].iloc[0,1])
print(df_bm[df_bm['ID'] == 53867].iloc[0,1])
print(df_bm[df_bm['ID'] == 76846].iloc[0,1])
print(df_bm[df_bm['ID'] == 92177].iloc[0,1])
print(df_bm[df_bm['ID'] == 106683].iloc[0,1])
print(df_bm[df_bm['ID'] == 109482].iloc[0,1])
print(df_bm[df_bm['ID'] == 119466].iloc[0,1])

Adhemar Ferreira da Silva
Srgio "Escadinha" Dutra dos Santos
Fabiana "Fabi" Alvim de Oliveira
Fabiana Marcelino Claudino
Marcelo Bastos Ferreira
Giovane Farinazzo Gvio
Torben Schmidt Grael
Jaqueline Maria "Jaque" Pereira de Carvalho Endres
Maurcio Camargo Lima
Paula Renata Marques Pequeno
Robert Scheidt
Sheilla Tavares de Castro Blassioli
Thasa Daher de Menezes


Qual esporte rendeu mais medalhas de ouro para o Brasil? E qual rendeu mais medalhas no total?

**DICA:** tome muito cuidado nessa análise: cada **evento esportivo** rende 1 medalha. Por exemplo, quando a equipe de futebol vence, isso é considerado 1 medalha, mesmo tendo cerca de 20 atletas medalhistas na equipe. 

In [26]:
df_sport = df_brazil_medal.drop(['Sex', 'Age', 'Height', 'Weight', 'Team', 'NOC', 'Games', 'Season', 'City', 'Event', 'Name'], axis=1)

df_sport

Unnamed: 0,ID,Year,Sport,Medal
1651,918,1984,Football,Silver
1652,918,1988,Football,Silver
1668,925,2012,Volleyball,Gold
1733,966,1984,Sailing,Silver
1856,1020,1996,Basketball,Silver
...,...,...,...,...
267709,133931,2016,Gymnastics,Silver
268211,134186,1996,Football,Bronze
268218,134190,2000,Beach Volleyball,Silver
268219,134191,1996,Football,Bronze


In [27]:
df_sport.drop_duplicates(['Year', 'Sport'])

Unnamed: 0,ID,Year,Sport,Medal
1651,918,1984,Football,Silver
1652,918,1988,Football,Silver
1668,925,2012,Volleyball,Gold
1733,966,1984,Sailing,Silver
1856,1020,1996,Basketball,Silver
...,...,...,...,...
194967,97845,2016,Canoeing,Bronze
202453,101690,1996,Beach Volleyball,Silver
221565,111358,2016,Taekwondo,Bronze
263339,131784,2016,Shooting,Silver


In [28]:
df_sport.drop_duplicates(['Year', 'Sport'])[df_sport['Medal'] == 'Gold']

  df_sport.drop_duplicates(['Year', 'Sport'])[df_sport['Medal'] == 'Gold']


Unnamed: 0,ID,Year,Sport,Medal
1668,925,2012,Volleyball,Gold
4825,2758,2016,Beach Volleyball,Gold
5930,3330,1992,Volleyball,Gold
6760,3790,2004,Volleyball,Gold
9260,5093,2016,Volleyball,Gold
22613,11920,1980,Sailing,Gold
28565,14810,2016,Athletics,Gold
35353,18204,1992,Judo,Gold
41794,21544,2008,Swimming,Gold
43889,22623,2016,Boxing,Gold


In [29]:
df_sportouro = df_sport.drop_duplicates(['Year', 'Sport'])[df_sport['Medal'] == 'Gold'].groupby(['Sport'])['Medal'].count().reset_index()
df_sportouro

  df_sportouro = df_sport.drop_duplicates(['Year', 'Sport'])[df_sport['Medal'] == 'Gold'].groupby(['Sport'])['Medal'].count().reset_index()


Unnamed: 0,Sport,Medal
0,Athletics,3
1,Beach Volleyball,1
2,Boxing,1
3,Equestrianism,1
4,Football,1
5,Gymnastics,1
6,Judo,2
7,Sailing,4
8,Swimming,1
9,Volleyball,4


In [30]:
print('Esses foram os esportes que mais renderam medalhas de ouro para o Brasil:\n',df_sportouro[df_sportouro['Medal'] == df_sportouro['Medal'].max()]['Sport'].tolist())

Esses foram os esportes que mais renderam medalhas de ouro para o Brasil:
 ['Sailing', 'Volleyball']


In [31]:
df_sportmed = df_sport.drop_duplicates(['Year', 'Sport']).groupby(['Sport'])['Medal'].count().reset_index()

df_sportmed

Unnamed: 0,Sport,Medal
0,Athletics,13
1,Basketball,5
2,Beach Volleyball,6
3,Boxing,3
4,Canoeing,1
5,Equestrianism,3
6,Football,7
7,Gymnastics,2
8,Judo,10
9,Modern Pentathlon,1


In [32]:
print('Esse foi o esporte que mais rendeu medalhas em quantidade para o Brasil:\n',df_sportmed[df_sportmed['Medal'] == df_sportmed['Medal'].max()]['Sport'].tolist())

Esse foi o esporte que mais rendeu medalhas em quantidade para o Brasil:
 ['Athletics']


Cada "categoria" dentro de um esporte é considerado um evento. Por exemplo, dentro de "atletismo", temos uma competição de 100m masculina, uma de 100m feminino, um revezamento 4 x 100m masculino, um revezamento 4 x 100m feminino, uma competição de 400m masculino, uma de 400m feminino, uma maratona masculina, uma maratona feminina, e assim sucessivamente.

Sabendo disso, qual evento esportivo mais rendeu medalhas de ouro para o Brasil? E total de medalhas?

In [33]:
df_event = df_brazil_medal.drop(['Sex', 'Age', 'Height', 'Weight', 'Team', 'NOC', 'Games', 'Season', 'City', 'Sport', 'Name'], axis=1)

df_event

Unnamed: 0,ID,Year,Event,Medal
1651,918,1984,Football Men's Football,Silver
1652,918,1988,Football Men's Football,Silver
1668,925,2012,Volleyball Women's Volleyball,Gold
1733,966,1984,Sailing Mixed Three Person Keelboat,Silver
1856,1020,1996,Basketball Women's Basketball,Silver
...,...,...,...,...
267709,133931,2016,Gymnastics Men's Rings,Silver
268211,134186,1996,Football Men's Football,Bronze
268218,134190,2000,Beach Volleyball Men's Beach Volleyball,Silver
268219,134191,1996,Football Men's Football,Bronze


In [34]:
df_eventouro = df_event.drop_duplicates(['Year', 'Event'])[df_event['Medal'] == 'Gold'].groupby(['Event'])['Medal'].count().reset_index()
df_eventouro

  df_eventouro = df_event.drop_duplicates(['Year', 'Event'])[df_event['Medal'] == 'Gold'].groupby(['Event'])['Medal'].count().reset_index()


Unnamed: 0,Event,Medal
0,Athletics Men's 800 metres,1
1,Athletics Men's Pole Vault,1
2,Athletics Men's Triple Jump,2
3,Athletics Women's Long Jump,1
4,Beach Volleyball Men's Beach Volleyball,2
5,Boxing Men's Lightweight,1
6,"Equestrianism Mixed Jumping, Individual",1
7,Football Men's Football,1
8,Gymnastics Men's Rings,1
9,Judo Men's Half-Heavyweight,1


In [35]:
print('Esse foi o evento que mais rendeu medalhas de ouro para o Brasil:\n',df_eventouro[df_eventouro['Medal'] == df_eventouro['Medal'].max()]['Event'].tolist())

Esse foi o evento que mais rendeu medalhas de ouro para o Brasil:
 ["Volleyball Men's Volleyball"]


In [36]:
df_eventmed = df_event.drop_duplicates(['Year', 'Event']).groupby(['Event'])['Medal'].count().reset_index()

df_eventmed

Unnamed: 0,Event,Medal
0,Athletics Men's 200 metres,1
1,Athletics Men's 4 x 100 metres Relay,3
2,Athletics Men's 800 metres,2
3,Athletics Men's High Jump,1
4,Athletics Men's Marathon,1
...,...,...
57,Swimming Women's 10 kilometres Open Water,1
58,Taekwondo Men's Heavyweight,1
59,Taekwondo Women's Heavyweight,1
60,Volleyball Men's Volleyball,6


In [37]:
print('Esses foram os eventos que mais renderam medalhas em quantidade para o Brasil:\n',df_eventmed[df_eventmed['Medal'] == df_eventmed['Medal'].max()]['Event'].tolist())

Esses foram os eventos que mais renderam medalhas em quantidade para o Brasil:
 ["Athletics Men's Triple Jump", "Football Men's Football", "Volleyball Men's Volleyball"]


Para finalizar sobre o Brasil: obtenha o total de medalhas de ouro, prata, bronze e total por ano.

In [38]:
bm_medalano = df_sport.groupby(['Year', 'Medal'])['ID'].size().to_frame(name = 'Total').reset_index()

bm_medalano

Unnamed: 0,Year,Medal,Total
0,1920,Bronze,5
1,1920,Gold,1
2,1920,Silver,1
3,1948,Bronze,10
4,1952,Bronze,2
5,1952,Gold,1
6,1956,Gold,1
7,1960,Bronze,13
8,1964,Bronze,12
9,1968,Bronze,3


In [39]:
bm_medalano_pivot = bm_medalano.pivot(index = 'Year', columns = 'Medal', values = 'Total')

bm_medalano_pivot = bm_medalano_pivot.reindex(columns = ['Gold', 'Silver', 'Bronze'])

bm_medalano_pivot[['Gold', 'Silver', 'Bronze']] = bm_medalano_pivot[['Gold', 'Silver', 'Bronze']].fillna(value = 0)

bm_medalano_pivot

Medal,Gold,Silver,Bronze
Year,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
1920,1.0,1.0,5.0
1948,0.0,0.0,10.0
1952,1.0,0.0,2.0
1956,1.0,0.0,0.0
1960,0.0,0.0,13.0
1964,0.0,0.0,12.0
1968,0.0,1.0,3.0
1972,0.0,0.0,2.0
1976,0.0,0.0,3.0
1980,4.0,0.0,5.0


## 2. O mundo nos jogos de verão

Vamos agora analisar um pouquinho do que aconteceu nas Olimpíadas de verão em todo o mundo.

Retome o DataFrame original e descarte as informações sobre os jogos de inverno.

In [40]:
df_verao = df_olimp[df_olimp['Season'] == 'Summer']

df_verao

Unnamed: 0,ID,Name,Sex,Age,Height,Weight,Team,NOC,Games,Year,Season,City,Sport,Event,Medal
0,1,A Dijiang,M,24.00,180.00,80.00,China,CHN,1992 Summer,1992,Summer,Barcelona,Basketball,Basketball Men's Basketball,
1,2,A Lamusi,M,23.00,170.00,60.00,China,CHN,2012 Summer,2012,Summer,London,Judo,Judo Men's Extra-Lightweight,
2,3,Gunnar Nielsen Aaby,M,24.00,,,Denmark,DEN,1920 Summer,1920,Summer,Antwerpen,Football,Football Men's Football,
3,4,Edgar Lindenau Aabye,M,34.00,,,Denmark/Sweden,DEN,1900 Summer,1900,Summer,Paris,Tug-Of-War,Tug-Of-War Men's Tug-Of-War,Gold
26,8,"Cornelia ""Cor"" Aalten (-Strannood)",F,18.00,168.00,,Netherlands,NED,1932 Summer,1932,Summer,Los Angeles,Athletics,Athletics Women's 100 metres,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
271106,135565,Fernando scar Zylberberg,M,27.00,168.00,76.00,Argentina,ARG,2004 Summer,2004,Summer,Athina,Hockey,Hockey Men's Hockey,
271107,135566,"James Francis ""Jim"" Zylker",M,21.00,175.00,75.00,United States,USA,1972 Summer,1972,Summer,Munich,Football,Football Men's Football,
271108,135567,Aleksandr Viktorovich Zyuzin,M,24.00,183.00,72.00,Russia,RUS,2000 Summer,2000,Summer,Sydney,Rowing,Rowing Men's Lightweight Coxless Fours,
271109,135567,Aleksandr Viktorovich Zyuzin,M,28.00,183.00,72.00,Russia,RUS,2004 Summer,2004,Summer,Athina,Rowing,Rowing Men's Lightweight Coxless Fours,


Obtenha a lista de todos os esportes já disputados nas olimpíadas de verão.

In [41]:
print(df_verao.groupby(['Sport']).size().reset_index()['Sport'].tolist())

['Aeronautics', 'Alpinism', 'Archery', 'Art Competitions', 'Athletics', 'Badminton', 'Baseball', 'Basketball', 'Basque Pelota', 'Beach Volleyball', 'Boxing', 'Canoeing', 'Cricket', 'Croquet', 'Cycling', 'Diving', 'Equestrianism', 'Fencing', 'Figure Skating', 'Football', 'Golf', 'Gymnastics', 'Handball', 'Hockey', 'Ice Hockey', 'Jeu De Paume', 'Judo', 'Lacrosse', 'Modern Pentathlon', 'Motorboating', 'Polo', 'Racquets', 'Rhythmic Gymnastics', 'Roque', 'Rowing', 'Rugby', 'Rugby Sevens', 'Sailing', 'Shooting', 'Softball', 'Swimming', 'Synchronized Swimming', 'Table Tennis', 'Taekwondo', 'Tennis', 'Trampolining', 'Triathlon', 'Tug-Of-War', 'Volleyball', 'Water Polo', 'Weightlifting', 'Wrestling']


Obtenha a lista de todas as modalidades esportivas já disputadas nas olimpíadas de verão.

In [42]:
print(df_verao.groupby(['Event']).size().reset_index()['Event'].tolist())

['Aeronautics Mixed Aeronautics', 'Alpinism Mixed Alpinism', "Archery Men's Au Chapelet, 33 metres", "Archery Men's Au Chapelet, 50 metres", "Archery Men's Au Cordon Dore, 33 metres", "Archery Men's Au Cordon Dore, 50 metres", "Archery Men's Championnat Du Monde", "Archery Men's Continental Style", "Archery Men's Double American Round", "Archery Men's Double York Round", "Archery Men's Individual", "Archery Men's Pole Archery, Large Birds, Individual", "Archery Men's Pole Archery, Large Birds, Team", "Archery Men's Pole Archery, Small Birds, Individual", "Archery Men's Pole Archery, Small Birds, Team", "Archery Men's Sur La Perche a La Herse", "Archery Men's Sur La Perche a La Pyramide", "Archery Men's Target Archery, 28 metres, Individual", "Archery Men's Target Archery, 28 metres, Team", "Archery Men's Target Archery, 33 metres, Individual", "Archery Men's Target Archery, 33 metres, Team", "Archery Men's Target Archery, 50 metres, Individual", "Archery Men's Target Archery, 50 metres

Obtenha a lista de todos os países que já disputaram olimpíadas.

In [43]:
print(df_verao.groupby(['NOC']).size().reset_index()['NOC'].tolist())

['AFG', 'AHO', 'ALB', 'ALG', 'AND', 'ANG', 'ANT', 'ANZ', 'ARG', 'ARM', 'ARU', 'ASA', 'AUS', 'AUT', 'AZE', 'BAH', 'BAN', 'BAR', 'BDI', 'BEL', 'BEN', 'BER', 'BHU', 'BIH', 'BIZ', 'BLR', 'BOH', 'BOL', 'BOT', 'BRA', 'BRN', 'BRU', 'BUL', 'BUR', 'CAF', 'CAM', 'CAN', 'CAY', 'CGO', 'CHA', 'CHI', 'CHN', 'CIV', 'CMR', 'COD', 'COK', 'COL', 'COM', 'CPV', 'CRC', 'CRO', 'CRT', 'CUB', 'CYP', 'CZE', 'DEN', 'DJI', 'DMA', 'DOM', 'ECU', 'EGY', 'ERI', 'ESA', 'ESP', 'EST', 'ETH', 'EUN', 'FIJ', 'FIN', 'FRA', 'FRG', 'FSM', 'GAB', 'GAM', 'GBR', 'GBS', 'GDR', 'GEO', 'GEQ', 'GER', 'GHA', 'GRE', 'GRN', 'GUA', 'GUI', 'GUM', 'GUY', 'HAI', 'HKG', 'HON', 'HUN', 'INA', 'IND', 'IOA', 'IRI', 'IRL', 'IRQ', 'ISL', 'ISR', 'ISV', 'ITA', 'IVB', 'JAM', 'JOR', 'JPN', 'KAZ', 'KEN', 'KGZ', 'KIR', 'KOR', 'KOS', 'KSA', 'KUW', 'LAO', 'LAT', 'LBA', 'LBR', 'LCA', 'LES', 'LIB', 'LIE', 'LTU', 'LUX', 'MAD', 'MAL', 'MAR', 'MAS', 'MAW', 'MDA', 'MDV', 'MEX', 'MGL', 'MHL', 'MKD', 'MLI', 'MLT', 'MNE', 'MON', 'MOZ', 'MRI', 'MTN', 'MYA', 'NAM'

Qual atleta foi o maior medalhista (em medalhas totais) da história das olimpíadas de verão?

In [44]:
ID_medmundo = df_verao.groupby(['ID']).size()[df_verao.groupby(['ID']).size() == df_verao.groupby(['ID']).size().max()].reset_index()
ID_medmundo

Unnamed: 0,ID,0
0,77710,58


In [45]:
print('O maiores medalhista do mundo em quantidade total de medalhas das olimpíadas de verão foi:\n',df_verao[df_verao['ID'].isin(ID_medmundo['ID'])]['Name'].drop_duplicates().reset_index()['Name'].tolist())

O maiores medalhista do mundo em quantidade total de medalhas das olimpíadas de verão foi:
 ['Robert Tait McKenzie']


Qual atleta foi o maior medalhista de ouro da história das olimpíadas de verão?

In [46]:
ID_ouromundo = df_verao[df_verao['Medal'] == 'Gold']. groupby(['ID']).size()[(df_verao[df_verao['Medal'] == 'Gold'].groupby(['ID']).size()).values == df_verao[df_verao['Medal'] == 'Gold'].groupby(['ID']).size().max()].keys().tolist()
ID_ouromundo

[94406]

In [47]:
print('O maior medalhista do mundo em quantidade total de medalhas de ouro nas olimpíadas de verão foi:\n',df_verao[df_verao['ID'].isin(ID_ouromundo)]['Name'].drop_duplicates().reset_index()['Name'].tolist())

O maior medalhista do mundo em quantidade total de medalhas de ouro nas olimpíadas de verão foi:
 ['Michael Fred Phelps, II']


Qual país foi o maior medalhista de ouro da história das olimpíadas de verão? Lembre-se da questão do evento esportivo, para não considerar múltiplas medalhas para um mesmo evento (ex: uma equipe de futebol fazendo parecer que mais de 20 medalhas foram distribuídas).

In [48]:
df_medal_mundo = df_verao[~df_verao['Medal'].isna()]

df_medal_mundo

Unnamed: 0,ID,Name,Sex,Age,Height,Weight,Team,NOC,Games,Year,Season,City,Sport,Event,Medal
3,4,Edgar Lindenau Aabye,M,34.00,,,Denmark/Sweden,DEN,1900 Summer,1900,Summer,Paris,Tug-Of-War,Tug-Of-War Men's Tug-Of-War,Gold
37,15,Arvo Ossian Aaltonen,M,30.00,,,Finland,FIN,1920 Summer,1920,Summer,Antwerpen,Swimming,Swimming Men's 200 metres Breaststroke,Bronze
38,15,Arvo Ossian Aaltonen,M,30.00,,,Finland,FIN,1920 Summer,1920,Summer,Antwerpen,Swimming,Swimming Men's 400 metres Breaststroke,Bronze
41,17,Paavo Johannes Aaltonen,M,28.00,175.00,64.00,Finland,FIN,1948 Summer,1948,Summer,London,Gymnastics,Gymnastics Men's Individual All-Around,Bronze
42,17,Paavo Johannes Aaltonen,M,28.00,175.00,64.00,Finland,FIN,1948 Summer,1948,Summer,London,Gymnastics,Gymnastics Men's Team All-Around,Gold
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
271078,135553,Galina Ivanovna Zybina (-Fyodorova),F,25.00,168.00,80.00,Soviet Union,URS,1956 Summer,1956,Summer,Melbourne,Athletics,Athletics Women's Shot Put,Silver
271080,135553,Galina Ivanovna Zybina (-Fyodorova),F,33.00,168.00,80.00,Soviet Union,URS,1964 Summer,1964,Summer,Tokyo,Athletics,Athletics Women's Shot Put,Bronze
271082,135554,Bogusaw Zych,M,28.00,182.00,82.00,Poland,POL,1980 Summer,1980,Summer,Moskva,Fencing,"Fencing Men's Foil, Team",Bronze
271102,135563,Olesya Nikolayevna Zykina,F,19.00,171.00,64.00,Russia,RUS,2000 Summer,2000,Summer,Sydney,Athletics,Athletics Women's 4 x 400 metres Relay,Bronze


In [49]:
df_event_mundo = df_medal_mundo.drop(['Sex', 'Age', 'Height', 'Weight', 'Team', 'Games', 'Season', 'City', 'Sport', 'Name', 'ID'], axis=1)
df_event_mundo

Unnamed: 0,NOC,Year,Event,Medal
3,DEN,1900,Tug-Of-War Men's Tug-Of-War,Gold
37,FIN,1920,Swimming Men's 200 metres Breaststroke,Bronze
38,FIN,1920,Swimming Men's 400 metres Breaststroke,Bronze
41,FIN,1948,Gymnastics Men's Individual All-Around,Bronze
42,FIN,1948,Gymnastics Men's Team All-Around,Gold
...,...,...,...,...
271078,URS,1956,Athletics Women's Shot Put,Silver
271080,URS,1964,Athletics Women's Shot Put,Bronze
271082,POL,1980,"Fencing Men's Foil, Team",Bronze
271102,RUS,2000,Athletics Women's 4 x 400 metres Relay,Bronze


In [50]:
df_eventouro_mundo = df_event_mundo.drop_duplicates(['Event'])[df_event_mundo['Medal'] == 'Gold'].groupby(['NOC'])['Medal'].count().reset_index()
df_eventouro_mundo

  df_eventouro_mundo = df_event_mundo.drop_duplicates(['Event'])[df_event_mundo['Medal'] == 'Gold'].groupby(['NOC'])['Medal'].count().reset_index()


Unnamed: 0,NOC,Medal
0,AUS,2
1,AUT,3
2,AZE,1
3,BEL,8
4,BLR,3
5,BRA,1
6,BUL,2
7,CAN,5
8,CHN,6
9,CMR,1


In [51]:
print('Esse foi o país com mais medalhas de ouro da história das olimpíadas de verão:\n',df_eventouro_mundo[df_eventouro_mundo['Medal'] == df_eventouro_mundo['Medal'].max()]['NOC'].tolist())

Esse foi o país com mais medalhas de ouro da história das olimpíadas de verão:
 ['USA']


Qual país foi o maior medalhista em medalhas totais na história das olimpíadas de verão?

In [52]:
df_sport_mundo = df_medal_mundo.drop(['Sex', 'Age', 'Height', 'Weight', 'Team', 'Games', 'Season', 'City', 'Event', 'Name', 'ID'], axis=1)
df_sport_mundo

Unnamed: 0,NOC,Year,Sport,Medal
3,DEN,1900,Tug-Of-War,Gold
37,FIN,1920,Swimming,Bronze
38,FIN,1920,Swimming,Bronze
41,FIN,1948,Gymnastics,Bronze
42,FIN,1948,Gymnastics,Gold
...,...,...,...,...
271078,URS,1956,Athletics,Silver
271080,URS,1964,Athletics,Bronze
271082,POL,1980,Fencing,Bronze
271102,RUS,2000,Athletics,Bronze


In [53]:
df_sportmed_mundo = df_sport_mundo.drop_duplicates(['Year', 'Sport']).groupby(['NOC'])['Medal'].count().reset_index()

df_sportmed_mundo

Unnamed: 0,NOC,Medal
0,ALG,1
1,ANZ,2
2,ARG,5
3,ARM,1
4,AUS,15
...,...,...
74,URS,48
75,URU,3
76,USA,77
77,UZB,2


In [54]:
print('O país que mais ganhou medalhas em quantidade total de medalhas de ouro nas olimpíadas de verão foi:\n',df_sportmed_mundo[df_sportmed_mundo['Medal'] == df_sportmed_mundo['Medal'].max()]['NOC'].tolist())

O país que mais ganhou medalhas em quantidade total de medalhas de ouro nas olimpíadas de verão foi:
 ['USA']


Obtenha o total de medalhas de ouro, prata e total por edição das Olimpíadas de verão. Lembre-se da questão do evento esportivo.

In [55]:
df_sport_mundo.groupby(['Year'])['Medal'].count()
#df_eventouro_mundo

Year
1896     143
1900     604
1904     486
1906     458
1908     831
1912     941
1920    1308
1924     832
1928     734
1932     647
1936     917
1948     852
1952     897
1956     893
1960     911
1964    1029
1968    1057
1972    1215
1976    1320
1980    1384
1984    1476
1988    1582
1992    1712
1996    1842
2000    2004
2004    2001
2008    2048
2012    1941
2016    2023
Name: Medal, dtype: int64

In [56]:
medalano_mundo = df_sport_mundo.groupby(['Year', 'Medal'])['Medal'].size().to_frame(name = 'Qtd').reset_index()

medalano_mundo

Unnamed: 0,Year,Medal,Qtd
0,1896,Bronze,38
1,1896,Gold,62
2,1896,Silver,43
3,1900,Bronze,175
4,1900,Gold,201
...,...,...,...
82,2012,Gold,632
83,2012,Silver,630
84,2016,Bronze,703
85,2016,Gold,665


In [57]:
medalano_mundo_pivot = medalano_mundo.pivot(index = 'Year', columns = 'Medal', values = 'Qtd')

medalano_mundo_pivot = medalano_mundo_pivot.reindex(columns = ['Gold', 'Silver', 'Bronze', 'Total'])

medalano_mundo_pivot[['Gold', 'Silver', 'Bronze']] = medalano_mundo_pivot[['Gold', 'Silver', 'Bronze']].fillna(value = 0)

medalano_mundo_pivot['Total'] = medalano_mundo_pivot['Gold'] + medalano_mundo_pivot['Silver'] + medalano_mundo_pivot['Bronze']

medalano_mundo_pivot = medalano_mundo_pivot.drop(['Bronze'], axis=1)

medalano_mundo_pivot

Medal,Gold,Silver,Total
Year,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
1896,62,43,143
1900,201,228,604
1904,173,163,486
1906,157,156,458
1908,294,281,831
1912,326,315,941
1920,493,448,1308
1924,277,281,832
1928,245,239,734
1932,229,214,647


## 3. Brasil vs Mundo

Para finalizar, vamos fazer algumas comparações entre Brasil e mundo. Qual o ranking do Brasil em cada edição das olimpíadas? Lembrando que o ranking é ordenado por medalhas de ouro.

In [58]:
rank_mundo = df_sport_mundo.groupby(['Year', 'NOC', 'Medal'])['Medal'].size().to_frame(name = 'Qtd').reset_index()

rank_mundo

Unnamed: 0,Year,NOC,Medal,Qtd
0,1896,AUS,Bronze,1
1,1896,AUS,Gold,2
2,1896,AUT,Bronze,2
3,1896,AUT,Gold,2
4,1896,AUT,Silver,1
...,...,...,...,...
2804,2016,UZB,Silver,2
2805,2016,VEN,Bronze,2
2806,2016,VEN,Silver,1
2807,2016,VIE,Gold,1


In [59]:
rank_mundo_pivot = rank_mundo.pivot(index = ['Year', 'NOC'], columns = 'Medal', values = 'Qtd')

rank_mundo_pivot = rank_mundo_pivot.reindex(columns = ['Gold', 'Silver', 'Bronze', 'Total'])

rank_mundo_pivot[['Gold', 'Silver', 'Bronze']] = rank_mundo_pivot[['Gold', 'Silver', 'Bronze']].fillna(value = 0)

rank_mundo_pivot['Total'] = rank_mundo_pivot['Gold'] + rank_mundo_pivot['Silver'] + rank_mundo_pivot['Bronze']

rank_mundo_pivot

Unnamed: 0_level_0,Medal,Gold,Silver,Bronze,Total
Year,NOC,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
1896,AUS,2.00,0.00,1.00,3.00
1896,AUT,2.00,1.00,2.00,5.00
1896,DEN,1.00,2.00,3.00,6.00
1896,FRA,5.00,4.00,2.00,11.00
1896,GBR,3.00,3.00,3.00,9.00
...,...,...,...,...,...
2016,UKR,2.00,8.00,5.00,15.00
2016,USA,139.00,54.00,71.00,264.00
2016,UZB,4.00,2.00,7.00,13.00
2016,VEN,0.00,1.00,2.00,3.00


In [60]:
rank_mundo_pivot.index

MultiIndex([(1896, 'AUS'),
            (1896, 'AUT'),
            (1896, 'DEN'),
            (1896, 'FRA'),
            (1896, 'GBR'),
            (1896, 'GER'),
            (1896, 'GRE'),
            (1896, 'HUN'),
            (1896, 'SUI'),
            (1896, 'USA'),
            ...
            (2016, 'TPE'),
            (2016, 'TTO'),
            (2016, 'TUN'),
            (2016, 'TUR'),
            (2016, 'UAE'),
            (2016, 'UKR'),
            (2016, 'USA'),
            (2016, 'UZB'),
            (2016, 'VEN'),
            (2016, 'VIE')],
           names=['Year', 'NOC'], length=1275)

In [61]:
rank_mundo_ouro = rank_mundo_pivot.sort_values(by=['Year', 'Gold'], ascending = [True, False]).reset_index()
rank_mundo_ouro

Medal,Year,NOC,Gold,Silver,Bronze,Total
0,1896,GER,25.00,5.00,2.00,32.00
1,1896,USA,11.00,7.00,2.00,20.00
2,1896,GRE,10.00,18.00,20.00,48.00
3,1896,FRA,5.00,4.00,2.00,11.00
4,1896,GBR,3.00,3.00,3.00,9.00
...,...,...,...,...,...,...
1270,2016,QAT,0.00,1.00,0.00,1.00
1271,2016,TTO,0.00,0.00,1.00,1.00
1272,2016,TUN,0.00,0.00,3.00,3.00
1273,2016,UAE,0.00,0.00,1.00,1.00


In [62]:
#print(rank_mundo_ouro[rank_mundo_ouro['NOC']== 'BRA'].index)
#print(rank_mundo_ouro[rank_mundo_ouro['NOC']== 'BRA']['Year'].tolist())

rank_brasil_ouro = pd.DataFrame(data=rank_mundo_ouro[rank_mundo_ouro['NOC']== 'BRA'].index, index=rank_mundo_ouro[rank_mundo_ouro['NOC']== 'BRA']['Year'].tolist(), columns=['Posicao BRA'])
rank_brasil_ouro

Unnamed: 0,Posicao BRA
1920,115
1948,273
1952,307
1956,347
1960,393
1964,439
1968,486
1972,525
1976,575
1980,600


Compare o maior medalhista em ouros do Brasil com o maior medalhista em ouros do mundo.

In [63]:
print('O maior medalhista do mundo em quantidade total de medalhas de ouro nas olimpíadas de verão foi:\n',df_verao[df_verao['ID'].isin(ID_ouromundo)]['Name'].drop_duplicates().reset_index()['Name'].tolist(),'com', df_verao[df_verao['Medal'] == 'Gold'].groupby(['ID']).size()[(df_verao[df_verao['Medal'] == 'Gold'].groupby(['ID']).size()).values == df_verao[df_verao['Medal'] == 'Gold'].groupby(['ID']).size().max()].values, 'medalhas.')

print('Os maiores medalhistas brasileiros em quantidade total de medalhas de ouro foram:\n',df_bm[df_bm['ID'].isin(ID_ouro)]['Name'].drop_duplicates().reset_index()['Name'].tolist(),'com', df_bm[df_bm['Medal'] == 'Gold'].groupby(['ID']).size().max(), 'medalhas cada.')

O maior medalhista do mundo em quantidade total de medalhas de ouro nas olimpíadas de verão foi:
 ['Michael Fred Phelps, II'] com [23] medalhas.
Os maiores medalhistas brasileiros em quantidade total de medalhas de ouro foram:
 ['Adhemar Ferreira da Silva', 'Srgio "Escadinha" Dutra dos Santos', 'Fabiana "Fabi" Alvim de Oliveira', 'Fabiana Marcelino Claudino', 'Marcelo Bastos Ferreira', 'Giovane Farinazzo Gvio', 'Torben Schmidt Grael', 'Jaqueline Maria "Jaque" Pereira de Carvalho Endres', 'Maurcio Camargo Lima', 'Paula Renata Marques Pequeno', 'Robert Scheidt', 'Sheilla Tavares de Castro Blassioli', 'Thasa Daher de Menezes'] com 2 medalhas cada.


Compare o maior medalhista em total de medalhas do Brasil com o maior medalhista em total de medalhas do mundo.

In [64]:
print('O maiores medalhista do mundo em quantidade total de medalhas das olimpíadas de verão foi:\n',df_verao[df_verao['ID'].isin(ID_medmundo['ID'])]['Name'].drop_duplicates().reset_index()['Name'].tolist(),'com', ID_medmundo[0].values, 'medalhas.')

print('Os maiores medalhistas brasileiros em quantidade total de medalhas foram:\n',df_bm[df_bm['ID'].isin(ID_maismed['ID'])]['Name'].drop_duplicates().reset_index()['Name'].tolist(),'com',ID_maismed[0].mean(),'medalhas cada.')

O maiores medalhista do mundo em quantidade total de medalhas das olimpíadas de verão foi:
 ['Robert Tait McKenzie'] com [58] medalhas.
Os maiores medalhistas brasileiros em quantidade total de medalhas foram:
 ['Torben Schmidt Grael', 'Robert Scheidt'] com 5.0 medalhas cada.


Compare o maior medalhista em ouros do Brasil com o maior medalhista do mundo no mesmo esporte.

In [65]:
print('Os maiores medalhistas brasileiros em quantidade total de medalhas de ouro foram:\n',df_bm[df_bm['ID'].isin(ID_ouro)]['Name'].drop_duplicates().reset_index()['Name'].tolist(),'com', df_bm[df_bm['Medal'] == 'Gold'].groupby(['ID']).size().max(), 'medalhas cada.\n')

df_bm_sport = df_brazil_medal.drop(['Sex', 'Age', 'Height', 'Weight', 'Team', 'NOC', 'Games', 'Year', 'Season', 'City', 'Event'], axis=1)

print('Esses são os esportes nas quais temos os maiores medalhistas brasileiros em quantidade total de medalhas de ouro:', df_bm_sport[df_bm_sport['ID'].isin(ID_ouro)]['Sport'].drop_duplicates().reset_index()['Sport'].tolist())

Os maiores medalhistas brasileiros em quantidade total de medalhas de ouro foram:
 ['Adhemar Ferreira da Silva', 'Srgio "Escadinha" Dutra dos Santos', 'Fabiana "Fabi" Alvim de Oliveira', 'Fabiana Marcelino Claudino', 'Marcelo Bastos Ferreira', 'Giovane Farinazzo Gvio', 'Torben Schmidt Grael', 'Jaqueline Maria "Jaque" Pereira de Carvalho Endres', 'Maurcio Camargo Lima', 'Paula Renata Marques Pequeno', 'Robert Scheidt', 'Sheilla Tavares de Castro Blassioli', 'Thasa Daher de Menezes'] com 2 medalhas cada.

Esses são os esportes nas quais temos os maiores medalhistas brasileiros em quantidade total de medalhas de ouro: ['Athletics', 'Volleyball', 'Sailing']


In [66]:
mundo_ouro = df_medal_mundo.drop(['Sex', 'Age', 'Height', 'Weight', 'Team', 'Games', 'Season', 'City', 'Event', 'NOC'], axis=1)
df_sportouro_mundo = mundo_ouro[mundo_ouro['Medal'] == 'Gold'].groupby(['Sport','ID'])['Medal'].count().to_frame(name = 'Qtd').reset_index()

#df_sportouro_mundo[df_sportouro_mundo['Sport'] == 'Athletics']['Qtd'].max()
#df_sportouro_mundo[(df_sportouro_mundo['Sport'].isin(['Athletics', 'Volleyball', 'Sailing'])) & (df_sportouro_mundo['Qtd'] == df_sportouro_mundo[df_sportouro_mundo['Sport'].isin(['Athletics', 'Volleyball', 'Sailing'])]['Qtd'].max())]['ID'].tolist()
#df_sportouro_mundo.groupby(['Sport', 'ID']).size()

id_athletics = df_sportouro_mundo[(df_sportouro_mundo['Sport']== 'Athletics') & (df_sportouro_mundo['Qtd'] == df_sportouro_mundo[df_sportouro_mundo['Sport'] == 'Athletics']['Qtd'].max())]['ID'].tolist()
id_volleyball = df_sportouro_mundo[(df_sportouro_mundo['Sport']== 'Athletics') & (df_sportouro_mundo['Qtd'] == df_sportouro_mundo[df_sportouro_mundo['Sport'] == 'Volleyball']['Qtd'].max())]['ID'].tolist()
id_sailing = df_sportouro_mundo[(df_sportouro_mundo['Sport']== 'Athletics') & (df_sportouro_mundo['Qtd'] == df_sportouro_mundo[df_sportouro_mundo['Sport'] == 'Sailing']['Qtd'].max())]['ID'].tolist()


print("Esse foi o maior medalhista do esporte 'Athletics':", mundo_ouro[mundo_ouro['ID'].isin(id_athletics)]['Name'].drop_duplicates().values,'com',df_sportouro_mundo[(df_sportouro_mundo['Sport']== 'Athletics') & (df_sportouro_mundo['Qtd'] == df_sportouro_mundo[df_sportouro_mundo['Sport'] == 'Athletics']['Qtd'].max())]['Qtd'].drop_duplicates().tolist(),'medalhas.\n')
print("Esses foram os maiores medalhistas do esporte 'Volleyball':\n", mundo_ouro[mundo_ouro['ID'].isin(id_volleyball)]['Name'].drop_duplicates().values,'\n','com',df_sportouro_mundo[(df_sportouro_mundo['Sport']== 'Volleyball') & (df_sportouro_mundo['Qtd'] == df_sportouro_mundo[df_sportouro_mundo['Sport'] == 'Volleyball']['Qtd'].max())]['Qtd'].drop_duplicates().tolist(),'medalhas cada.\n')
print("Esses foram os maiores medalhistas do esporte 'Sailing':\n", mundo_ouro[mundo_ouro['ID'].isin(id_sailing)]['Name'].drop_duplicates().values,'com',df_sportouro_mundo[(df_sportouro_mundo['Sport']== 'Sailing') & (df_sportouro_mundo['Qtd'] == df_sportouro_mundo[df_sportouro_mundo['Sport'] == 'Sailing']['Qtd'].max())]['Qtd'].drop_duplicates().tolist(),'medalhas cada.\n')

Esse foi o maior medalhista do esporte 'Athletics': ['Raymond Clarence "Ray" Ewry'] com [10] medalhas.

Esses foram os maiores medalhistas do esporte 'Volleyball':
 ['Kenenisa Bekele Beyecha' 'Valerie Ann Brisco-Hooks'
 'Olha Arkadivna Bryzhina (Vladykina-)' 'Veronica Angella Campbell-Brown'
 'Glenn Ashby Davis' 'Yolanda Gail L. Devers (-Roberts)'
 'Tirunesh Dibaba Keneni' 'John Joseph Flanagan' 'Ugo Frigerio'
 'Delorez Florence Griffith Joyner' 'Harry Livingston Hillman, Jr.'
 'Lemuel Clarence "Bud" Houser' 'Jacqueline "Jackie" Joyner-Kersee'
 'Tatyana Vasilyevna Kazankina (-Kovalenko)' 'Steven Earl "Steve" Lewis'
 'Tianna Madison-Bartoletta' 'LaShawn Merritt' 'Bobby Joe Morrow'
 'Marie-Jos Juliana Prec (Hontas-)' 'Paul Henry Pilgrim'
 'Tamara Natanovna Press' 'Ralph Waldo Rose'
 'Wilma Glodean Rudolph (-Ward, -Eldridge)' 'Viktor Saneyev'
 'Peter George Snell' 'Renate Stecher (Meiner-)'
 'Shirley Barbara Strickland de la Hunty' 'Irena Szewiska-Kirszenstein'
 'Angelo F. Taylor, Jr.'
 '

Compare o maior medalhista em total de medalhas do Brasil com o maior medalhista do mundo no mesmo esporte.

In [67]:
df_bm_sport

Unnamed: 0,ID,Name,Sport,Medal
1651,918,Ademir Roque Kaefer,Football,Silver
1652,918,Ademir Roque Kaefer,Football,Silver
1668,925,Adenzia Aparecida Ferreira da Silva,Volleyball,Gold
1733,966,Daniel Adler,Sailing,Silver
1856,1020,Adriana Aparecida dos Santos,Basketball,Silver
...,...,...,...,...
267709,133931,Arthur Nabarrete Zanetti,Gymnastics,Silver
268211,134186,"Jos Elias ""Z Elias"" Moedim Jnior",Football,Bronze
268218,134190,"Jos Marco ""Z Marco"" Nobrega Ferreira de Melo",Beach Volleyball,Silver
268219,134191,"Jos Marcelo ""Z Maria"" Ferreira",Football,Bronze


In [68]:
print('Os maiores medalhistas brasileiros em quantidade total de medalhas foram:\n',df_bm[df_bm['ID'].isin(ID_maismed['ID'])]['Name'].drop_duplicates().reset_index()['Name'].tolist(),'com', ID_maismed[0].drop_duplicates().values, 'medalhas cada.\n')

print('Esse é o esportes em qual temos os maiores medalhistas brasileiros em quantidade total de medalhas:', df_bm_sport[df_bm_sport['ID'].isin(ID_maismed['ID'])]['Sport'].drop_duplicates().reset_index()['Sport'].tolist())


Os maiores medalhistas brasileiros em quantidade total de medalhas foram:
 ['Torben Schmidt Grael', 'Robert Scheidt'] com [5] medalhas cada.

Esse é o esportes em qual temos os maiores medalhistas brasileiros em quantidade total de medalhas: ['Sailing']


In [69]:
mundo_maismed = df_medal_mundo.drop(['Sex', 'Age', 'Height', 'Weight', 'Team', 'Games', 'Season', 'City', 'Event', 'NOC'], axis=1)
df_sportmaismed_mundo = mundo_maismed.groupby(['Sport','ID'])['Medal'].count().to_frame(name = 'Qtd').reset_index()



id_maismed_sailing = df_sportmaismed_mundo[(df_sportmaismed_mundo['Sport'] == 'Sailing') & (df_sportmaismed_mundo['Qtd']== df_sportmaismed_mundo[df_sportmaismed_mundo['Sport'] == 'Sailing']['Qtd'].max())]['ID'].tolist()

print("Esses foram os maiores medalhistas do esporte 'Sailing':\n", mundo_maismed[mundo_maismed['ID'].isin(id_maismed_sailing)]['Name'].drop_duplicates().values,'com',df_sportmaismed_mundo[(df_sportmaismed_mundo['Sport']== 'Sailing') & (df_sportmaismed_mundo['Qtd'] == df_sportmaismed_mundo[df_sportmaismed_mundo['Sport'] == 'Sailing']['Qtd'].max())]['Qtd'].drop_duplicates().tolist(),'medalhas cada.\n')

Esses foram os maiores medalhistas do esporte 'Sailing':
 ['Charles Benedict "Ben" Ainslie' 'Torben Schmidt Grael' 'Robert Scheidt'] com [5] medalhas cada.



Calcule o percentual de medalhas de ouro, prata e bronze que o Brasil ganhou em cada olimpíada.

In [79]:
result_bra = rank_mundo_ouro[rank_mundo_ouro['NOC']=='BRA']
result_mundo = rank_mundo_pivot.reset_index()

In [80]:
result_bra

Medal,Year,NOC,Gold,Silver,Bronze,Total
115,1920,BRA,1.0,1.0,5.0,7.0
273,1948,BRA,0.0,0.0,10.0,10.0
307,1952,BRA,1.0,0.0,2.0,3.0
347,1956,BRA,1.0,0.0,0.0,1.0
393,1960,BRA,0.0,0.0,13.0,13.0
439,1964,BRA,0.0,0.0,12.0,12.0
486,1968,BRA,0.0,1.0,3.0,4.0
525,1972,BRA,0.0,0.0,2.0,2.0
575,1976,BRA,0.0,0.0,3.0,3.0
600,1980,BRA,4.0,0.0,5.0,9.0


In [81]:
result_mundo

Medal,Year,NOC,Gold,Silver,Bronze,Total
0,1896,AUS,2.00,0.00,1.00,3.00
1,1896,AUT,2.00,1.00,2.00,5.00
2,1896,DEN,1.00,2.00,3.00,6.00
3,1896,FRA,5.00,4.00,2.00,11.00
4,1896,GBR,3.00,3.00,3.00,9.00
...,...,...,...,...,...,...
1270,2016,UKR,2.00,8.00,5.00,15.00
1271,2016,USA,139.00,54.00,71.00,264.00
1272,2016,UZB,4.00,2.00,7.00,13.00
1273,2016,VEN,0.00,1.00,2.00,3.00


In [90]:
result_mundo[~result_mundo['Year'].isin(result_bra['Year'])]['Year'].drop_duplicates().reset_index()

Unnamed: 0,index,Year
0,0,1896
1,10,1900
2,34,1904
3,46,1906
4,64,1908
5,83,1912
6,124,1924
7,155,1928
8,189,1932
9,217,1936


In [108]:
result_bra2 = pd.concat([result_bra.reset_index(), result_mundo[~result_mundo['Year'].isin(result_bra['Year'])]['Year'].drop_duplicates().reset_index()], keys='Year')
result_bra2 = result_bra2.drop(columns = ['index'], axis=1).fillna(value = 0)
result_bra2['NOC'] = 'BRA'
result_bra2 = result_bra2.sort_values(['Year'], ascending=True)
result_bra2 = result_bra2.reset_index().drop(columns=['level_0', 'level_1'],axis=1)
result_bra2

Unnamed: 0,Year,NOC,Gold,Silver,Bronze,Total
0,1896,BRA,0.0,0.0,0.0,0.0
1,1900,BRA,0.0,0.0,0.0,0.0
2,1904,BRA,0.0,0.0,0.0,0.0
3,1906,BRA,0.0,0.0,0.0,0.0
4,1908,BRA,0.0,0.0,0.0,0.0
5,1912,BRA,0.0,0.0,0.0,0.0
6,1920,BRA,1.0,1.0,5.0,7.0
7,1924,BRA,0.0,0.0,0.0,0.0
8,1928,BRA,0.0,0.0,0.0,0.0
9,1932,BRA,0.0,0.0,0.0,0.0


In [119]:
result_mundo2 = result_mundo.groupby('Year').sum().reset_index()
result_mundo2

Medal,Year,Gold,Silver,Bronze,Total
0,1896,62.0,43.0,38.0,143.0
1,1900,201.0,228.0,175.0,604.0
2,1904,173.0,163.0,150.0,486.0
3,1906,157.0,156.0,145.0,458.0
4,1908,294.0,281.0,256.0,831.0
5,1912,326.0,315.0,300.0,941.0
6,1920,493.0,448.0,367.0,1308.0
7,1924,277.0,281.0,274.0,832.0
8,1928,245.0,239.0,250.0,734.0
9,1932,229.0,214.0,204.0,647.0


In [163]:
result_bra2['Gold%'] = ((result_bra2['Gold'])/(result_mundo2['Gold'])*100).map("{:,.2f}%".format)
result_bra2['Silver%'] = ((result_bra2['Silver'])/(result_mundo2['Silver'])*100).map("{:,.2f}%".format)
result_bra2['Bronze%'] = ((result_bra2['Bronze'])/(result_mundo2['Bronze'])*100).map("{:,.2f}%".format)
result_bra2['Total%'] = ((result_bra2['Total'])/(result_mundo2['Total'])*100).map("{:,.2f}%".format)

result_bra2

Unnamed: 0,Year,NOC,Gold,Silver,Bronze,Total,Gold%,Silver%,Bronze%,Total%
0,1896,BRA,0.0,0.0,0.0,0.0,0.00%,0.00%,0.00%,0.00%
1,1900,BRA,0.0,0.0,0.0,0.0,0.00%,0.00%,0.00%,0.00%
2,1904,BRA,0.0,0.0,0.0,0.0,0.00%,0.00%,0.00%,0.00%
3,1906,BRA,0.0,0.0,0.0,0.0,0.00%,0.00%,0.00%,0.00%
4,1908,BRA,0.0,0.0,0.0,0.0,0.00%,0.00%,0.00%,0.00%
5,1912,BRA,0.0,0.0,0.0,0.0,0.00%,0.00%,0.00%,0.00%
6,1920,BRA,1.0,1.0,5.0,7.0,0.20%,0.22%,1.36%,0.54%
7,1924,BRA,0.0,0.0,0.0,0.0,0.00%,0.00%,0.00%,0.00%
8,1928,BRA,0.0,0.0,0.0,0.0,0.00%,0.00%,0.00%,0.00%
9,1932,BRA,0.0,0.0,0.0,0.0,0.00%,0.00%,0.00%,0.00%
