# SOMENTE O ITEM 1 É OBRIGATÓRIO PARA APRESENTAÇÃO!

# História das Olimpíadas - Parte 2
_(créditos ao prof. Rafael Moreira)_

Você recentemente trabalhou (ou está trabalhando) em uma análise de dados históricos dos jogos olímpicos utilizando o Pandas para auxiliá-lo.

Desde que você iniciou seus trabalhos nesse projeto, novas ferramentas bastante poderosas foram ensinadas! O seu papel agora será utilizar essas novas ferramentas para gerar algumas visualizações que tornarão certas informações muito mais claras.

Utilize qualquer uma das bibliotecas estudadas (```matplotlib```, ```seaborn``` e ```plotly```) para realizar as atividades propostas. Não há problema em usar apenas uma para realizar todas as atividades, nem em utilizar cada uma delas em uma atividade diferente - siga suas preferências pessoais!

Utilize os (muitos) parâmetros permitidos por cada função e/ou atributos dos objetos fornecidos pelas bibliotecas para criar uma identidade visual coesa para ser utilizada em todo o projeto. Use títulos, legendas e rótulos nos eixos para deixar os gráficos verdadeiramente informativos. E não se esqueça que a simples escolha das cores a serem utilizadas pode tornar os gráficos ainda mais interessantes!

Você utilizará o mesmo dataset fornecido no projeto anterior. Não há problemas em reaproveitar códigos do projeto anterior para economizar tempo e focar seus esforços na geração dos gráficos.

Para começar, importe o Pandas e carregue o arquivo ```athlete_events.csv``` fornecido no projeto anterior.

In [214]:
import pandas as pd
import numpy as np
import plotly.express as px
# importando os dados para um dataframe
df_olympics = pd.read_csv('./dados/athlete_events.csv')

## 1. O Brasil nas Olimpíadas

Vamos começar filtrando novamente os dados que iremos trabalhar. Crie um DataFrame contendo apenas informações sobre atletas **medalhistas** brasileiros.

In [215]:
# gerando dataframe somente com os dados do Brasil
df_brazil = df_olympics[(df_olympics['NOC']=="BRA") & (df_olympics['Medal'].notna())].copy()
df_brazil

Unnamed: 0,ID,Name,Sex,Age,Height,Weight,Team,NOC,Games,Year,Season,City,Sport,Event,Medal
1651,918,Ademir Roque Kaefer,M,24.0,179.0,74.0,Brazil,BRA,1984 Summer,1984,Summer,Los Angeles,Football,Football Men's Football,Silver
1652,918,Ademir Roque Kaefer,M,28.0,179.0,74.0,Brazil,BRA,1988 Summer,1988,Summer,Seoul,Football,Football Men's Football,Silver
1668,925,Adenzia Aparecida Ferreira da Silva,F,25.0,187.0,65.0,Brazil,BRA,2012 Summer,2012,Summer,London,Volleyball,Volleyball Women's Volleyball,Gold
1733,966,Daniel Adler,M,26.0,180.0,72.0,Brazil,BRA,1984 Summer,1984,Summer,Los Angeles,Sailing,Sailing Mixed Three Person Keelboat,Silver
1856,1020,Adriana Aparecida dos Santos,F,25.0,180.0,61.0,Brazil,BRA,1996 Summer,1996,Summer,Atlanta,Basketball,Basketball Women's Basketball,Silver
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
267709,133931,Arthur Nabarrete Zanetti,M,26.0,156.0,61.0,Brazil,BRA,2016 Summer,2016,Summer,Rio de Janeiro,Gymnastics,Gymnastics Men's Rings,Silver
268211,134186,"Jos Elias ""Z Elias"" Moedim Jnior",M,19.0,178.0,75.0,Brazil,BRA,1996 Summer,1996,Summer,Atlanta,Football,Football Men's Football,Bronze
268218,134190,"Jos Marco ""Z Marco"" Nobrega Ferreira de Melo",M,29.0,190.0,86.0,Brazil-1,BRA,2000 Summer,2000,Summer,Sydney,Beach Volleyball,Beach Volleyball Men's Beach Volleyball,Silver
268219,134191,"Jos Marcelo ""Z Maria"" Ferreira",M,22.0,175.0,71.0,Brazil,BRA,1996 Summer,1996,Summer,Atlanta,Football,Football Men's Football,Bronze


Vamos caracterizar fisicamente nossos medalhistas, verificando se há alguma correlação entre o desempenho em certos esportes e o tipo físico dos atletas. 

Gere um gráfico de barras contendo os diferentes esportes no eixo X e a altura dos atletas no eixo Y. Utilize barras lado-a-lado para separar atletas do sexo masculino e feminino.

In [216]:
df_sex_height_sport = df_brazil.groupby(by=['Sport','Sex'])['Height'].mean().unstack().reset_index(level=0)
df_sex_height_sport.rename_axis(columns=None, inplace=True)
df_sex_height_sport = pd.melt(df_sex_height_sport, id_vars=['Sport'], value_vars=['M','F'], var_name = 'Sex', value_name = 'Height')

fig = px.bar(df_sex_height_sport, 
            x = "Sport", 
            color = "Sex", 
            y = "Height", 
            title = "Sex Height per Sport", 
            text = "Height", 
            barmode = "group",
            hover_data = {'Height':':.1f'},
            labels = {'Height':"Height (cm)"}
            )
fig.update_traces(texttemplate = '%{text:.1f}')

fig.show()

Agora gere um gráfico semelhante ilustrando o peso dos atletas.

In [217]:
df_sex_weight_sport = df_brazil.groupby(by=['Sport','Sex'])['Weight'].mean().unstack().reset_index(level=0)
df_sex_weight_sport.rename_axis(columns=None, inplace=True)
df_sex_weight_sport = pd.melt(df_sex_weight_sport, id_vars=['Sport'], value_vars=['M','F'], var_name = 'Sex', value_name = 'Weight')

fig = px.bar(df_sex_weight_sport, 
            x = "Sport", 
            color = "Sex", 
            y = "Weight", 
            title = "Sex Weight per Sport", 
            text = "Weight", 
            barmode = "group",
            hover_data = {'Weight':':.2f'},
            labels = {'Weight':"Weight (kg)"}
            )
fig.update_traces(texttemplate = '%{text:.2f}')

fig.show()

Vamos analisar agora as medalhas que nossos atletas trouxeram para casa.

Encontre os maiores medalhistas brasileiros em **total de medalhas**. Em seguida, faça um gráfico de barras empilhadas. No eixo X coloque o nome dos atletas, e no eixo Y coloque o número de medalhas. Utilize as barras empilhadas para mostrar, respectivamente, as medalhas de bronze, prata e ouro de cada atleta.

In [218]:
df_most_medals = df_brazil.groupby(['Name','Medal'])['Medal'].count().unstack().reset_index(level=0)
df_most_medals = df_most_medals.fillna(0)
df_most_medals['Total'] = df_most_medals['Bronze'] + df_most_medals['Gold'] + df_most_medals['Silver']
df_most_medals = df_most_medals.sort_values('Total', ascending=False).reset_index(drop=True)
df_most_medals = df_most_medals.iloc[:20,:]
df_most_medals.rename_axis(columns=None, inplace=True)
df_most_medals = pd.melt(df_most_medals, id_vars=['Name'], value_vars=['Bronze','Silver','Gold'], var_name = 'Medals', value_name = 'Quant')

fig = px.bar(df_most_medals, 
            x="Name", 
            color = "Medals", 
            y="Quant", 
            title = "Medals per Athlete", 
            text = "Quant", 
            barmode = "stack",
            color_discrete_map={'Bronze':'olive','Silver':'silver','Gold':'gold'}
            )
fig.update_traces(textposition='inside')

fig.show()

Agora gere o mesmo gráfico de barras empilhadas substituindo os nomes dos atletas pelo nome de todos os esportes onde o Brasil já ganhou medalhas.

**DICA:** tome muito cuidado nessa análise: cada **evento esportivo** rende 1 medalha. Por exemplo, quando a equipe de futebol vence, isso é considerado 1 medalha, mesmo tendo cerca de 20 atletas medalhistas na equipe. 

In [219]:
df_brazil_medals_sport = df_brazil.groupby(by=["Year","Sport","Event","Medal"])["Event"].nunique().to_frame('Quant').reset_index()
df_brazil_medals_sport = df_brazil_medals_sport.drop(labels='Year',axis=1).groupby(by=['Sport','Medal']).sum().reset_index()
df_brazil_medals_sport['Medal_cat'] = pd.Categorical(df_brazil_medals_sport['Medal'],
                                                categories=["Bronze","Silver","Gold"], 
                                                ordered=True
                                                )
df_brazil_medals_sport=df_brazil_medals_sport.sort_values(['Sport','Medal_cat'])
df_brazil_medals_sport = df_brazil_medals_sport.drop(labels=['Medal_cat'],axis=1)

fig = px.bar(df_brazil_medals_sport, 
            x = "Sport",  
            color = 'Medal',
            y = "Quant", 
            title = "Medals per Sport", 
            text = "Quant", 
            barmode = "stack",
            color_discrete_map={'Bronze':'olive','Silver':'silver','Gold':'gold'}
            )
fig.update_traces(textposition='inside',textangle=0,textfont_size=12)

fig.show()

Mais um gráfico de barras empilhadas: agora mostre os **eventos esportivos** que renderam medalhas para o Brasil.

Lembrando: cada "categoria" dentro de um esporte é considerado um evento. Por exemplo, dentro de "atletismo", temos uma competição de 100m masculina, uma de 100m feminino, um revezamento 4 x 100m masculino, um revezamento 4 x 100m feminino, uma competição de 400m masculino, uma de 400m feminino, uma maratona masculina, uma maratona feminina, e assim sucessivamente.

In [220]:
df_brazil_medals_event = df_brazil.groupby(by=["Year","Event","Medal"])["Event"].nunique().to_frame('Quant').reset_index()
df_brazil_medals_event = df_brazil_medals_event.drop(labels='Year',axis=1).groupby(by=['Event','Medal']).sum().reset_index()
df_brazil_medals_event

fig = px.bar(df_brazil_medals_event, 
            x = "Event",  
            color = 'Medal',
            y = "Quant", 
            title = "Medals per Event", 
            text = "Quant", 
            barmode = "stack",
            color_discrete_map={'Bronze':'olive','Silver':'silver','Gold':'gold'}
            )
fig.update_xaxes(tickfont_size=9,tickangle=45)
fig.update_traces(textposition='inside',textangle=0)

fig.show()

Utilize um gráfico de distribuição (como um histograma, por exemplo) ilustrando a quantidade total de medalhas do Brasil por esporte.

In [221]:
df_brazil_medals_sport_total = df_brazil_medals_sport.groupby(by='Sport')['Quant'].sum().to_frame('Total').reset_index()
fig = px.histogram(df_brazil_medals_sport_total, x="Sport",y="Total")
fig.update_yaxes(title_text='Total of Medals')
fig.show()

Repita o procedimento acima, mas com medalhas de ouro.

In [222]:
df_brazil_medals_sport_gold = df_brazil_medals_sport[df_brazil_medals_sport['Medal']=='Gold'].groupby(by='Sport')['Quant'].sum().to_frame('Total').reset_index()
df_brazil_medals_sport_gold
fig = px.histogram(df_brazil_medals_sport_gold, x="Sport",y="Total",color_discrete_sequence=["gold"])
fig.update_yaxes(title_text='Total of Golds')
fig.show()

Agora faça um gráfico de setores (pizza) mostrando a distribuição de medalhas de ouro do Brasil por esporte.

In [223]:
fig = px.pie(df_brazil_medals_sport_gold, values='Total', names='Sport', title='Sport´s Total Gold')
fig.show()

Para finalizar a história do Brasil, vamos ver a série temporal de medalhas brasileiras. Crie um gráfico de linhas contendo 3 linhas: ouro, prata e bronze. Coloque no eixo X a edição da olimpíada (em ordem cronológica) e no eixo Y o total de medalhas de cada tipo.

In [224]:
df_brazil_medals_year = df_brazil.groupby(by=["Year","Event","Medal"])["Event"].nunique().to_frame('Quant').reset_index()
df_brazil_medals_year = df_brazil_medals_year.groupby(by=["Year","Medal"])["Quant"].sum().unstack().reset_index()
df_brazil_medals_year = df_brazil_medals_year.fillna(0)
df_brazil_medals_year.rename_axis(columns=None, inplace=True)
df_years = pd.DataFrame(np.sort(df_olympics[df_olympics['Season']=="Summer"]['Year'].unique()))
df_years.rename(columns={0:'Year'},inplace=True)
df_years = df_years.merge(df_brazil_medals_year,how='left')
df_years = df_years.fillna(0)
df_years[["Bronze","Silver","Gold"]] = df_years[["Bronze","Silver","Gold"]].astype(int).astype(str)
fig = px.scatter(df_years, 
                 x="Year", 
                 y=['Bronze','Silver','Gold'], 
                 title='Total Medals per Olympics', 
                 color_discrete_map={'Bronze':'olive','Silver':'silver','Gold':'gold'}, 
                )
fig.update_traces(mode="lines+markers+text",textposition="top center") 
fig.update_traces(patch={'text':df_years['Silver']},selector={'name':'Silver'})
fig.update_traces(patch={'text':df_years['Gold']},selector={'name':'Gold'})
fig.update_traces(patch={'text':df_years['Bronze']},selector={'name':'Bronze'})
fig.update_yaxes(title_text='Total of Medals')
fig.update_layout(legend={'title':'Medal'})
fig.show()

## 2. O mundo nos jogos de verão

Filtre o DataFrame original para conter apenas informações sobre os **medalhistas** de todos os países **nos jogos de verão**.



In [228]:
df_medalists = df_olympics[(df_olympics['Medal'].notna())&(df_olympics['Season']=="Summer")]

Utilizando subplots, crie 2 boxplots ilustrando a quantidade de medalhas por atleta. Em um deles, considere todos os atletas. No segundo, experimente remover os *outliers*.

In [288]:
from plotly.subplots import make_subplots
import plotly.graph_objects as go

df_medals_athlete = df_medalists.groupby(by='Name')['Medal'].count().to_frame('Medal').reset_index()

fig = make_subplots(rows=1,cols=2)
fig.add_trace(go.Box(y=df_medals_athlete["Medal"], name='Athlete'),row=1,col=1)
fig.update_layout(yaxis={'title':"Medals"},title = "Medals per Athlete",showlegend=False)
m = df_medals_athlete['Medal'].std()
q1 = df_medals_athlete['Medal'].quantile(0.25)
q3 = df_medals_athlete['Medal'].quantile(0.75)
iqr = q3 - q1
df_houses_nooutliers = df_medals_athlete[~((df_medals_athlete['Medal'] < (q1 - 1.5 * iqr)) |(df_medals_athlete['Medal'] > (q3 + 1.5 * iqr)))]
fig.add_trace(go.Box(y=df_houses_nooutliers["Medal"], name='Athlete'),row=1,col=2)
fig.show()

Descubra o total de medalhas de ouro de cada país (lembrando-se da restrição dos eventos esportivos, para não contabilizar múltiplas medalhas em esportes de equipe!).

Agora pegue os 10 países com mais medalhas e crie uma categoria "Outros" para o restante dos países. Exiba um gráfico de pizza mostrando a distribuição de medalhas de ouro entre essas 11 "equipes".

In [361]:
df_medals = df_medalists.groupby(by=["Year","NOC","Event","Medal"])["Event"].nunique().to_frame('Quant').reset_index()
df_gold = df_medals[df_medals['Medal']=="Gold"]
df_gold_country = df_gold.groupby(by=["NOC"])["Quant"].sum().sort_values(ascending=False).to_frame("Gold").reset_index()
df_gold_country_top10 = df_gold_country.iloc[:10].copy()
df_gold_country_top10.loc[df_gold_country_top10.shape[0]] =  ['Others',df_gold_country["Gold"][10:].sum()]

fig = px.pie(df_gold_country_top10, values='Gold', names='NOC', title="Countries' Gold")
fig.update_layout(showlegend=False)
fig.update_traces(textposition='inside', textinfo='percent+label')
fig.show()


NOC      USA
Gold    1035
Name: 0, dtype: object


Repita o procedimento acima, mas mostrando o total de medalhas ao invés de apenas medalhas de ouro.

In [362]:
df_medals = df_medalists.groupby(by=["Year","NOC","Event","Medal"])["Event"].nunique().to_frame('Quant').reset_index()
df_medals_country = df_medals.groupby(by=["NOC"])["Quant"].sum().sort_values(ascending=False).to_frame("Medal").reset_index()

df_medals_country_top10 = df_medals_country.iloc[:10].copy()
df_medals_country_top10.loc[df_medals_country_top10.shape[0]] =  ['Others',df_medals_country["Medal"][10:].sum()]
fig = px.pie(df_medals_country_top10, values='Medal', names='NOC', title="Countries' Medals")
fig.update_layout(showlegend=False)
fig.update_traces(textposition='inside', textinfo='percent+label')
fig.show()

Crie um gráfico de barras empilhadas, com cada país das categorias acima no eixo X, total de medalhas no eixo Y, e barras empilhadas representando as medalhas de ouro, prata e bronze de cada país.

In [384]:
df_medals_type_country= df_medals[df_medals["NOC"].isin(df_medals_country_top10["NOC"])].groupby(by=["NOC","Medal"])["Quant"].sum().sort_values(ascending=False).to_frame("Quant").reset_index()

df_medals_type_country['Medal_cat'] = pd.Categorical(df_medals_type_country['Medal'],
                                                categories=["Bronze","Silver","Gold"], 
                                                ordered=True
                                                )
df_medals_type_country = df_medals_type_country.sort_values(['Medal_cat'])
df_medals_type_country = df_medals_type_country.drop(labels=['Medal_cat'],axis=1)

fig = px.bar(df_medals_type_country, 
            x = "NOC",  
            color = 'Medal',
            y = "Quant", 
            title = "Medals per Country", 
            text = "Quant", 
            barmode = "stack",
            color_discrete_map={'Bronze':'olive','Silver':'silver','Gold':'gold'}
            )
fig.update_xaxes(tickfont_size=9,tickangle=45)
fig.update_traces(textposition='inside',textangle=0)
fig.update_layout(xaxis={'categoryorder':'total descending'})

Crie um gráfico de distribuição (por exemplo, um histograma) mostrando a quantidade total de medalhas por país.

In [387]:
df_medals_country_top10 = df_medals_country[df_medals_country["NOC"].isin(df_medals_country_top10["NOC"])]
fig = px.histogram(df_medals_country_top10, x="NOC",y="Medal", title = "Medals Top 10 Countries")
fig.update_yaxes(title_text='Total of Medals per Country')
fig.show()

**Desafio bônus:** Crie uma visualização da quantidade de medalhas de ouro e outra para quantidade total de medalhas por país, ambas utilizando mapas. Utilize o tipo de mapa que achar mais adequado.

## 3. Brasil vs Mundo

Faça um gráfico de barras comparando os maiores medalhistas brasileiros com os maiores medalhistas do mundo em suas respectivas categorias.

Represente o esporte no eixo X, a quantidade de medalhas no eixo Y, coloque barras lado-a-lado representando os diferentes atletas de uma mesma modalidade e empilhe as medalhas de ouro, prata e bronze de cada atleta.

In [589]:
# contando o número de medalhas por atleta e depois filtrando o maior
df_total_medals_athlete_brazil= df_brazil.groupby(by='Name')['Medal'].count().sort_values(ascending=False)
df_total_medals_athlete_brazil = df_total_medals_athlete_brazil.iloc[:10]

# obtendo a série com os nomes do esporte que o Brasil mais teve medalha
array_sport_name_athlete_most_medal_brazil = df_brazil[df_brazil['Name'].isin(df_total_medals_athlete_brazil.index)]['Sport'].unique()

df_most_medals_athlete_brazil = df_brazil[df_brazil['Name'].isin(df_total_medals_athlete_brazil.index)][['Name','Sport','NOC','Medal']]

df_most_medals_athlete_brazil = df_most_medals_athlete_brazil.groupby(by=["Sport","Name"])['Medal'].count().reset_index().sort_values(["Sport","Medal"],ascending=False)
df_most_medals_athlete_brazil = df_most_medals_athlete_brazil.groupby(by=["Sport"]).first().reset_index()
df_most_medals_athlete_brazil = df_brazil[df_brazil['Name'].isin(df_most_medals_athlete_brazil["Name"])][['Name','NOC','Sport','Medal']]
df_most_medals_athlete_brazil = df_most_medals_athlete_brazil.groupby(by=["Name","Sport",'NOC',"Medal"])["Medal"].count().unstack().reset_index()
df_most_medals_athlete_brazil.rename_axis(columns=None, inplace=True)

# obtendo dataframe com o nome dos atletas com medalhas no mesmo esporte que o Brasil mais obteve medalhas e
# agrupado por atleta e esporte, calculando-se a soma de medalhas
df_total_medal_athlete_sport = df_medalists[(df_medalists['Sport'].isin(array_sport_name_athlete_most_medal_brazil))&(df_medalists['NOC']!="BRA")].groupby(by=['Sport','Name'])['Medal'].count().to_frame('Quant').reset_index()

df_total_medal_athlete_sport = df_total_medal_athlete_sport.sort_values(['Sport','Quant','Name'],ascending=False).groupby("Sport").first().reset_index()
df_most_medals_athlete_sport = df_medalists[df_medalists['Name'].isin(df_total_medal_athlete_sport["Name"])][['Name','NOC','Sport','Medal']]
df_most_medals_athlete_sport = df_most_medals_athlete_sport.groupby(by=["Name","Sport",'NOC',"Medal"])["Medal"].count().unstack().reset_index()
df_most_medals_athlete_sport.rename_axis(columns=None, inplace=True)
df_most_medals = pd.concat([df_most_medals_athlete_brazil,df_most_medals_athlete_sport])

sports = list(df_most_medals['Sport'].unique()) 
medals = ['Bronze','Silver','Gold']
colors = {'Bronze':'olive','Silver':'silver','Gold':'gold'}
names = list(df_most_medals['Name'].unique()) 

fig = go.Figure()

fig.update_layout(
    xaxis=dict(title_text="Sport"),
    yaxis=dict(title_text="Quant of Medals"),
    barmode="stack",
    showlegend= False,
)


for sport in sports:
    athletes = list(df_most_medals[df_most_medals['Sport']==sport]['Name'])
    for athlete in athletes:
        country = df_most_medals[df_most_medals['Name']==athlete]['NOC'].unique()
        for medal in medals:
            if country == "BRA":
                fig.add_trace(go.Bar(x=[df_most_medals[df_most_medals['Sport']==sport]['Sport'],[athlete]],
                                    y=df_most_medals[df_most_medals['Name']==athlete][medal],
                                    marker_color=colors[medal],
                                    text= df_most_medals[df_most_medals['Name']==athlete][medal],
                                    textposition='inside'
                                    )
                              )
            else:
                fig.add_trace(go.Bar(x=[df_most_medals[df_most_medals['Sport']==sport]['Sport'],[athlete]],
                                    y=df_most_medals[df_most_medals['Name']==athlete][medal],
                                    marker_color=colors[medal],
                                    text = df_most_medals[df_most_medals['Name']==athlete][medal],
                                    textposition='inside'
                                    )
                              )
fig.update_xaxes(tickfont_size=10,tickangle=45)
fig.show()

Repita o procedimento acima, mas ao invés de atletas, considere o(s) esporte(s) onde o Brasil mais possui medalha comparando-os com o país com maior quantidade de medalhas naquele esporte.

In [595]:
df_total_medals_sport_brazil= df_brazil.groupby(by='Sport')['Medal'].count().sort_values(ascending=False)
df_total_medals_sport_brazil = df_total_medals_athlete_brazil.iloc[:5]

array_sport_name_most_medal_brazil = df_brazil[df_brazil['Sport'].isin(df_total_medals_sport_brazil.index)]['Sport'].unique()

df_most_medals_sport_brazil = df_brazil[df_brazil['Sport'].isin(df_total_medals_sport_brazil.index)][['Sport','NOC','Medal']]

df_total_medals_sport_world = df_most_medals_sport_brazil.groupby(by=["Sport"])['Medal'].count().reset_index().sort_values(["Sport","Medal"],ascending=False)
df_most_medals_sport_brazil = df_most_medals_sport_brazil.groupby(by=["Sport"]).first().reset_index()
df_most_medals_sport_brazil = df_brazil[df_brazil['Sport'].isin(df_most_medals_sport_brazil["Sport"])][['NOC','Sport','Medal']]
df_most_medals_sport_brazil = df_most_medals_sport_brazil.groupby(by=["Sport",'NOC',"Medal"])["Medal"].count().unstack().reset_index()
df_most_medals_sport_brazil.rename_axis(columns=None, inplace=True)


df_total_medals_sport_world = df_medalists[(df_medalists['Sport'].isin(array_sport_name_most_medal_brazil))&(df_medalists['NOC']!="BRA")].groupby(by=['Sport'])['Medal'].count().to_frame('Quant').reset_index()

df_total_medals_sport_world = df_total_medal_athlete_sport.sort_values(['Sport','Quant'],ascending=False).groupby("Sport").first().reset_index()
df_total_medals_sport_world = df_medalists[df_medalists['Sport'].isin(df_total_medals_sport_world["Sport"])][['Sport','NOC','Medal']]
df_total_medals_sport_world = df_total_medals_sport_world.groupby(by=["Sport",'NOC',"Medal"])["Medal"].count().unstack().reset_index()
df_total_medals_sport_world.rename_axis(columns=None, inplace=True)
df_most_medals = pd.concat([df_total_medals_sport_world,df_total_medals_sport_world])

sports = list(df_most_medals['Sport'].unique()) 
medals = ['Bronze','Silver','Gold']
colors = {'Bronze':'olive','Silver':'silver','Gold':'gold'}
names = list(df_most_medals['NOC'].unique()) 

fig = go.Figure()

fig.update_layout(
    xaxis=dict(title_text="Sport"),
    yaxis=dict(title_text="Quant of Medals"),
    barmode="stack",
    showlegend= False,
)


for sport in sports:
    countries = list(df_most_medals[df_most_medals['Sport']==sport]['NOC'])
    for country in countries:
        for medal in medals:
            if country == "BRA":
                fig.add_trace(go.Bar(x=[df_most_medals[df_most_medals['Sport']==sport]['Sport'],[country]],
                                    y = df_most_medals[df_most_medals['NOC']==country][medal],
                                    marker_color=colors[medal],
                                    text= df_most_medals[df_most_medals['NOC']==country][medal],
                                    textposition='inside'
                                    )
                              )
            else:
                fig.add_trace(go.Bar(x=[df_most_medals[df_most_medals['Sport']==sport]['Sport'],[country]],
                                    y=df_most_medals[df_most_medals['NOC']==country][medal],
                                    marker_color=colors[medal],
                                    text = df_most_medals[df_most_medals['NOC']==country][medal],
                                    textposition='inside'
                                    )
                              )
fig.update_xaxes(tickfont_size=10,tickangle=45)
fig.show()

Para finalizar, repita os gráficos que você gerou com os 10 países com mais medalhas, mas remova o Brasil da categoria "Outros" e mostre-o também no gráfico.