In [None]:
# Filtrar o DataFrame para o cargo de 'Data Scientist'
df_data_scientist = df_limpo[df_limpo['cargo'] == 'Data Scientist']

# Agrupando por localização da empresa e calcular a média salarial em USD
df_salario_por_pais = df_data_scientist.groupby('empresa')['usd'].mean().reset_index()

# Mapeamento de códigos de país para nomes completos em português do Brasil
# Este dicionário contém os códigos de país e seus respectivos nomes completos.
country_name_map = {
    'US': 'Estados Unidos',
    'SG': 'Singapura',
    'BG': 'Bulgária',
    'CH': 'Suíça',
    'EG': 'Egito',
    'CA': 'Canadá',
    'MX': 'México',
    'NZ': 'Nova Zelândia',
    'JP': 'Japão',
    'IL': 'Israel',
    'AU': 'Austrália',
    'CZ': 'República Tcheca',
    'DZ': 'Argélia',
    'KR': 'Coreia do Sul',
    'IT': 'Itália',
    'FR': 'França',
    'GB': 'Reino Unido',
    'ES': 'Espanha',
    'IN': 'Índia',
    'DE': 'Alemanha',
    'RU': 'Rússia',
    'PK': 'Paquistão',
    'GR': 'Grécia',
    'AR': 'Argentina',
    'TR': 'Turquia',
    'PR': 'Porto Rico',
    'FI': 'Finlândia',
    'UA': 'Ucrânia',
    'AT': 'Áustria',
    'IR': 'Irã',
    'GH': 'Gana',
    'NL': 'Holanda',
    'SI': 'Eslovênia',
    'PT': 'Portugal',
    'HU': 'Hungria',
    'DK': 'Dinamarca',
    'BE': 'Bélgica',
    'CO': 'Colômbia',
    'LT': 'Lituânia',
    'SK': 'Eslováquia',
    'CL': 'Chile',
    'MY': 'Malásia',
    'IE': 'Irlanda',
    'TH': 'Tailândia',
    'HR': 'Croácia',
    'PH': 'Filipinas',
    'AE': 'Emirados Árabes Unidos',
    'BA': 'Bósnia e Herzegovina',
    'EE': 'Estônia',
    'RO': 'Romênia',
    'CN': 'China',
    'IQ': 'Iraque',
    'SA': 'Arábia Saudita',
    'BR': 'Brasil',
    'KE': 'Quênia',
    'RS': 'Sérvia',
    'VN': 'Vietnã',
    'MD': 'Moldávia',
    'NG': 'Nigéria',
    'ID': 'Indonésia',
    'AM': 'Armênia',
    'BS': 'Bahamas',
    'UY': 'Uruguai',
    'CY': 'Chipre',
    'LV': 'Letônia',
    'KW': 'Kuwait',
    'JE': 'Jersey',
    'MF': 'São Martinho',
    'LU': 'Luxemburgo',
    'IS': 'Islândia',
    'CU': 'Cuba',
    'MT': 'Malta',
    'MA': 'Marrocos',
    'AL': 'Albânia',
    'AS': 'Samoa Americana',
    'AZ': 'Azerbaijão',
    'BQ': 'Bonaire, Santo Eustáquio e Saba',
    'DO': 'República Dominicana',
    'HK': 'Hong Kong',
    'NO': 'Noruega',
    'PL': 'Polônia',
    'SV': 'El Salvador',
    'CD': 'República Democrática do Congo',
    'CI': 'Costa do Marfim',
    'ET': 'Etiópia',
    'GG': 'Guernsey',
    'LA': 'Laos',
    'MZ': 'Moçambique',
    'XK': 'Kosovo',
    'ZA': 'África do Sul',
    'ZW': 'Zimbábue',
    'EC': 'Equador',
    'TW': 'Taiwan',
    'ME': 'Montenegro',
    'AD': 'Andorra'
}

# Aplicar o mapeamento. Se um país não estiver no mapa, o código original será mantido.
df_salario_por_pais['empresa_nome_completo'] = df_salario_por_pais['empresa'].map(country_name_map).fillna(df_salario_por_pais['empresa'])

# Ordenar os países pela média salarial em ordem decrescente (do maior para o menor salário, para melhor visualização)
df_salario_por_pais = df_salario_por_pais.sort_values(by='usd', ascending=False)

# Criando o gráfico de barras interativo usando Plotly Express
# Utilizando a coluna 'empresa_nome_completo' para o eixo Y e 'usd' para o eixo X.
# Definindo o título, rótulos dos eixos, cores das barras e o tema do gráfico.
fig = px.bar(
    df_salario_por_pais,
    y='empresa_nome_completo', # Coluna para o eixo Y (nomes completos dos países) para gráfico horizontal
    x='usd',     # Coluna para o eixo X (salário médio em USD)
    title='Média Salarial de Cientista de Dados por País (USD)', # Título do gráfico
    labels={
        'empresa_nome_completo': 'Países', # Rótulo do eixo Y atualizado
        'usd': 'Média Salarial Anual (USD)' # Rótulo do eixo X
    },
    color='usd', # Colorir as barras pela média salarial
    color_continuous_scale=px.colors.sequential.Viridis, # Escolha de uma paleta de cores sequencial
    template='plotly_white' # Usar um tema branco para um visual mais limpo
)

# Adicionndo rótulos de texto aos valores das barras
# Formatando o texto para exibir o valor em USD com duas casas decimais e o posiciona fora da barra.
fig.update_traces(texttemplate='%{x:$,.0f}', textposition='outside', textfont_size=12)

# Ajustando o layout do gráfico
# Definindo os títulos dos eixos, tamanho mínimo da fonte do texto, modo de ocultar texto e margens.
fig.update_layout(
    xaxis_title_text='Média Salarial Anual (USD)',
    yaxis_title_text='Países', # Título do eixo Y atualizado
    # Removendo uniformtext_minsize e uniformtext_mode para garantir que todos os rótulos sejam exibidos
    margin=dict(l=150, r=20, t=70, b=20), # Ajustar margens para acomodar rótulos longos
    coloraxis_showscale=False # Remover a barra de cores, pois os valores já estão nas barras
)

# Exibindo o gráfico
fig.show()