<a href="https://colab.research.google.com/github/ycc-br/Repo-1/blob/main/Exp_03_1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **INTRODUÇÃO**

## <font size='5'> 1| Exportação </font>

Exportação, basicamente, consiste no ato de vender para outro país, tanto mercadorias quanto serviços.<br>
Para o Brasil, enquanto país, é bom, pois contribui para criação e manutenção de emprego e renda, além de promover o aumento da competitividade.<br>
Já para a empresa exportadora também é positivo, pois diminui o risco do negócio devido a diversificação geográfica, incentivos fiscais, aumento do mercado potencial. 


## <font size='5'> 2| Objetivo </font> 

Conhecer as exportações ao responder as seguintes questões:



<br>Exportações brasileiras | 2021

1. Dados gerais sobre a exportação brasileira em 2021
2. Quem são os maiores compradores do Brasil em 2021? E o que eles mais compraram?
3. Quais mercadorias o Brasil mais vendeu ao exterior em 2021? (as commodities dominam mesmo?) E para quem o Brasil vendeu?
4. Modais mais utilizados

Exportações brasileiras | 2010 - 2021
1. Evolução das exportações ao longo do período (em valores transacionados)
2. Os maiores compradores do Brasil no período e o que eles compraram
3. Quais mercadorias o Brasil mais exportou no período e para quem vendeu?
4. Modais mais utilizados em cada ano do período analisado

## 3| Dicionário de termos utilizados

*ANO:* Ano 

*MES:* Mês 

*NCM:* Nomenclatura Comum Mercosul - Código utilizado para controle e identificação das mercadorias comercializadas no Brasil e nos outros países do Mercosul (cada NCM representa uma mercadoria diferente).
<br>Por exemplo: 
<br> *0101.21.00* - Cavalos reprodutores de raça pura
<br> *0402.21.10* - Leite integral

*TABELA NCM:* faz a correspodência de cada NCM com a respectiva mercadoria.
<br>Para conhecer em mais detalhes: https://www.fazcomex.com.br/blog/tabela-ncm/

*UNID:* Código da Unidade de Medida Estatística que é uma unidade de medida padrão para cada NCM, podendo ter valores como quilograma, metro, litro, pares, tonelada e outros.

*PAIS:* Código do país com a qual foi realizada a operação (importação ou exportação)

*UF:* Unidade Federativa (estado) de origem (exportação) ou destino (importação).

*MODAL:* Código para identificação do meio de transporte utilizado (aéreo, marítimo, rodoviária, ferroviária e outros). Na *exportação*, é o método utilizado para o transporte de mercadorias entre o último local de embarque para o exterior. Na *importação*, configura-se através dos meios de acesso para os bens do primeiro ponto de entrada no território nacional.

*URF (Unidade da Receita Federal):* Código da agência responsável pela execução dos procedimentos necessários para o desembaraço aduaneiro da mercadoria importada/exportada

*UNI_STAT:* No detalhamento por NCM, cada produto tem sua unidade estatística. Grande parte dos produtos tem como unidade estatística o peso em quilogramas, mas existem outras: quilograma líquido, número (unidades), pares, dúzias, milheiro, tonelada. A tabela completa que relaciona cada NCM com sua unidade estatística pode ser encontrada em na tabela “NCM _ UNIDADE”. 

*KG_LIQ:* Medida que expressa o peso líquido da mercadoria. Mesmo produtos com quantidades estatísticas diferentes do quilograma também possuem disponível a medida em quilograma, referindo-se ao peso líquido da mercadoria, ou seja, mercadoria desconsiderando embalagens, caixas ou quaisquer outros adicionais de transporte. 

*VALOR_FOB:* O valor FOB indica o preço da mercadoria em dólares americanos (US$) sob o Incoterm FOB (Free on Board), modalidade na qual o vendedor é responsável por embarcar a mercadoria enquanto o comprador assume o pagamento do frete, seguros e demais custos pós embarque.

*Vale relembrar que as informações contidas no dataset relativo às operações de comércio exterior, é de livre preenchimento e de responsabilidade exclusiva dos operadores de comércio exterior.*

# **IMPORTAÇÃO DAS LIBS**

In [2]:
# Instalando a última versão do Plotly
!pip install plotly==5.4.0

Collecting plotly==5.4.0
  Downloading plotly-5.4.0-py2.py3-none-any.whl (25.3 MB)
[K     |████████████████████████████████| 25.3 MB 1.7 MB/s 
[?25hCollecting tenacity>=6.2.0
  Downloading tenacity-8.0.1-py3-none-any.whl (24 kB)
Installing collected packages: tenacity, plotly
  Attempting uninstall: plotly
    Found existing installation: plotly 4.4.1
    Uninstalling plotly-4.4.1:
      Successfully uninstalled plotly-4.4.1
Successfully installed plotly-5.4.0 tenacity-8.0.1


In [1]:
# Importando as libs necessárias
import pandas as pd
import pickle as pkl
import numpy as np
import plotly.express as px
import plotly.graph_objects as go
from google.colab import drive

pd.options.display.float_format = '{:.2f}'.format

In [2]:
# Estabelecendo conexão com o Google Drive
drive.mount('/content/drive')

Mounted at /content/drive


# **OBTENÇÃO E TRATAMENTO DOS DADOS**

## <font size='4'> 1| Obtenção dos dados </font>



O dataset utilizado foi obtido do site: https://www.gov.br/produtividade-e-comercio-exterior/pt-br/assuntos/comercio-exterior/estatisticas/base-de-dados-bruta

In [3]:
# Carregando dataset com os dados sobre exportações brasileiras
raw_data = pd.read_csv('/content/drive/My Drive/EXP_COMPLETA.csv',sep=';')

# Por default, as 5 primeiras linhas...
raw_data.head()

Unnamed: 0,CO_ANO,CO_MES,CO_NCM,CO_UNID,CO_PAIS,SG_UF_NCM,CO_VIA,CO_URF,QT_ESTAT,KG_LIQUIDO,VL_FOB
0,1997,11,74122000,10,249,SP,4,817600,0,0,3
1,1997,11,73082000,10,97,MG,7,130151,0,4292,6442
2,1997,11,84248119,11,196,SP,1,817800,32,3468,31510
3,1997,11,48239090,10,586,MN,9,910600,0,0,1
4,1997,11,72112910,10,850,SP,1,817800,118,117505,103866


In [4]:
# Renomeando as colunas
raw_data.columns = ['ANO','MES','NCM','UNI_MED','PAIS','UF','MODAL','URF','UNI_STAT','KG_LIQ','VALOR_FOB']
raw_data

Unnamed: 0,ANO,MES,NCM,UNI_MED,PAIS,UF,MODAL,URF,UNI_STAT,KG_LIQ,VALOR_FOB
0,1997,11,74122000,10,249,SP,4,817600,0,0,3
1,1997,11,73082000,10,97,MG,7,130151,0,4292,6442
2,1997,11,84248119,11,196,SP,1,817800,32,3468,31510
3,1997,11,48239090,10,586,MN,9,910600,0,0,1
4,1997,11,72112910,10,850,SP,1,817800,118,117505,103866
...,...,...,...,...,...,...,...,...,...,...,...
24246722,2021,6,85444200,10,40,SP,4,817600,1,1,2
24246723,2021,1,85366990,11,476,SP,1,817800,3,1,237
24246724,2021,8,84814000,11,586,RJ,7,917500,5,2,41
24246725,2021,3,8104000,10,476,SP,1,812051,10,10,17


## <font size="4"> 2| Seleção dos dados de interesse </font>

In [6]:
# Obtendo os anos abrangidos pelo dataset
raw_data.ANO.unique()

array([1997, 1998, 1999, 2000, 2001, 2002, 2003, 2004, 2005, 2006, 2007,
       2008, 2009, 2010, 2011, 2012, 2013, 2014, 2015, 2016, 2017, 2018,
       2019, 2020, 2021])

O dataset abrange o período de 1997 a 2021. O escopo da presente análise será de 2010 a 2021.

In [7]:
# Criando um subset - de 2010 até 2021
exp = raw_data[raw_data['ANO']>=2010].copy().reset_index().drop(['index'], axis=1)
exp

Unnamed: 0,ANO,MES,NCM,UNI_MED,PAIS,UF,MODAL,URF,UNI_STAT,KG_LIQ,VALOR_FOB
0,2010,10,94056000,10,63,MN,1,817800,2,192,6007
1,2010,10,85122023,11,850,SP,1,817800,445,318,11417
2,2010,10,39152000,10,160,SP,1,817800,0,44000,26167
3,2010,10,94051093,10,40,SP,1,817800,111,948,66446
4,2010,10,90191000,10,63,SP,7,1010900,0,6495,58711
...,...,...,...,...,...,...,...,...,...,...,...
13760836,2021,6,85444200,10,40,SP,4,817600,1,1,2
13760837,2021,1,85366990,11,476,SP,1,817800,3,1,237
13760838,2021,8,84814000,11,586,RJ,7,917500,5,2,41
13760839,2021,3,8104000,10,476,SP,1,812051,10,10,17


In [8]:
# Selecionando as colunas de interesse para a análise
exp = exp.copy()
exp = exp[['ANO', 'MES', 'NCM', 'PAIS', 'MODAL','VALOR_FOB']]
exp

Unnamed: 0,ANO,MES,NCM,PAIS,MODAL,VALOR_FOB
0,2010,10,94056000,63,1,6007
1,2010,10,85122023,850,1,11417
2,2010,10,39152000,160,1,26167
3,2010,10,94051093,40,1,66446
4,2010,10,90191000,63,7,58711
...,...,...,...,...,...,...
13760836,2021,6,85444200,40,4,2
13760837,2021,1,85366990,476,1,237
13760838,2021,8,84814000,586,7,41
13760839,2021,3,8104000,476,1,17


## <font size="5"> 3| Substituição dos códigos das colunas *Modais* e *País* pela respectiva descrição  </font>

<font size="4"> Modais </font> 

In [9]:
# Lendo o CSV contendo o código e a respectiva descrição
cod_modais = pd.read_csv('/content/drive/My Drive/Modais.csv',sep=';')

# Criando dicionário com os códigos e respectiva descrição
modal_dict = {cod_modais.iloc[i,0]:cod_modais.iloc[i,1] for i in range(cod_modais.shape[0])}

# Substituindo o código pela respectiva descrição no dataframe
exp['MODAL'] = exp['MODAL'].map(modal_dict)

# Apresentando o dataframe
exp

Unnamed: 0,ANO,MES,NCM,PAIS,MODAL,VALOR_FOB
0,2010,10,94056000,63,MARITIMA,6007
1,2010,10,85122023,850,MARITIMA,11417
2,2010,10,39152000,160,MARITIMA,26167
3,2010,10,94051093,40,MARITIMA,66446
4,2010,10,90191000,63,RODOVIARIA,58711
...,...,...,...,...,...,...
13760836,2021,6,85444200,40,AEREA,2
13760837,2021,1,85366990,476,MARITIMA,237
13760838,2021,8,84814000,586,RODOVIARIA,41
13760839,2021,3,8104000,476,MARITIMA,17


<font size="4"> Países </font> 

In [10]:
# Lendo o CSV contendo o código e a respectiva descrição
cod_pais = pd.read_csv('/content/drive/My Drive/PAIS.csv',sep=';')

# Criando dicionário com os códigos e respectiva descrição
pais_dict = {cod_pais.iloc[i,0]:cod_pais.iloc[i,3] for i in range(cod_pais.shape[0])}
    
# Substituindo o código pela respectiva descrição no dataframe
exp['PAIS']=exp['PAIS'].map(pais_dict)

# Apresentando o dataframe
exp

Unnamed: 0,ANO,MES,NCM,PAIS,MODAL,VALOR_FOB
0,2010,10,94056000,Argentina,MARITIMA,6007
1,2010,10,85122023,Venezuela,MARITIMA,11417
2,2010,10,39152000,China,MARITIMA,26167
3,2010,10,94051093,Angola,MARITIMA,66446
4,2010,10,90191000,Argentina,RODOVIARIA,58711
...,...,...,...,...,...,...
13760836,2021,6,85444200,Angola,AEREA,2
13760837,2021,1,85366990,"Marshall, Ilhas",MARITIMA,237
13760838,2021,8,84814000,Paraguai,RODOVIARIA,41
13760839,2021,3,8104000,"Marshall, Ilhas",MARITIMA,17


## <font size="5"> 4| Ajuste do tipo de variável para otimização do uso de memória </font>

In [11]:
# Identificando o tipo de variável de cada coluna
exp.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 13760841 entries, 0 to 13760840
Data columns (total 6 columns):
 #   Column     Dtype 
---  ------     ----- 
 0   ANO        int64 
 1   MES        int64 
 2   NCM        int64 
 3   PAIS       object
 4   MODAL      object
 5   VALOR_FOB  int64 
dtypes: int64(4), object(2)
memory usage: 629.9+ MB


In [12]:
# Ajustando o tipo de variável
exp['ANO'] = exp['ANO'].astype('int16')
exp['MES']=exp['MES'].astype('int8')
exp['NCM']=exp['NCM'].astype('int32')
exp['VALOR_FOB']=exp['VALOR_FOB'].astype('uint32')

In [13]:
# Redução de 273 MB, deixando o dataframe mais leve!
exp.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 13760841 entries, 0 to 13760840
Data columns (total 6 columns):
 #   Column     Dtype 
---  ------     ----- 
 0   ANO        int16 
 1   MES        int8  
 2   NCM        int32 
 3   PAIS       object
 4   MODAL      object
 5   VALOR_FOB  uint32
dtypes: int16(1), int32(1), int8(1), object(2), uint32(1)
memory usage: 354.3+ MB


## <font size="5"> 5| Tratamento dos valores ausentes e inconsistentes </font>

In [14]:
# Checando a existência de valores ausentes
exp.describe(include='all')

Unnamed: 0,ANO,MES,NCM,PAIS,MODAL,VALOR_FOB
count,13760841.0,13760841.0,13760841.0,13760841,13760841,13760841.0
unique,,,,257,14,
top,,,,Argentina,MARITIMA,
freq,,,,1083990,5806882,
mean,2015.81,6.62,60377785.73,,,192360.48
std,3.51,3.39,28254666.47,,,4111700.75
min,2010.0,1.0,1011010.0,,,0.0
25%,2013.0,4.0,39095019.0,,,195.0
50%,2016.0,7.0,73043110.0,,,1757.0
75%,2019.0,10.0,84829990.0,,,18654.0


A contagem de registros (linhas) de todas as colunas são iguais, indicando que não há valores ausentes

In [15]:
# Qtde e porcentagem de registros (linhas) a serem excluídas (mercadorias sem valor comercial)
print(f"Linhas a serem excluídas: {exp[exp['VALOR_FOB']==0].shape[0]}")
print(f"Equivalente a {exp[exp['VALOR_FOB']==0].shape[0]/exp.shape[0]:.3f}% do total.")

# Excluindo os registros de mercadorias sem valor comercial 
exp = exp.drop(exp[exp['VALOR_FOB']==0].index, axis=0)


Linhas a serem excluídas: 27748
Equivalente a 0.002% do total.


## 6| Salvar o dataset tratado

In [16]:
# Salvando o dataset tratado
with open ('/content/drive/My Drive/exp_tratado.pkl', 'wb') as handle:
  pkl.dump(exp,handle, protocol=pkl.HIGHEST_PROTOCOL)

# **<font size='5'> ANÁLISE EXPLORATÓRIA DE DADOS (EDA) </font>**

Nesta etapa, iremos analisar o dataset para responder aos questionamentos sobre o panorama das exportações brasileiras

In [17]:
# Obtendo o dataframe salvo na etapa anterior
with open('/content/drive/My Drive/exp_tratado.pkl', 'rb') as handle:
    exp = pkl.load(handle)
exp

Unnamed: 0,ANO,MES,NCM,PAIS,MODAL,VALOR_FOB
0,2010,10,94056000,Argentina,MARITIMA,6007
1,2010,10,85122023,Venezuela,MARITIMA,11417
2,2010,10,39152000,China,MARITIMA,26167
3,2010,10,94051093,Angola,MARITIMA,66446
4,2010,10,90191000,Argentina,RODOVIARIA,58711
...,...,...,...,...,...,...
13760836,2021,6,85444200,Angola,AEREA,2
13760837,2021,1,85366990,"Marshall, Ilhas",MARITIMA,237
13760838,2021,8,84814000,Paraguai,RODOVIARIA,41
13760839,2021,3,8104000,"Marshall, Ilhas",MARITIMA,17


In [18]:
# Lendo a tabela NCM
ncm = pd.read_excel('/content/drive/My Drive/NCM completa x.xlsx')

# Criando dicionário com o conteúdo da tabela NCM
ncm_dict={ncm.iloc[i,0]:ncm.iloc[i,1] for i in range(ncm.shape[0])}

## Função - consulta_ncm()

Para tornar mais conveniente para o leitor, iremos definir uma função para realizar a consulta NCM: **consulta_ncm()**.


### Análise da estrutura do código

Antes da construção da função, vamos analisar a estrutura do código NCM para identificar possíveis restrições

In [19]:
# Averiguar a qtde de dígitos que os códigos da tabela NCM são compostos
set([len(x) for x in ncm['CO_NCM'].astype(str)])

{7, 8}

In [20]:
# Decompor dígito a dígito os NCM´s contidos na tabela NCM
dig = {i:ncm['CO_NCM'].astype(str).str[i] for i in range(8)}

# Colocar em um dataframe os NCM´s decompostos
dncm_df = pd.DataFrame(dig)

# Converter todos os valores para string
for i in dncm_df.columns:
  dncm_df[i]=dncm_df[i].astype(str)

# Renomear as colunas
dncm_df = dncm_df.rename(columns={0:'P1',1:'P2',2:'P3',3:'P4',4:'P5',5:'P6',6:'P7',7:'P8'})
dncm_df

# Checar os caracteres que aparecem em cada posição, excluíndo os caracteres repetidos
uniq = {i:np.sort(dncm_df[i].unique()) for i in dncm_df.columns}

# Apresentar os caracteres que aparecem em cada posição do código
uniq

{'P1': array(['1', '2', '3', '4', '5', '6', '7', '8', '9'], dtype=object),
 'P2': array(['0', '1', '2', '3', '4', '5', '6', '7', '8', '9'], dtype=object),
 'P3': array(['0', '1', '2', '3', '4', '5', '6', '7', '8', '9'], dtype=object),
 'P4': array(['0', '1', '2', '3', '4', '5', '6', '7', '8', '9'], dtype=object),
 'P5': array(['0', '1', '2', '3', '4', '5', '6', '7', '8', '9'], dtype=object),
 'P6': array(['0', '1', '2', '3', '4', '5', '6', '7', '8', '9'], dtype=object),
 'P7': array(['0', '1', '2', '3', '4', '5', '6', '7', '8', '9'], dtype=object),
 'P8': array(['0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'nan'],
       dtype=object)}

Podemos idenficar as seguintes restrições. 
1. O código pode ser apresentado por **7** ou **8** dígitos. 
2. Todas as posições são compostas **apenas** por caracteres **numéricos** de 0-9, não possuindo caracteres alfabéticos.  


### Definição da função 

In [21]:
# Esta função irá retornar a descrição dos NCM´s informados.
# Para isso, irá validar os NCM´s com base nas restrições identificadas
# E retornar a descrição dos NCM´s validados
# E retornar os NCMs não validados indicando a causa 

def consulta_ncm():
  
  # Listas para validação e classificação
  a = [] # armazena os NCM´s com dígitos faltantes e caracteres ñ numéricos
  b = [] # armazena os NCM´s com dígitos faltantes
  c = [] # armazena os NCM´s com caracteres ñ numéricos
  d = [] # armazena os NCM´s inexistentes (ñ contidos na tabela NCM)
  e = [] # armazena os NCM´s válidos 
  sl = [a,b,c,d]

  # Listas contendo os avisos de ñ conformidades
  wa = ['O NCM informado deve possuir 7 ou 8 dígitos e apenas caracteres númericos','Os NCMs informados devem possuir 7 ou 8 dígitos e apenas caracteres númericos'] 
  wb = ['O NCM informado deve possuir 7 ou 8 dígitos','Os NCMs informados devem possuir 7 ou 8 dígitos'] 
  wc = ['O NCM informado deve possuir apenas caracteres numéricos','Os NCMs informados devem possuir apenas caracteres númericos'] 
  wd = ['A tabela NCM não contém o NCM informado','A tabela NCM não contém os NCMs informados']
  wl = [wa,wb,wc,wd]


  # Solicitar ao usuário que insira os NCMs
  x = list(input('Insira o(s) NCM(s) desejado para consulta: ').split())
    

  # Validação e classificação dos NCMs inseridos
  for i in range(len(set(x))):
      if (x[i].isnumeric()==False and (len(x[i])!=7 and len(x[i])!=8)):
        a.append(x[i])
      else:
        if x[i].isnumeric()==False:
          c.append(x[i])
        else:
          if len(x[i])!=7 and len(x[i])!=8:
            b.append(x[i])
          else:
            if int(x[i]) not in list(ncm['CO_NCM']):
              d.append(x[i])
            else:
              e.append(x[i])
            

  # Retorna os NC's válidos e respectiva descrição
  e = [int(val) for val in e]
  if len(e) != 0: 
    print( f'\n\n   NCM  | DESCRIÇÃO ')
    for i in range(len(e)):
      print(f'{e[i]} | {ncm_dict[e[i]]}')


  # Retorno dos NCMs inconformes

  # Cabeçalho
  if len(b) != 0 or len(c) != 0 or len(d) != 0:
    print('\n\nAVISO')
    print('-----------------------------------------------------------------------------------------------------')

  # Aviso de não conformidade
  for i in range(len(sl)):
    if len(sl[i]) != 0:
      if len(sl[i]) == 1:
        print(f'\n{wl[i][0]}: {str(sl[i])[1:-1]}')          
      else:
        print(f'\n{wl[i][1]}: {str(sl[i])[1:-1]}')
    
  if (len(a)+len(b)+len(c)+len(d))!=0:
    print('\nFavor insira novamente!')       

## 2021

In [22]:
# Iremos nos desbruçar no ano corrente
exp_2021 = exp[exp['ANO']==2021].copy()

In [23]:
# O dataset possui registros atualizados até novembro
np.sort(exp_2021['MES'].unique())

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11], dtype=int8)

### 1| Dados Gerais

In [85]:
# Calculando e formatando a receita de exportação
valor = '{:.2f}'.format(exp_2021['VALOR_FOB'].sum()/1000000000).replace('.',',')

# Apresentando a receita de exportação
print(f"Até novembro, o Brasil obteve como receita de exportação de US$ {valor} Bi")

# Apresentando a qtde de países 
print(f"Tendo exportado para {len(exp_2021['PAIS'].unique())} países e territórios.")

Até novembro, o Brasil obteve como receita de exportação de US$ 256,03 Bi
Tendo exportado para 239 países e territórios.


In [25]:
# Somando os valores transacionados por mês
exp_2021m = exp_2021.groupby(['MES'])[['VALOR_FOB']].sum()

# Contando a qtde de países que compraram do Brasil em cada mês
exp_2021m['QTDE_PAIS']= exp_2021.groupby(['MES'])[['PAIS']].nunique()

# Plotando em um gráfico de barras
xlabel = [str(mes) for mes in exp_2021m.index]
fig = px.bar(exp_2021m,x=xlabel,y='VALOR_FOB',  labels=dict(x='MÊS', y='VALOR_FOB'), color='QTDE_PAIS', color_continuous_scale='Teal',text='QTDE_PAIS')
fig.update_layout(title={'text':'EXPORTAÇÃO | 2021','y':0.925,'x':0.5},plot_bgcolor = "#ededed")
fig.show()

### <font size='4'> 2| Maiores compradores do Brasil </font>

In [87]:
# Agrupando os dados por país
paises = pd.DataFrame(exp_2021.groupby(['PAIS'])[['VALOR_FOB']].sum()/1000000000)

# Calculando a participação de cada país nas exportações brasileiras
paises['%']=paises['VALOR_FOB']/paises['VALOR_FOB'].sum()*100

# Ordenando, por ordem decrescente, os países em função dos valores transacionados 
paises.sort_values(['%'],ascending=False,inplace=True)

# Calculando a participação acumulada 
paises_acu = [paises.iloc[0,1]]
for i in range(paises.shape[0]-1):
    paises_acu.append(paises_acu[i]+paises.iloc[i+1,1])
paises['% ACU']=paises_acu

# Resetando o index
paises = paises.reset_index()

# Formatando os valores da coluna VALOR_FOB com separador de milhares
paises['VALOR_FOB']=paises['VALOR_FOB'].apply(lambda x: "{:_.2f}".format(x).replace('.',','))

# Alterando o nome da coluna VALOR_FOB
paises  = paises.rename(columns={'VALOR_FOB': 'VALOR_FOB (US$ Bi)'})

# Apresentando os 10 primeiros colocados
paises.head(10)

Unnamed: 0,PAIS,VALOR_FOB (US$ Bi),%,% ACU
0,China,8224,32.12,32.12
1,Estados Unidos,2789,10.89,43.01
2,Argentina,1074,4.2,47.21
3,Países Baixos,838,3.27,50.48
4,Chile,595,2.32,52.81
5,Singapura,531,2.07,54.88
6,Espanha,506,1.97,56.86
7,Japão,503,1.96,58.82
8,México,497,1.94,60.76
9,Coreia do Sul,478,1.87,62.63


Até novembro de **2021**, 2 países **(China e EUA)** responderam por quase **metade** das exportações.
<BR>Vale ressaltar que a **China**, sozinha (dentre os 239), respondeu por **1/3** das exportações brasileiras!! O **triplo** dos **EUA**. :o

In [88]:
# Plotando os dados
# O tamanho dos quadros é proporcional ao valor transacionado

paises['VALOR_FOB (US$ Bi)'] = paises['VALOR_FOB (US$ Bi)'].str.replace('.','').str.replace(',','').astype(float)
fig = px.treemap(paises, path=[px.Constant('MUNDO'),'PAIS'], values=paises['VALOR_FOB (US$ Bi)'],color_discrete_sequence=px.colors.qualitative.Pastel)
fig.update_layout(title={'text':'PARTICIPAÇÃO DOS PAÍSES NAS EXPORTAÇÕES BRASILEIRAS - 2021 (até novembro)','y':0.95,'x':0.5})
fig.show()

<br>Agora vamos conhecer a *lista de compras* dos dois maiores compradores: China e EUA

<font size='4'> Lista de compras</font>

<font size='4'> Rank 1 - China  </font>

In [36]:
# Filtrando por país e agrupando por NCM
chn = exp_2021[exp_2021['PAIS'].isin(['China'])].groupby(['NCM'])[['VALOR_FOB']].sum()/1000000000

# Calculando a participação de cada mercadoria
chn['%']=chn['VALOR_FOB']/chn['VALOR_FOB'].sum()*100

# Ordenando, por ordem decrescente, os países em função dos valores transacionados 
chn = chn.sort_values(['VALOR_FOB'], ascending=False)

# Calculando a participação acumulada 
acu = [chn.iloc[0,1]]
for i in range(chn.shape[0]-1):
    acu.append(acu[i]+chn.iloc[i+1,1])
chn['% ACU'] = acu

# Acrescentando coluna com a descrição de cada NCM
chn['DESCRIÇÃO']=chn.index.map(ncm_dict)

# Resetando o index
chn = chn.reset_index()

# Alterando sequência das colunas
chn = chn[['NCM', 'DESCRIÇÃO','VALOR_FOB','%','% ACU']]

# Formatando os valores da coluna VALOR_FOB com separador de milhares
chn['VALOR_FOB']=chn['VALOR_FOB'].apply(lambda x: "{:_.2f}".format(x).replace('.',',').replace('_', '.'))

# Alterando o nome da coluna VALOR_FOB
chn  = chn.rename(columns={'VALOR_FOB': 'VALOR_FOB (US$ Bi)'})

# Apresentando os 10 primeiros colocados
chn.head(10)

Unnamed: 0,NCM,DESCRIÇÃO,VALOR_FOB (US$ Bi),%,% ACU
0,26011100,"Minérios de ferro e seus concentrados, exceto ...",2671,32.49,32.49
1,12019000,"Soja, mesmo triturada, exceto para semeadura",2615,31.8,64.29
2,27090010,Óleos brutos de petróleo,1282,15.59,79.88
3,2023000,"Carnes desossadas de bovino, congeladas",386,4.7,84.58
4,47032900,"Pastas químicas de madeira, à soda ou ao sulfa...",218,2.65,87.23
5,17011400,Outros açúcares de cana,132,1.61,88.84
6,2032900,"Outras carnes de suíno, congeladas",121,1.47,90.3
7,2071400,"Pedaços e miudezas, comestíveis de galos/galin...",117,1.42,91.73
8,52010020,"Algodão não cardado nem penteado, simplesmente...",78,0.95,92.67
9,72029300,Ferro-nióbio,67,0.81,93.48


As compras da China estão concentradas em: **Minério de ferro, Soja e Petróleo**.
<br>As 3 mercadorias, isoladas, correspondem por praticamente **80%** de tudo o que a China compra do Brasil

In [95]:
# Plotando a lista de compras da China
# O tamanho dos quadros é proporcional ao valor transacionado 

chn_p = exp_2021[exp_2021['PAIS'].isin(['China'])].groupby(['NCM'])[['VALOR_FOB']].sum().reset_index()
fig = px.treemap(chn_p, path=[px.Constant(f'TUDO O QUE COMPROU DO BRASIL EM 2021 (até novembro)'),'NCM'], values=chn_p['VALOR_FOB'],color='VALOR_FOB',color_continuous_scale='Tropic',color_continuous_midpoint=np.average(chn_p['VALOR_FOB'],weights=chn_p['VALOR_FOB']))
fig.update_layout(title={'text':'LISTA DE COMPRAS - CHINA','y':0.925,'x':0.5})
fig.show()


Caso queira consultar algum NCM, use a função abaixo.
Caso queira consultar vários ncms, separe por espaços ao inserir!

In [38]:
# Função - consulta_ncm
consulta_ncm()

Insira o(s) NCM(s) desejado para consulta: 16313


AVISO
-----------------------------------------------------------------------------------------------------

O NCM informado deve possuir 7 ou 8 dígitos: '16313'

Favor insira novamente!


Como já temos um exemplo do algoritmo para **gerar a lista de compra**, vamos criar uma **classe** para **automatizar** o trabalho.

In [96]:
# Definindo a classe

class pauta_pais:
    
    def __init__(self,df,ncm_dict,pais,linhas):
        self.df = df
        self.ncm_dict = ncm_dict
        self.pais = pais
        self.linhas = linhas

    def lista (self): # Este método gera a lista de compras com os valores transacionados
        
        # Filtrando por país e agrupando por NCM
        pauta = self.df[self.df['PAIS'].isin([self.pais])].groupby(['NCM'])[['VALOR_FOB']].sum()/1000000

        # Calculando a participação de cada mercadoria
        pauta['%']=pauta['VALOR_FOB']/pauta['VALOR_FOB'].sum()*100

        # Ordenando, em ordem decrescente, as mercadorias em função do VALOR_FOB
        pauta = pauta.sort_values(['VALOR_FOB'], ascending=False)
        
        # Calculando a participação acumulada para fins de análise
        acu = [pauta.iloc[0,1]]
        for i in range(pauta.shape[0]-1):
            acu.append(acu[i]+pauta.iloc[i+1,1])
        pauta['% ACU'] = acu

        # Incluindo coluna com a descrição da mercadoria para cada NCM
        pauta['DESCRIÇÃO']=pauta.index.map(self.ncm_dict)

        # Resetando o index
        pauta = pauta.reset_index()

        # Alterando sequência das colunas
        pauta = pauta[['NCM', 'DESCRIÇÃO','VALOR_FOB','%','% ACU']]
        
        # Formatando os valores da coluna VALOR_FOB com separador de milhares
        pauta['VALOR_FOB']=pauta['VALOR_FOB'].apply(lambda x: "{:_.2f}".format(x).replace('.',',').replace('_', '.'))
        
        # Alterando o nome da coluna VALOR_FOB
        pauta  = pauta.rename(columns={'VALOR_FOB': 'VALOR_FOB (US$ mi)'})

        # Apresentando os primeiros colocados
        return pauta.head(self.linhas)
    
    
    def tree(self): # Este método plota a lista de compras do país-parâmetro
        
        # Filtrando por país e agrupando por NCM
        pauta = self.df[self.df['PAIS'].isin([self.pais])].groupby(['NCM'])[['VALOR_FOB']].sum().astype('float')
        
        # Resetando o index
        pauta = pauta.reset_index()

        # Plotando a lista de compras
        fig = px.treemap(pauta, path=[px.Constant(f'TUDO O QUE FOI COMPRADO DO BRASIL EM 2021 (até novembro)'),'NCM'], values=pauta['VALOR_FOB'],color='VALOR_FOB',color_continuous_scale='Tropic',color_continuous_midpoint=np.average(pauta['VALOR_FOB'],weights=pauta['VALOR_FOB']))
        fig.update_layout(title={'text':f'LISTA DE COMPRAS - {self.pais.upper()}','y':0.925,'x':0.5})
        fig.show()
        

<font size='4'> Rank 2 - EUA </font>

In [97]:
# Instanciando a classe e informando os parâmetros necessários
eua = pauta_pais(exp_2021, ncm_dict,'Estados Unidos',10)

# Listando as compras dos EUA
eua.lista()

Unnamed: 0,NCM,DESCRIÇÃO,VALOR_FOB (US$ mi),%,% ACU
0,72071200,Outros produtos semimanufaturados de ferro ou ...,"3.413,38",12.24,12.24
1,27090010,Óleos brutos de petróleo,"2.946,57",10.57,22.8
2,9011110,"Café não torrado, não descafeinado, em grão","1.008,71",3.62,26.42
3,47032900,"Pastas químicas de madeira, à soda ou ao sulfa...",94988,3.41,29.83
4,72011000,"Ferro fundido bruto não ligado, que contenha, ...",76687,2.75,32.58
5,72249000,"Produtos semimanufaturados, de outras ligas de...",67287,2.41,34.99
6,88024090,"Outros aviões e outros veículos aéreos, de pes...",61737,2.21,37.2
7,27101259,"Outras gasolinas, exceto para aviação",59349,2.13,39.33
8,44123900,"Outras madeiras compensadas, constituídas excl...",51951,1.86,41.19
9,88023039,"Aviões e outros veículos aéreos, a turbojato, ...",46544,1.67,42.86


Contrastando com a China, a pauta norte-americana é melhor distribuída. O TOP 10 não alcança metade das compras.
<br> Porém, vale ressaltar que o TOP 2 (**Semimanufaturados de ferro e Petróleo**) representa quase **1/4** das compras norte-americanas

In [98]:
# Plotando a lista de compras dos EUA
# O tamanho dos quadros é proporcional ao valor transacionado

eua.tree()

O gráfico também evidencia uma melhor distribuição das mercadorias

Caso queira consultar algum NCM, utilize a função abaixo. Caso queira consultar vários ncms, separe por espaços ao inserir!




In [46]:
# Função - consulta_ncm
consulta_ncm()

Insira o(s) NCM(s) desejado para consulta: 5152


AVISO
-----------------------------------------------------------------------------------------------------

O NCM informado deve possuir 7 ou 8 dígitos: '5152'

Favor insira novamente!


Depois de termos nossa classe definida, seria um despercício usá-la apenas 1x!
Então, vamos aplicá-la a mais 3 países, fechando o top 5! =D

<font size='4'> Rank 3 - Argentina (los hermanos :p) </font>

In [99]:
# Instanciando e informando os parâmetros necessários
arg = pauta_pais(exp_2021, ncm_dict,'Argentina',10)

# Listando as compras da Argentina
arg.lista()

Unnamed: 0,NCM,DESCRIÇÃO,VALOR_FOB (US$ mi),%,% ACU
0,87032310,"Automóveis com motor explosão, 1500 < cm3 <= 3...",66545,6.19,6.19
1,26011210,"Minérios de ferro e seus concentrados, exceto ...",54670,5.09,11.28
2,87032210,"Automóveis com motor explosão, de cilindrada s...",32251,3.0,14.28
3,72071200,Outros produtos semimanufaturados de ferro ou ...,30515,2.84,17.13
4,87012000,Tratores rodoviários para semi-reboques,22015,2.05,19.17
5,84073490,"Outros motores de explosão, para veículos do c...",16017,1.49,20.67
6,87089990,Outras partes e acessórios para tratores e veí...,13649,1.27,21.94
7,87082999,Outras partes e acessórios de carrocerias para...,13143,1.22,23.16
8,87032100,"Automóveis com motor explosão, de cilindrada n...",12123,1.13,24.29
9,72104910,"Produtos laminados planos, de ferro ou aço não...",12088,1.13,25.41


In [100]:
# Plotando a lista de compras da Argentina
# O tamanho dos quadros é proporcional ao valor transacionado

arg.tree()

Caso queira consultar algum NCM, utilize a função abaixo. Caso queira consultar vários ncms, separe por espaços ao inserir!






In [49]:
# Função - consulta_ncm
consulta_ncm() 

Insira o(s) NCM(s) desejado para consulta: 511216


AVISO
-----------------------------------------------------------------------------------------------------

O NCM informado deve possuir 7 ou 8 dígitos: '511216'

Favor insira novamente!


A lista de compras da Argentina também é bem distribuída. Alem disso, há uma maior incidência de mercadorias do capítulo 87. <br>Isto vale uma análise adicional.

In [101]:
# Lendo CSV com os capítulos do NCM
ncmcap_df = pd.read_csv('/content/drive/My Drive/ncm cap.csv', sep=';')
ncmcap_df

Unnamed: 0,Cap,Descrição
0,1,Animais vivos.
1,2,"Carnes e miudezas, comestíveis."
2,3,"Peixes e crustáceos, moluscos e outros inverte..."
3,4,Leite e lacticínios> ovos de aves> mel natural...
4,5,"Outros produtos de origem animal, não especifi..."
...,...,...
93,94,"Móveis> mobiliário médico-cirúrgico> colchões,..."
94,95,"Brinquedos, jogos, artigos para divertimento o..."
95,96,Obras diversas
96,97,"Objetos de arte, de coleção e antiguidades"


In [102]:
# Criando dicionário com os capítulos e respectiva descrição
ncmcap_df = pd.read_csv('/content/drive/My Drive/ncm cap.csv', sep=';')
ncmcap_dict = {str(ncmcap_df.iloc[i,0]):ncmcap_df.iloc[i,1] for i in range(ncmcap_df.shape[0])}

# Fazendo uma cópia de exp_2021
exp_2021_02 = exp_2021.copy()

# Atualizando a coluna NCM com os dois primeiros dígitos, referente ao capítulo
exp_2021_02['NCM']= exp_2021['NCM'].astype(str).str[:2]

# Instanciando ...
arg_02 = pauta_pais(exp_2021_02,ncmcap_dict,'Argentina',10)

# Apresentando as compras da Argentina por capítulo
arg_02.lista()

Unnamed: 0,NCM,DESCRIÇÃO,VALOR_FOB (US$ mi),%,% ACU
0,87,"Veículos automóveis, tratores, ciclos e outros...","2.868,14",26.7,26.7
1,84,"Reatores nucleares, caldeiras, máquinas, apare...","1.042,31",9.7,36.4
2,72,"Ferro fundido, ferro e aço",87330,8.13,44.53
3,39,Plástico e suas obras.,74379,6.92,51.45
4,26,"Minérios, escórias e cinzas.",61594,5.73,57.18
5,85,"Máquinas, aparelhos e materiais elétricos, e s...",46754,4.35,61.54
6,48,"Papel e cartão> obras de pasta de celulose, de...",35098,3.27,64.8
7,40,Borracha e suas obras.,29038,2.7,67.51
8,38,Produtos diversos das indústrias químicas.,25254,2.35,69.86
9,29,Produtos químicos orgânicos.,24199,2.25,72.11


Ao aumentar a granulidade do NCM (capítulos), um **dado** interessante **emerge**. À **nivel de mercadorias**, não há mercadorias que predominam. Porém, à **nível de capítulo**, há um predomínio de **automóveis e tratores**, representando **1/4** das compras da Argentina.

In [103]:
arg_02.tree()

<font size='4'> Rank 4 - Países Baixos </font>

In [104]:
# Instanciando e informando os parâmetros necessários
nhl = pauta_pais(exp_2021,ncm_dict, "Países Baixos", 10)

# Listando as compras dos Países Baixos
nhl.lista()

Unnamed: 0,NCM,DESCRIÇÃO,VALOR_FOB (US$ mi),%,% ACU
0,12019000,"Soja, mesmo triturada, exceto para semeadura","1.163,04",13.88,13.88
1,27090010,Óleos brutos de petróleo,98115,11.71,25.58
2,26011100,"Minérios de ferro e seus concentrados, exceto ...",87083,10.39,35.97
3,47032900,"Pastas químicas de madeira, à soda ou ao sulfa...",58647,7.0,42.97
4,23040090,"Bagaços e outros resíduos sólidos, da extração...",57459,6.86,49.83
5,72029300,Ferro-nióbio,45596,5.44,55.27
6,20091900,"Outros sucos de laranjas, não fermentados, sem...",24373,2.91,58.17
7,2109911,Carnes de galos e de galinhas,19297,2.3,60.48
8,88024090,"Outros aviões e outros veículos aéreos, de pes...",16091,1.92,62.4
9,27101922,Fuel oil,14826,1.77,64.17


Na lista de compras dos Países Baixos, percebe-se uma concentração em 5 mercadorias, que dominam praticamente **50%** das compras.

In [105]:
# Plotando a lista de compras dos Países Baixos
# O tamanho dos quadros é proporcional ao valor transacionado
nhl.tree()

Caso queira consultar algum NCM, utilize a função abaixo. Caso queira consultar vários ncms, separe por espaços ao inserir!

In [55]:
# Função - consulta_ncm
consulta_ncm() 

Insira o(s) NCM(s) desejado para consulta: 21231651


AVISO
-----------------------------------------------------------------------------------------------------

A tabela NCM não contém o NCM informado: '21231651'

Favor insira novamente!


Este domínio também é evidenciado no gráfico. As **top 5** ocupam **metade** da área do gráfico. 

<font size='4'> Rank 5 - Chile </font>

In [106]:
# Instanciando e informando os parâmetros necessários
chl = pauta_pais(exp_2021,ncm_dict,'Chile',10)

# Listando as compras do Chile
chl.lista()

Unnamed: 0,NCM,DESCRIÇÃO,VALOR_FOB (US$ mi),%,% ACU
0,27090010,Óleos brutos de petróleo,"1.516,44",25.49,25.49
1,2013000,"Carnes desossadas de bovino, frescas ou refrig...",41347,6.95,32.44
2,87012000,Tratores rodoviários para semi-reboques,17915,3.01,35.45
3,87032310,"Automóveis com motor explosão, 1500 < cm3 <= 3...",14275,2.4,37.85
4,2071400,"Pedaços e miudezas, comestíveis de galos/galin...",13941,2.34,40.19
5,2032900,"Outras carnes de suíno, congeladas",13323,2.24,42.43
6,87042310,"Chassis com motor diesel e cabina, capacidade ...",10261,1.72,44.16
7,2023000,"Carnes desossadas de bovino, congeladas",9359,1.57,45.73
8,87042210,"Chassis com motor diesel e cabina, 5 toneladas...",7687,1.29,47.02
9,87079090,Carrocerias para veículos automóveis com capac...,6730,1.13,48.15


Quase 30% é petróleo! :o 

In [107]:
# Plotando a lista de compras do Chile
# O tamanho dos quadros é proporcional ao valor transacionado

chl.tree()

Caso queira consultar algum NCM, utilize a função abaixo. Caso queira consultar vários ncms, separe por espaços ao inserir!



In [58]:
# Função - consulta_ncm
consulta_ncm() 

Insira o(s) NCM(s) desejado para consulta: 213215


AVISO
-----------------------------------------------------------------------------------------------------

O NCM informado deve possuir 7 ou 8 dígitos: '213215'

Favor insira novamente!


Agora que já sabemos quem são os maiores compradores do Brasil e o que eles compram, vamos identificar quais são as mercadorias mais vendidas

### <font size='4'> 3| Mercadorias mais exportadas </font>

In [110]:
# Agrupando os dados de 2021 por NCM e ordenando por valor transacionado
ncm_exp = exp_2021.groupby(['NCM'])[['VALOR_FOB']].sum()/1000000000
ncm_exp = ncm_exp.sort_values(['VALOR_FOB'], ascending=False)

# Calculando a participação de cada mercadoria na exportação brasileira
ncm_exp['%']=ncm_exp['VALOR_FOB']/ncm_exp['VALOR_FOB'].sum()*100

# Calculando a participação acumulada das mercadorias 
acu = [ncm_exp.iloc[0,1]]
for i in range(ncm_exp.shape[0]-1):
    acu.append(acu[i]+ncm_exp.iloc[i+1,1])
ncm_exp['% ACU'] = acu

# Incluindo a descrição de cada mercdoria
ncm_exp['DESCRIÇÃO'] = ncm_exp.index.map(ncm_dict)

# Resetando o index
ncm_exp.reset_index(inplace=True)

# Alterando sequência das colunas
ncm_exp = ncm_exp[['NCM','DESCRIÇÃO','VALOR_FOB','%','% ACU']]

# Formatando os valores da coluna VALOR_FOB com separador de milhares
ncm_exp['VALOR_FOB']=ncm_exp['VALOR_FOB'].apply(lambda x: "{:_.2f}".format(x).replace('.',',').replace('_', '.'))

# Alterando o nome da coluna VALOR_FOB
ncm_exp  = ncm_exp.rename(columns={'VALOR_FOB': 'VALOR_FOB (US$ bi)'})

# Apresentando as 10 mercadorias mais vendidas
ncm_exp.head(10)

Unnamed: 0,NCM,DESCRIÇÃO,VALOR_FOB (US$ bi),%,% ACU
0,26011100,"Minérios de ferro e seus concentrados, exceto ...",3852,15.04,15.04
1,12019000,"Soja, mesmo triturada, exceto para semeadura",3727,14.56,29.6
2,27090010,Óleos brutos de petróleo,2739,10.7,40.3
3,17011400,Outros açúcares de cana,732,2.86,43.16
4,2023000,"Carnes desossadas de bovino, congeladas",646,2.52,45.68
5,47032900,"Pastas químicas de madeira, à soda ou ao sulfa...",560,2.19,47.87
6,23040090,"Bagaços e outros resíduos sólidos, da extração...",539,2.11,49.97
7,9011110,"Café não torrado, não descafeinado, em grão",508,1.99,51.96
8,27101922,Fuel oil,497,1.94,53.9
9,72071200,Outros produtos semimanufaturados de ferro ou ...,477,1.86,55.76


**Minério de ferro, Soja e Petróleo** - Estas 3 respondem por **40%** do total exportado! E sim, **commodities dominam** a pauta de exportação!

In [111]:
# Plotando
# O tamanho dos quadros é proporcional ao valor transacionado

ncm_exp_p = exp_2021.groupby(['NCM'])[['VALOR_FOB']].sum().reset_index()
fig = px.treemap(ncm_exp_p, path=[px.Constant('Mercadorias'),'NCM'], values=ncm_exp_p['VALOR_FOB'],color='VALOR_FOB',color_continuous_scale='Tropic',color_continuous_midpoint=np.average(ncm_exp_p['VALOR_FOB'],weights=ncm_exp_p['VALOR_FOB']))
fig.update_layout(title={'text':'Mercadorias mais exportadas pelo Brasil (até novembro)','y':0.925,'x':0.5})
fig.show()

Caso queira consultar algum NCM, utilize a função abaixo. Caso queira consultar vários ncms, separe por espaço em branco ao inserir!

In [61]:
# Função - consulta_ncm
consulta_ncm() 

Insira o(s) NCM(s) desejado para consulta: 5123165


AVISO
-----------------------------------------------------------------------------------------------------

A tabela NCM não contém o NCM informado: '5123165'

Favor insira novamente!


<br>E quem são os **maiores compradores** das principais commodities?

Para responder esta questão, vamos novamente nos valer de uma classe - *ncm_pais*. <br> Ela ficará responsável em fornecer uma lista dos países que importam a mercadoria informada. 

In [112]:
# Criando a classe
class ncm_pais:
    
    def __init__(self,df,ncm,descricao,linhas):
        self.df = df
        self.ncm_dict = ncm_dict
        self.ncm = ncm
        self.linhas = linhas
        self.descricao = descricao

    def lista (self):
        
        # Filtrando por país e agrupando por NCM
        df = self.df[self.df['NCM'].isin([self.ncm])].groupby(['PAIS'])[['VALOR_FOB']].sum()/1000000000

        # Calculando a participação de cada mercadoria
        df['%']=df['VALOR_FOB']/df['VALOR_FOB'].sum()*100

        # Ordenando, em ordem decrescente, as mercadorias em função do VALOR_FOB
        df = df.sort_values(['VALOR_FOB'], ascending=False)
        
        # Calculando a participação acumulada para fins de análise
        acu = [df.iloc[0,1]]
        for i in range(df.shape[0]-1):
            acu.append(acu[i]+df.iloc[i+1,1])
        df['% ACU'] = acu

        # Resetando o index
        df = df.reset_index()
        
        # Alterando sequência das colunas
        df = df[['PAIS','VALOR_FOB','%','% ACU']]
        
        # Formatando os valores da coluna VALOR_FOB com separador de milhares
        df['VALOR_FOB']=df['VALOR_FOB'].apply(lambda x: "{:_.2f}".format(x).replace('.',',').replace('_', '.'))

        # Alterando o nome da coluna VALOR_FOB
        df = df.rename(columns={'VALOR_FOB': 'VALOR_FOB (US$ bi)'})

        # Apresentando os n primeiros colocados
        return df.head(self.linhas)
    
    
    def tree(self):
        
        # Filtrando por país e agrupando por NCM
        df = self.df[self.df['NCM'].isin([self.ncm])].groupby(['PAIS'])[['VALOR_FOB']].sum().reset_index()
    
        # Plotando a participação de cada país nas exportações da mercadoria em questão
        fig = px.treemap(df, path=[px.Constant('PAÍSES COMPRADORES'),'PAIS'], values=df['VALOR_FOB'],color='VALOR_FOB',color_continuous_scale='Tropic',color_continuous_midpoint=np.average(df['VALOR_FOB'],weights=df['VALOR_FOB']))
        fig.update_layout(title={'text':f'O QUANTO CADA PAÍS COMPROU DE {self.descricao.upper()}','y':0.925,'x':0.5})
        fig.show()


<font size='4'> Rank 1 - Minério de ferro </font>

In [113]:
# Criando uma nova instância e informando os parâmetros necessários
ferro = ncm_pais(exp_2021,26011100,'Minério de ferro',10)

# Listando os maiores países compradores de minério de ferro
ferro.lista()

Unnamed: 0,PAIS,VALOR_FOB (US$ bi),%,% ACU
0,China,2671,69.36,69.36
1,Malásia,266,6.91,76.27
2,Barein,166,4.32,80.59
3,Japão,127,3.3,83.89
4,Omã,120,3.11,87.0
5,Países Baixos,87,2.26,89.26
6,Coreia do Sul,64,1.65,90.91
7,Turquia,57,1.47,92.38
8,Filipinas,55,1.44,93.82
9,França,50,1.3,95.12


A China! Sempre ela! Nos **10 primeiros meses**, ela respondeu por praticamente *70%* de todo minério de ferro exportado! 70%!


In [114]:
# Plotando a  participação de cada país na exportação de minério de ferro
# O tamanho dos quadros é proporcional ao valor transacionado
ferro.tree()

Visualmente, podemos ver o peso da China na exportação de minério de ferro. 

<font size='4'> Rank 2 - Soja </font>

In [115]:
# Criando uma nova instância e informando os parâmetros necessários
soja = ncm_pais(exp_2021,12019000,'Soja',10)

# Listando os maiores países compradores de soja
soja.lista()

Unnamed: 0,PAIS,VALOR_FOB (US$ bi),%,% ACU
0,China,2615,70.17,70.17
1,Espanha,166,4.46,74.63
2,Tailândia,127,3.4,78.03
3,Países Baixos,116,3.12,81.15
4,Turquia,96,2.57,83.72
5,Paquistão,69,1.86,85.58
6,México,55,1.47,87.05
7,Taiwan (Formosa),53,1.43,88.48
8,Irã,52,1.39,89.87
9,Vietnã,48,1.29,91.16


O mesmo acontece com a soja. A **China**, um único país dentre os 240 analisados, comprou **70%** da soja exportada pelo Brasil!

In [116]:
# Plotando a  participação de cada país na exportação de soja
# O tamanho dos quadros é proporcional ao valor transacionado
soja.tree()

<font size='4'> Rank 3 - Petróleo </font>

In [117]:
# Criando uma nova instância e informando os parâmetros necessários
petroleo = ncm_pais(exp_2021,27090010,'Petróleo',10)

# Listando os maiores países compradores de petróleo
petroleo.lista()

Unnamed: 0,PAIS,VALOR_FOB (US$ bi),%,% ACU
0,China,1282,46.82,46.82
1,Estados Unidos,295,10.76,57.57
2,Índia,205,7.5,65.07
3,Portugal,165,6.01,71.08
4,Chile,152,5.54,76.62
5,Coreia do Sul,109,3.98,80.6
6,Espanha,103,3.77,84.37
7,Singapura,101,3.68,88.06
8,Países Baixos,98,3.58,91.64
9,Malásia,67,2.44,94.08


Em relação ao petróleo, a China ocupa novamente o topo. Mas, desta vez, segurou o apetite. Respondeu por "apenas" **quase a metade** do petróleo exportado. <br> O segundo maior comprador, **EUA**, comprou menos de **1/4** do que a China comprou.

In [118]:
# Plotando a  participação de cada país na exportação de petróleo
# O tamanho dos quadros é proporcional ao valor transacionado
petroleo.tree()

### 4| Modais mais utilizados

In [72]:
# Calculando o quanto cada modal respondeu nos valores transacionados na exportação 
modal_2021 =exp_2021.groupby(['MODAL'])[['VALOR_FOB']].sum()/1000000000

# Calculando a participação de cada modal 
modal_2021['%']=modal_2021.VALOR_FOB/modal_2021.VALOR_FOB.sum()*100

# Ordenando, por ordem decrescente, os modais utilizados em função do VALOR_FOB 
modal_2021 = modal_2021.sort_values(['VALOR_FOB'], ascending=False)

# Calculando a participação acumulada para fins de análise
ac = [modal_2021.iloc[0,1]]
for i in range(modal_2021.shape[0]-1):
    ac.append(ac[i]+modal_2021.iloc[i+1,1])
modal_2021['% Acu'] = ac

# Resetando o índice
modal_2021 = modal_2021.reset_index()

# Formatando os valores da coluna VALOR_FOB com separador de milhares
modal_2021['VALOR_FOB']=modal_2021['VALOR_FOB'].apply(lambda x: "{:_.2f}".format(x).replace('.',','))

# Alterando o nome da coluna VALOR_FOB
modal_2021  = modal_2021.rename(columns={'VALOR_FOB': 'VALOR_FOB (US$ bi)'})

# Apresentando o resultado
modal_2021

Unnamed: 0,MODAL,VALOR_FOB (US$ bi),%,% Acu
0,MARITIMA,22701,88.67,88.67
1,RODOVIARIA,1469,5.74,94.4
2,AEREA,1308,5.11,99.51
3,VIA NAO DECLARADA,45,0.18,99.69
4,MEIOS PROPRIOS,30,0.12,99.81
5,FLUVIAL,21,0.08,99.89
6,FERROVIARIA,15,0.06,99.95
7,VICINAL FRONTEIRICO,5,0.02,99.97
8,LACUSTRE,4,0.02,99.99
9,CONDUTO/REDE DE TRANSMISSAO,2,0.01,99.99


O modal mais utilizado, sem supresa nenhuma, foi o marítimo. Respondendo por quase **90%** do que foi exportado.  <br> Ou seja, de 100 dólares que o Brasil exportou, quase 90 dólares foi atráves de navios. :)



In [73]:
modal_2021=exp_2021.groupby(['MODAL'])[['VALOR_FOB']].sum().reset_index()
fig = px.treemap(modal_2021, path=[px.Constant(f'MODAIS'),'MODAL'], values=modal_2021['VALOR_FOB'],color='VALOR_FOB',color_continuous_scale='Tropic',color_continuous_midpoint=np.average(modal_2021['VALOR_FOB'],weights=modal_2021['VALOR_FOB']))
fig.update_layout(title={'text':'MODAIS UTILIZADOS','y':0.925,'x':0.5})
fig.show()

O gráfico também evidencia o peso que o modal **marítimo** possui nas **exportações** brasileiras. 

## **<font size="4.5"> Evolução | 2010 - 2021 </font>**

### 1| Dados Gerais

In [74]:
# Somando os valores transacionados em cada ano
exp_ano = exp.groupby(['ANO'])[['VALOR_FOB']].sum()

# Contando a qtde de país que compraram do Brasil em cada ano
exp_ano['QTDE_PAIS']= exp.groupby(['ANO'])[['PAIS']].nunique()

# Plotando os dados
xlabel = [str(ano) for ano in exp_ano.index]
fig = px.bar(exp_ano,x=xlabel,y='VALOR_FOB', color='QTDE_PAIS',  labels=dict(x='ANO', y='VALOR_FOB'), color_continuous_scale='Teal',text='QTDE_PAIS')
fig.update_layout(title={'text':'EVOLUÇÃO DAS EXPORTAÇÕES | 2010 - 2021','y':0.925,'x':0.5},plot_bgcolor = "#ededed")
fig.show()

As exportações brasileiras não apresentaram um tendência de crescimento no período analisado, alternando entre crescimento e queda.

### <font size="4"> 2| Maiores compradores do Brasil </font>

In [75]:
# Agrupando o dataset por ano e país 
exp_anual = exp.groupby(['ANO','PAIS'])[['VALOR_FOB']].sum().reset_index()

# Criando uma lista com os 5 maiores compradores de cada ano
lista_paises =[]
for i in exp_anual.ANO.unique():
     for j in range(5):
        lista_paises.append(exp_anual[exp_anual['ANO']==i].sort_values(['VALOR_FOB'], ascending=False).iloc[j,1])

# Criando um dataframe com os 5 maiores compradores de cada ano
rank_paises = pd.DataFrame()
count=0
for ano in exp_anual.ANO.unique():
    rank_paises[ano] = lista_paises[count:count+5]
    count+=5
    
# Apresentando o dataframe
rank_paises = rank_paises.T
rank_paises.columns = ['Rank 1','Rank 2','Rank 3','Rank 4','Rank 5'] 
rank_paises

Unnamed: 0,Rank 1,Rank 2,Rank 3,Rank 4,Rank 5
2010,China,Estados Unidos,Argentina,Países Baixos,Alemanha
2011,China,Estados Unidos,Argentina,Países Baixos,Japão
2012,China,Estados Unidos,Argentina,Países Baixos,Japão
2013,China,Estados Unidos,Argentina,Países Baixos,Japão
2014,China,Estados Unidos,Argentina,Países Baixos,Japão
2015,China,Estados Unidos,Argentina,Países Baixos,Alemanha
2016,China,Estados Unidos,Argentina,Países Baixos,Alemanha
2017,China,Estados Unidos,Argentina,Países Baixos,Japão
2018,China,Estados Unidos,Argentina,Países Baixos,Chile
2019,China,Estados Unidos,Argentina,Países Baixos,Japão


Nos últimos 11 anos, **China, EUA, Argentina e Países Baixos** dominam os primeiros lugares. E no 5o lugar, há uma alternância entre Alemanha, Japão, Chile e Canadá. 
<br> E quanto os Top 4 transacionaram neste período?

In [1]:
# Cruzando os dados das colunas PAIS e ANO
evol_paises = pd.crosstab(exp['PAIS'],exp['ANO'],values=exp['VALOR_FOB'],aggfunc=np.sum).T

# Selecionando os países em análise
evol_paises = evol_paises[['China','Estados Unidos','Argentina','Países Baixos']]

# Incluindo o total exportado em cada ano
evol_paises['Total']=exp.groupby(['ANO'])[['VALOR_FOB']].sum()

# Alterando a sequência dos países
evol_paises = evol_paises[['Total','China','Estados Unidos','Argentina','Países Baixos']]

# Criando uma cópia do dataframe para a plotagem 
evol_paises_p = evol_paises.copy()

# Formatando os valores da coluna VALOR_FOB 
for i in evol_paises.columns:
  evol_paises[i]=evol_paises[i]/1000000000
  evol_paises[i]=evol_paises[i].apply(lambda x: "{:.2f}".format(x).replace('.',','))

#  Apresentando os dados
evol_paises

NameError: ignored

In [77]:
# Elaborando dataframe de suporte para o gráfico de barras
evol_paises_p['Demais Paises'] = evol_paises_p['Total']-evol_paises_p['China']-evol_paises_p['Estados Unidos']-evol_paises_p['Argentina']-evol_paises_p['Países Baixos']

# Calculando a participação de cada país no total exportado em cada ano
for pais in evol_paises_p.columns:
  evol_paises_p['% '+pais]=(evol_paises_p[pais]/evol_paises_p['Total']).apply(lambda x: "{:.2%}".format(x))

# Alterando a sequência dos países
evol_paises_p = evol_paises_p[['Total', 'China', '% China', 'Estados Unidos','% Estados Unidos', 'Argentina','% Argentina', 'Países Baixos','% Países Baixos', 
       'Demais Paises','% Demais Paises']]

# Criando lista com os valores do eixo X
ano_list = [str(ano) for ano in evol_paises.index]

# Plotando
fig = go.Figure(go.Bar(x=ano_list, y=evol_paises_p['China'], name='China',text=evol_paises_p['% China'],
            textposition='inside', marker_color='#cdb4db'))
fig.add_trace(go.Bar(x=ano_list, y=evol_paises_p['Estados Unidos'], name='EUA', text=evol_paises_p['% Estados Unidos'],
            textposition='auto', marker_color='#ffc8dd'))
fig.add_trace(go.Bar(x=ano_list, y=evol_paises_p['Argentina'], name='Argentina',text=evol_paises_p['% Argentina'],
            textposition='auto', marker_color='#ffafcc'))
fig.add_trace(go.Bar(x=ano_list, y=evol_paises_p['Países Baixos'], name='Países Baixos',text=evol_paises_p['% Países Baixos'],
            textposition='auto',marker_color='#bde0fe'))
fig.add_trace(go.Bar(x=ano_list, y=evol_paises_p['Demais Paises'], name='Demais Paises',text=evol_paises_p['% Demais Paises'],
            textposition='auto',marker_color='#a2d2ff'))

fig.update_layout(barmode='stack', plot_bgcolor = "#ededed",title={'text':'EVOLUÇÃO - PARTICIPAÇÃO DOS TOP 4 | 2010 - 2021','y':0.925,'x':0.45},xaxis_title='ANO',yaxis_title='VALOR_FOB',width=1450, height=700)
fig.show()


Interessante notar que a **China** foi o **maior comprador** do Brasil em todos os anos do período analisado. E como se não bastasse, desde 2016, o volume de **compras** vem apresentando uma tendência de alta, tendo **duplicado** no período analisado. Enquanto que as próprias **exportações brasileiras** continuaram **estáveis**. <br> Isto quer dizer que a **China** vem se tornando cada vez mais **relevante** para o Brasil!

### 3| Mercadorias mais exportadas

In [78]:
# Agrupando o dataset por ano e ncm
exp_anual = exp.groupby(['ANO','NCM'])[['VALOR_FOB']].sum().reset_index()

# Criando uma lista com as 5 mercadorias mais vendidas em cada ano
lista_T5 =[]
for i in exp_anual.ANO.unique():
     for j in range(5):
        lista_T5.append(exp_anual[exp_anual['ANO']==i].sort_values(['VALOR_FOB'], ascending=False).iloc[j,1])

# Armazenando a lista em um dataframe
rank_ncm = pd.DataFrame()
count=0
for ano in exp_anual.ANO.unique():
    rank_ncm[ano] = lista_T5[count:count+5]
    count+=5
    
# Apresentando o dataframe
rank_ncm = rank_ncm.T
rank_ncm.columns = ['Rank 1','Rank 2','Rank 3','Rank 4','Rank 5'] 
rank_ncm

Unnamed: 0,Rank 1,Rank 2,Rank 3,Rank 4,Rank 5
2010,26011100,27090010,12010090,17011100,26011200
2011,26011100,27090010,12010090,17011100,26011200
2012,26011100,27090010,12019000,17011400,26011200
2013,26011100,12019000,27090010,17011400,26011200
2014,12019000,26011100,27090010,17011400,23040090
2015,12019000,27090010,26011100,17011400,9011110
2016,12019000,26011100,27090010,17011400,47032900
2017,12019000,26011100,27090010,17011400,47032900
2018,12019000,27090010,26011100,47032900,17011400
2019,12019000,27090010,26011100,10059010,47032900


Nada intituitivo a tabela acima certo? Vamos fazer a substituição do NCM pela respectiva mercadoria

In [79]:
# Criando uma lista excluindo os NCMs repetidos
unique_ncm =[]
for ncm in lista_T5:
    if ncm not in unique_ncm:
        unique_ncm.append(ncm)
        
# Colocando os NCM'S em um dataframe, incluindo a respectiva descrição
df_ncm = pd.DataFrame(unique_ncm, columns=['NCM'])
df_ncm['DESCRIÇÃO'] = df_ncm.NCM.map(ncm_dict)
df_ncm

Unnamed: 0,NCM,DESCRIÇÃO
0,26011100,"Minérios de ferro e seus concentrados, exceto ..."
1,27090010,Óleos brutos de petróleo
2,12010090,"Outros grãos de soja, mesmo triturados"
3,17011100,"Açúcar de cana, em bruto"
4,26011200,Minérios de ferro aglomerados e seus concentrados
5,12019000,"Soja, mesmo triturada, exceto para semeadura"
6,17011400,Outros açúcares de cana
7,23040090,"Bagaços e outros resíduos sólidos, da extração..."
8,9011110,"Café não torrado, não descafeinado, em grão"
9,47032900,"Pastas químicas de madeira, à soda ou ao sulfa..."


In [80]:
# Criando uma lista com descrição simplificada das mercadorias
descr_simp = ['Minério ferro ñ aglomerado','Petróleo bruto','Outros grãos de soja','Açúcar de cana','Minério ferro aglomerado','Soja','Outros açúcares de cana','Bagaço da soja','Café em grão','Madeira (Pasta química)', 'Milho em grão','Carne bovina desossada']
df_ncm['DESCRIÇÃO SIMPLIFICADA']=descr_simp

# Criando dicionário com os NCM's com a respectiva descrição simplificada
dict_ncm_simp = {df_ncm.iloc[i,0]:df_ncm.iloc[i,2] for i in range(12)}

# Substituindo os NCM's pela respectiva descrição simplificada
for column in rank_ncm.columns:
    rank_ncm[column]=rank_ncm[column].map(dict_ncm_simp)
rank_ncm

Unnamed: 0,Rank 1,Rank 2,Rank 3,Rank 4,Rank 5
2010,Minério ferro ñ aglomerado,Petróleo bruto,Outros grãos de soja,Açúcar de cana,Minério ferro aglomerado
2011,Minério ferro ñ aglomerado,Petróleo bruto,Outros grãos de soja,Açúcar de cana,Minério ferro aglomerado
2012,Minério ferro ñ aglomerado,Petróleo bruto,Soja,Outros açúcares de cana,Minério ferro aglomerado
2013,Minério ferro ñ aglomerado,Soja,Petróleo bruto,Outros açúcares de cana,Minério ferro aglomerado
2014,Soja,Minério ferro ñ aglomerado,Petróleo bruto,Outros açúcares de cana,Bagaço da soja
2015,Soja,Petróleo bruto,Minério ferro ñ aglomerado,Outros açúcares de cana,Café em grão
2016,Soja,Minério ferro ñ aglomerado,Petróleo bruto,Outros açúcares de cana,Madeira (Pasta química)
2017,Soja,Minério ferro ñ aglomerado,Petróleo bruto,Outros açúcares de cana,Madeira (Pasta química)
2018,Soja,Petróleo bruto,Minério ferro ñ aglomerado,Madeira (Pasta química),Outros açúcares de cana
2019,Soja,Petróleo bruto,Minério ferro ñ aglomerado,Milho em grão,Madeira (Pasta química)


Pronto! Agora ficou mais fácil! <br>
**Minério de ferro** (ñ agloremado) e **Soja** alternam o posto de **mercadoria mais vendida** pelo Brasil em **todos os anos** do período analisado. <br>
Em **2o lugar**, o posto é compartilhado por **Minério de ferro, Soja e Petróleo**. 
Vale ressaltar que o ranking acima evidencia novamente a **predominância de commodities** na pauta de exportação brasileira.


In [81]:
# Os valores que não corresponda aos mais vendidas são substituídos por uma descrição genérica: Outras mercadorias
count = 0
exp_anp = exp.groupby(['ANO','NCM','PAIS'])[['VALOR_FOB']].sum().reset_index()
for ano in exp_anp.ANO.unique():
  exp_anp.loc[(exp_anp['ANO']==ano) & (exp_anp['NCM'].isin(lista_T5[count:count+5])==False),'NCM']='Outras mercadorias'
  count+=5

# Somar os valores fob de Outras Mercadorias de cada ano
exp_anp = exp_anp.groupby(['ANO', 'NCM','PAIS'], as_index=False)[['VALOR_FOB']].sum()

# Incluindo descrição dos NCM´s
dict_ncm_simp['Outras mercadorias']='Outras mercadorias'
exp_anp['NCM']=exp_anp['NCM'].map(dict_ncm_simp)

# Plotando
fig = px.sunburst(exp_anp,path=['ANO','NCM','PAIS'], values='VALOR_FOB',color_discrete_sequence=px.colors.qualitative.Pastel)
fig.update_layout(plot_bgcolor = "#ededed",title={'text':'EVOLUÇÃO - 5 MERCADORIAS MAIS EXPORTADAS | 2010 - 2021','y':0.98,'x':0.5},width=1600, height=1000)
fig.show()

In [82]:
# Salvando o plot no seu drive
fig.write_html("/content/drive/My Drive/Sunburst.html")

### 4| Modais mais utilizados

In [83]:
# Agrupando o dataset por ano e modal 
exp_anomodal = exp.groupby(['ANO','MODAL'])[['VALOR_FOB']].sum().reset_index()

# Criando uma lista com os 5 maiores compradores de cada ano
lista_modal =[]
for i in exp_anomodal.ANO.unique():
     for j in range(5):
        lista_modal.append(exp_anomodal[exp_anomodal['ANO']==i].sort_values(['VALOR_FOB'], ascending=False).iloc[j,1])

# Criando um dataframe com os 5 maiores compradores de cada ano
rank_modais = pd.DataFrame()
count=0
for ano in exp_anomodal.ANO.unique():
    rank_modais[ano] = lista_modal[count:count+5]
    count+=5
    
# Apresentando o dataframe
rank_modais = rank_modais.T
rank_modais.columns = ['Rank 1','Rank 2','Rank 3','Rank 4','Rank 5'] 
rank_modais

Unnamed: 0,Rank 1,Rank 2,Rank 3,Rank 4,Rank 5
2010,MARITIMA,RODOVIARIA,AEREA,MEIOS PROPRIOS,FLUVIAL
2011,MARITIMA,RODOVIARIA,AEREA,MEIOS PROPRIOS,FLUVIAL
2012,MARITIMA,RODOVIARIA,AEREA,MEIOS PROPRIOS,FLUVIAL
2013,MARITIMA,RODOVIARIA,AEREA,MEIOS PROPRIOS,FLUVIAL
2014,MARITIMA,RODOVIARIA,AEREA,MEIOS PROPRIOS,FLUVIAL
2015,MARITIMA,RODOVIARIA,AEREA,MEIOS PROPRIOS,FLUVIAL
2016,MARITIMA,RODOVIARIA,AEREA,MEIOS PROPRIOS,FLUVIAL
2017,MARITIMA,RODOVIARIA,AEREA,MEIOS PROPRIOS,FLUVIAL
2018,MARITIMA,AEREA,RODOVIARIA,MEIOS PROPRIOS,FLUVIAL
2019,MARITIMA,AEREA,RODOVIARIA,FLUVIAL,VIA NAO DECLARADA


Pelo ranking acima, as 3 primeiras posições são alternadas por tres modais: Maritima, Rodoviária, e Aérea. Enquanto que na 4a e 5a posição, há respectivamente, predomínio de meios próprios e fluvial.
Vamos avaliar a evolução destes 5 modais ao longo do periodo analisado. 

In [84]:
# Cruzando os dados das colunas PAIS e ANO
evol_modais = pd.crosstab(exp['ANO'],exp['MODAL'],values=exp['VALOR_FOB'],aggfunc=np.sum)
evol_modais = evol_modais[['MARITIMA','RODOVIARIA','AEREA','MEIOS PROPRIOS','FLUVIAL']]

# Acrescentando duas colunas - Total e Outros modais
evol_modais['TOTAL'] = exp_ano.VALOR_FOB
evol_modais['OUTROS MODAIS'] = evol_modais['TOTAL']-evol_modais['MARITIMA']-evol_modais['RODOVIARIA']-evol_modais['AEREA']

# Calculando a participação de cada modal no volume exportado em cada ano
for modal in evol_modais.columns:
  evol_modais['% '+modal]=(evol_modais[modal]/evol_modais['TOTAL']).apply(lambda x: "{:.2%}".format(x))

# Criando lista com os valores do eixo X
ano_list = [str(ano) for ano in evol_modais.index]

# Plotando o gráfico de barras
fig = go.Figure(go.Bar(x=ano_list, y=evol_modais['MARITIMA'], name='MARITIMA',text=evol_modais['% MARITIMA'],
            textposition='inside', marker_color='#b8c0ff'))
fig.add_trace(go.Bar(x=ano_list, y=evol_modais['RODOVIARIA'], name='RODOVIARIA', text=evol_modais['% RODOVIARIA'],
            textposition='auto', marker_color='#c8b6ff'))
fig.add_trace(go.Bar(x=ano_list, y=evol_modais['AEREA'], name='AEREA',text=evol_modais['% AEREA'],
            textposition='auto', marker_color='#e7c6ff'))
fig.add_trace(go.Bar(x=ano_list, y=evol_modais['OUTROS MODAIS'], name='OUTROS MODAIS',text=evol_modais['% OUTROS MODAIS'],
            textposition='auto',marker_color='#ffd6ff'))

fig.update_layout(barmode='stack', plot_bgcolor = "#f2f2f2",title={'text':'EVOLUÇÃO - PARTICIPAÇÃO DOS TOP 5 | 2010 - 2021','y':0.925,'x':0.45},xaxis_title='ANO',
    yaxis_title='VALOR_FOB',width=1450, height=650)
fig.show()