In [None]:
import pandas as pd
import numpy as np
from sklearn.preprocessing import LabelEncoder

In [None]:
# Montando o Google Drive no ambiente do Google Colab
from google.colab import drive
drive.mount('/content/drive', force_remount=True)

Mounted at /content/drive


In [None]:
# Definindo os caminhos dos arquivos CSV de exportação e importação
file_path = '/content/drive/MyDrive/projeto_dnc/df_exp_tratado.xlsx'

In [None]:
df = pd.read_excel(file_path)

In [None]:
# Removendo valores ausentes e duplicados
df.dropna(inplace=True)
df.drop_duplicates(inplace=True)

In [None]:
df.head()

Unnamed: 0.1,Unnamed: 0,CO_ANO,CO_MES,CO_NCM,CO_PAIS,SG_UF_NCM,KG_LIQUIDO,VL_FOB,Categoria,Produto,Tipo,Origem,Setor
0,0,2024,8,64039990,301,CE,989,25361,Calçados e artigos de calçados,Partes de Calçados,Calçados,Vegetal,Agricultura
1,1,2024,8,24012030,87,SC,462000,4236540,Tabaco e seus substitutos manufaturados,Tabaco não manufaturado; restos de tabaco,Tabaco,Tabaco,Agricultura
2,2,2024,10,33011290,249,SP,2067847,29292037,"Óleos Essenciais, perfumaria, cosmética, higie...","Óleos; essenciais (concretos, absolutos); seus...",Óleos Essenciais,Vegetal,Agricultura
3,3,2024,1,41044130,858,GO,27469,320819,Couros e peles,Couros e peles curtidos ou em crosta de bovino...,Couro,Bovinos,Pecuária
4,4,2024,10,62171000,580,SP,20,75,Vestuário e Acessórios de Vestuário,Roupas,Roupas,Vegetal,Agricultura


In [None]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 423632 entries, 0 to 423631
Data columns (total 13 columns):
 #   Column      Non-Null Count   Dtype 
---  ------      --------------   ----- 
 0   Unnamed: 0  423632 non-null  int64 
 1   CO_ANO      423632 non-null  int64 
 2   CO_MES      423632 non-null  int64 
 3   CO_NCM      423632 non-null  int64 
 4   CO_PAIS     423632 non-null  int64 
 5   SG_UF_NCM   423632 non-null  object
 6   KG_LIQUIDO  423632 non-null  int64 
 7   VL_FOB      423632 non-null  int64 
 8   Categoria   423632 non-null  object
 9   Produto     423632 non-null  object
 10  Tipo        423632 non-null  object
 11  Origem      423632 non-null  object
 12  Setor       423632 non-null  object
dtypes: int64(7), object(6)
memory usage: 42.0+ MB


In [None]:
# Selecionando apenas as colunas relevantes para análise de exportação e importação
df = df[['CO_NCM', 'Origem', 'CO_ANO', 'VL_FOB', 'CO_MES']]

In [None]:
# Agrupando os dados de exportação por NCM somando os valores FOB
df_exp = df.groupby(['CO_NCM', 'Origem', 'CO_ANO', 'CO_MES'], as_index=False)['VL_FOB'].sum()

In [None]:
df_exp.head()

Unnamed: 0,CO_NCM,Origem,CO_ANO,CO_MES,VL_FOB
0,10011100,Trigo,2024,1,48
1,10011100,Trigo,2024,2,60
2,10011100,Trigo,2024,3,45
3,10011100,Trigo,2024,4,239
4,10011100,Trigo,2024,5,23731


In [None]:
df_exp_2023 = pd.read_csv('/content/drive/MyDrive/projeto_dnc/EXP_2023.csv', sep=';')

In [None]:
df_exp_2023.head()

Unnamed: 0,CO_ANO,CO_MES,CO_NCM,CO_UNID,CO_PAIS,SG_UF_NCM,CO_VIA,CO_URF,QT_ESTAT,KG_LIQUIDO,VL_FOB
0,2023,3,84139190,10,160,RJ,4,817700,107365,5,20
1,2023,12,73182100,10,764,SP,1,817800,0,0,84
2,2023,4,84219999,10,40,RS,4,817600,2,2,758
3,2023,5,85291090,10,63,RJ,7,1017503,1,1,275
4,2023,10,84825010,11,63,MG,7,1017503,2,0,9


In [None]:
df_exp_2024 = df_exp.copy()

In [None]:
df_exp_2024.head()

Unnamed: 0,CO_NCM,Origem,CO_ANO,CO_MES,VL_FOB
0,10011100,Trigo,2024,1,48
1,10011100,Trigo,2024,2,60
2,10011100,Trigo,2024,3,45
3,10011100,Trigo,2024,4,239
4,10011100,Trigo,2024,5,23731


In [None]:
# Selecionando apenas as colunas relevantes para análise de exportação e importação
df_exp_2023 = df_exp_2023[['CO_NCM', 'CO_ANO', 'VL_FOB', 'CO_MES']].reset_index(drop=True)

In [None]:
df_exp_2023.head()

Unnamed: 0,CO_NCM,CO_ANO,VL_FOB,CO_MES
0,84139190,2023,20,3
1,73182100,2023,84,12
2,84219999,2023,758,4
3,85291090,2023,275,5
4,84825010,2023,9,10


In [None]:
# Fazendo merge com base na coluna CO_NCM
df_exp_2023 = df_exp_2023.merge(
    df_exp[['CO_NCM', 'Origem']],
    on='CO_NCM',
    how='left'
)

In [None]:
df_exp_2023.head()

Unnamed: 0,CO_NCM,CO_ANO,VL_FOB,CO_MES,Origem
0,84139190,2023,20,3,
1,73182100,2023,84,12,
2,84219999,2023,758,4,
3,85291090,2023,275,5,
4,84825010,2023,9,10,


In [None]:
df_exp_2023 = df_exp_2023.dropna().reset_index(drop=True)

In [None]:
df_exp_2023.rename(columns={'VL_FOB': 'VL_FOB_2023'}, inplace=True)
df_exp_2024.rename(columns={'VL_FOB': 'VL_FOB_2024'}, inplace=True)

In [None]:
# Agrupando os dados de exportação por NCM somando os valores FOB
df_exp_2024 = df_exp_2024.groupby(['Origem', 'CO_MES', 'CO_ANO'], as_index=False)['VL_FOB_2024'].sum()
df_exp_2023 = df_exp_2023.groupby(['Origem', 'CO_MES', 'CO_ANO'], as_index=False)['VL_FOB_2023'].sum()

In [None]:
label_dict = {
    'Soja': 1,
    'Cana de Açúcar': 2,
    'Madeira': 3,
    'Milho': 4,
    'Algodão': 5,
    'Tabaco': 6,
    'Vegetal': 7,
    'Animal': 8,
    'Trigo': 9,
    'Bovinos': 10,
    'Amendoim': 11,
    'Oleaginosas': 12,
    'Vegetal e Animal': 13,
    'Cacau': 14,
    'Arroz': 15,
    'Malte': 16,
    'Leveduras': 17,
    'Plantas ': 18,
    'Sorgo': 19,
    'Amido': 20,
    'Colza': 21,
    'Peixe': 22,
    'Cereais': 23,
    'Mandioca': 24,
    'Animais': 25,
    'Palma': 26,
    'Uva': 27,
    'Aveia': 28,
    'Aves': 29,
    'Centeio': 30,
    'Azeitona': 31,
    'Lã': 32,
    'Tomate': 33,
    'Girassol': 34,
    'Cevada': 35,
    'Madeira': 36
}

In [None]:
# Aplica a codificação
df_exp_2023['Origem_codificada'] = df_exp_2023['Origem'].map(label_dict)
df_exp_2024['Origem_codificada'] = df_exp_2024['Origem'].map(label_dict)

In [None]:
df_exp_2023.head()

Unnamed: 0,Origem,CO_MES,CO_ANO,VL_FOB_2023,Origem_codificada
0,Algodão,1,2023,2928049209,5
1,Algodão,2,2023,1100481571,5
2,Algodão,3,2023,1845815708,5
3,Algodão,4,2023,1510628176,5
4,Algodão,5,2023,1479904440,5


In [None]:
df_exp_2024.head()

Unnamed: 0,Origem,CO_MES,CO_ANO,VL_FOB_2024,Origem_codificada
0,Algodão,1,2024,492037339,5
1,Algodão,2,2024,495545820,5
2,Algodão,3,2024,495741571,5
3,Algodão,4,2024,483085340,5
4,Algodão,5,2024,461097359,5


In [None]:
# Converter a coluna para int (truncando)
df_exp_2024['Origem_codificada'] = df_exp_2024['Origem_codificada'].astype(int)
df_exp_2023['Origem_codificada'] = df_exp_2023['Origem_codificada'].astype(int)

In [None]:
# Calculando o valor total geral
total_exp_2024 = df_exp_2024['VL_FOB_2024'].sum()

# Criando uma nova coluna com a participação percentual de cada produto
df_exp_2024['PERC_PARTICIPACAO_EXP'] = ((df_exp_2024['VL_FOB_2024'] / total_exp_2024) * 100).round(2)

# Ordenando do maior para o menor
df_exp_2024 = df_exp_2024.sort_values(by='PERC_PARTICIPACAO_EXP', ascending=False)

In [None]:
# Calculando o valor total geral
total_exp_2023 = df_exp_2023['VL_FOB_2023'].sum()

# Criando uma nova coluna com a participação percentual de cada produto
df_exp_2023['PERC_PARTICIPACAO_EXP'] = ((df_exp_2023['VL_FOB_2023'] / total_exp_2023) * 100).round(2)

# Ordenando do maior para o menor
df_exp_2023 = df_exp_2023.sort_values(by='PERC_PARTICIPACAO_EXP', ascending=False)

In [None]:
df_exp_2024

Unnamed: 0,Origem,CO_MES,CO_ANO,VL_FOB_2024,Origem_codificada,PERC_PARTICIPACAO_EXP
310,Soja,4,2024,7331227339,1,5.79
312,Soja,6,2024,7161334505,1,5.66
311,Soja,5,2024,6717252776,1,5.31
309,Soja,3,2024,6240211847,1,4.93
313,Soja,7,2024,5983993631,1,4.73
...,...,...,...,...,...,...
373,Uva,8,2024,1300157,27,0.00
374,Uva,9,2024,1384196,27,0.00
375,Uva,10,2024,1362772,27,0.00
376,Uva,11,2024,1201418,27,0.00


In [None]:
df_exp_2024 = df_exp_2024.merge(
    df_exp_2023[['Origem_codificada', 'VL_FOB_2023']],
    on='Origem_codificada',
    how='left'
)

In [None]:
df_exp_2024

Unnamed: 0,Origem,CO_MES,CO_ANO,VL_FOB_2024,Origem_codificada,PERC_PARTICIPACAO_EXP,VL_FOB_2023
0,Soja,4,2024,7331227339,1,5.79,118271762442
1,Soja,4,2024,7331227339,1,5.79,106383755600
2,Soja,4,2024,7331227339,1,5.79,104215933893
3,Soja,4,2024,7331227339,1,5.79,97237157607
4,Soja,4,2024,7331227339,1,5.79,72093258605
...,...,...,...,...,...,...,...
4696,Uva,12,2024,945762,27,0.00,14424527
4697,Uva,12,2024,945762,27,0.00,5706316
4698,Uva,12,2024,945762,27,0.00,11507268
4699,Uva,12,2024,945762,27,0.00,14636257


In [None]:
df_exp_2024 = df_exp_2024.groupby(['Origem', 'CO_MES', 'CO_ANO', 'PERC_PARTICIPACAO_EXP'], as_index=False)[['VL_FOB_2024', 'VL_FOB_2023']].sum()

In [None]:
# 3. Calcular a diferença
df_exp_2024['DIF_VL_FOB'] = df_exp_2024['VL_FOB_2024'] - df_exp_2024['VL_FOB_2023']

In [None]:
df_exp_2024['PERC_DIF_VL_FOB'] = ((df_exp_2024['DIF_VL_FOB'] / df_exp_2024['VL_FOB_2023']) * 100).round(2)

In [None]:
df_exp_2024

Unnamed: 0,Origem,CO_MES,CO_ANO,PERC_PARTICIPACAO_EXP,VL_FOB_2024,VL_FOB_2023,DIF_VL_FOB,PERC_DIF_VL_FOB
0,Algodão,1,2024,0.39,5904448068,38411827694,-32507379626,-84.63
1,Algodão,2,2024,0.39,5946549840,38411827694,-32465277854,-84.52
2,Algodão,3,2024,0.39,5948898852,38411827694,-32462928842,-84.51
3,Algodão,4,2024,0.38,5797024080,38411827694,-32614803614,-84.91
4,Algodão,5,2024,0.36,5533168308,38411827694,-32878659386,-85.60
...,...,...,...,...,...,...,...,...
397,Vegetal e Animal,8,2024,0.12,1750854372,19309257520,-17558403148,-90.93
398,Vegetal e Animal,9,2024,0.12,1831067520,19309257520,-17478190000,-90.52
399,Vegetal e Animal,10,2024,0.11,1726828944,19309257520,-17582428576,-91.06
400,Vegetal e Animal,11,2024,0.12,1870654140,19309257520,-17438603380,-90.31


In [None]:
df_exp_2024.to_csv('df_exp_2024.csv')