In [226]:
import pandas as pd
import numpy as np
import warnings
import plotly.express as px
import plotly.graph_objects as go

warnings.filterwarnings('ignore')
np.random.seed(42)
pd.set_option("display.max_rows", None)
pd.set_option("display.max_columns", None)
pd.options.display.float_format = '{:,.2f}'.format

# Trabalhando os Dados Iniciais

Critérios de corte Inicial:
Importações menores que 1000 litros no total de 15 anos.
Países que só fizeram 1 ou 2 compras no período de 15 anos e não foram nos anos de 2021 ou 2022 (Compradores eventuais)
Corte da Rússia que causa uma distorção nos dados por conta de um acordo comercial entre Brasil e Rússia que fez o ano de 2009 ter um volume fora da realidade. Sem contar que a indefinição da guerra com a Ukrânia nao inspira confiança em investir em uma parceria neste momento.

In [227]:
df = pd.read_excel('./ExportacaoVinhos.xlsx')
df_inicial = df[df.columns[0:31]]
df_inicial.head()

Unnamed: 0,Pais,2008_KG,2008_USD,2009_KG,2009_USD,2010_KG,2010_USD,2011_KG,2011_USD,2012_KG,2012_USD,2013_KG,2013_USD,2014_KG,2014_USD,2015_KG,2015_USD,2016_KG,2016_USD,2017_KG,2017_USD,2018_KG,2018_USD,2019_KG,2019_USD,2020_KG,2020_USD,2021_KG,2021_USD,2022_KG,2022_USD
0,Paraguai,2191901,1374088,486927,392087,510989,449197,240168,276281,354824,428279,481564,680828,521847,908028,495428,741370,985739,1655417,2393468,4274650,3234168,5494321,2419537,3826587,3299013,3869243,6522527,7192362,5076670,7156293
1,Estados Unidos,443895,804607,372319,660066,228968,478630,306787,1030254,146585,303986,245368,786556,222267,494216,195896,524109,258072,687411,132688,1523699,169109,512519,209765,616274,300178,610793,111085,203554,220373,447893
2,China,8689,25926,1553416,482400,795,2358,54156,334867,87905,642177,40929,279956,64040,455340,47609,222866,134106,499622,67594,266086,30835,126336,129852,376828,122253,363000,61884,264116,105395,404647
3,Espanha,2942,6834,2181,4050,0,0,5206,24618,0,0,1972980,3748940,0,0,0,0,0,0,0,0,6123,22631,3540,1353,28,126,0,0,0,0
4,Haiti,20,20,4500,5863,2700,3750,0,0,0,0,0,0,0,0,0,0,0,0,0,0,79500,144425,81873,129803,399128,471152,670379,831181,553503,741014


In [228]:
df_inicial.shape

(71, 31)

In [229]:
df_melted = pd.melt(df_inicial, id_vars=['Pais'], var_name='Ano e Valor', value_name='Quantidade')
df_melted[['Ano', 'Valor']] = df_melted['Ano e Valor'].str.split('_', expand=True)
df_exportacao = df_melted.pivot(index=['Pais', 'Ano'], columns='Valor', values='Quantidade').reset_index()
df_exportacao.columns.name = None 
df_exportacao = df_exportacao.rename(columns={'KG': 'Litros', 'Pais' : 'Destino'})
df_exportacao['Origem'] = 'Brasil'
df_exportacao['Ano'] = pd.to_datetime(df_exportacao['Ano'], format='%Y')
df_exportacao['Litros'] = df_exportacao['Litros'].astype(float)
df_exportacao['USD'] = df_exportacao['USD'].astype(float)
df_exportacao.head()

Unnamed: 0,Destino,Ano,Litros,USD,Origem
0,Alemanha,2008-01-01,265742.0,429970.0,Brasil
1,Alemanha,2009-01-01,225086.0,393482.0,Brasil
2,Alemanha,2010-01-01,27715.0,138666.0,Brasil
3,Alemanha,2011-01-01,36070.0,144150.0,Brasil
4,Alemanha,2012-01-01,8189.0,56342.0,Brasil


In [230]:
df_exportacao.shape

(1065, 5)

In [231]:
df_exportacao.describe()

Unnamed: 0,Ano,Litros,USD
count,1065,1065.0,1065.0
mean,2015-01-01 03:12:00,45938.76,81684.62
min,2008-01-01 00:00:00,0.0,0.0
25%,2011-01-01 00:00:00,0.0,0.0
50%,2015-01-01 00:00:00,468.0,1549.0
75%,2019-01-01 00:00:00,7179.0,23780.0
max,2022-01-01 00:00:00,6522527.0,7192362.0
std,,330010.49,449592.23


In [232]:
df_exportacao.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1065 entries, 0 to 1064
Data columns (total 5 columns):
 #   Column   Non-Null Count  Dtype         
---  ------   --------------  -----         
 0   Destino  1065 non-null   object        
 1   Ano      1065 non-null   datetime64[ns]
 2   Litros   1065 non-null   float64       
 3   USD      1065 non-null   float64       
 4   Origem   1065 non-null   object        
dtypes: datetime64[ns](1), float64(2), object(2)
memory usage: 41.7+ KB


In [233]:
df_exportacao['Destino'].nunique()

71

#### Anotação: Nos últimos 15 anos nós exportamos vinho para 71 Países.

# Gerando a Tabela Solicitada Pelo Head de Dados

In [234]:
df_total_por_pais = df_exportacao.groupby(['Origem','Destino']).sum(['Litros','USD']).sort_values('Litros', ascending=False)
df_total_por_pais.reset_index(inplace=True)
df_total_por_pais.head()

Unnamed: 0,Origem,Destino,Litros,USD
0,Brasil,Paraguai,29214770.0,38719031.0
1,Brasil,Estados Unidos,3563355.0,9684567.0
2,Brasil,China,2509458.0,4746525.0
3,Brasil,Espanha,1993000.0,3808552.0
4,Brasil,Haiti,1791603.0,2327208.0


In [235]:
df_total_por_pais.to_excel('./ExportacaoVinhosTotais.xlsx', index=False)

# Trabalhando com os dados totais dos últimos 15 anos

In [236]:
df_total_por_pais['USD_por_Litro'] = df_total_por_pais['USD'] / df_total_por_pais['Litros']
df_total_por_pais.head(10)

Unnamed: 0,Origem,Destino,Litros,USD,USD_por_Litro
0,Brasil,Paraguai,29214770.0,38719031.0,1.33
1,Brasil,Estados Unidos,3563355.0,9684567.0,2.72
2,Brasil,China,2509458.0,4746525.0,1.89
3,Brasil,Espanha,1993000.0,3808552.0,1.91
4,Brasil,Haiti,1791603.0,2327208.0,1.3
5,Brasil,Reino Unido,1239551.0,4711464.0,3.8
6,Brasil,Paises Baixos,1236154.0,3791611.0,3.07
7,Brasil,Japão,1181692.0,2377716.0,2.01
8,Brasil,Alemanha,909051.0,2546394.0,2.8
9,Brasil,Uruguai,792595.0,1219878.0,1.54


### Optei por trabalhar com os dados dos top 10 em volume de exportação que representam 90,82% dos nossos dados.

In [237]:
top10 = df_total_por_pais.sort_values('Litros', ascending=False)['Destino'].head(10).to_list()
top10

['Paraguai',
 'Estados Unidos',
 'China',
 'Espanha',
 'Haiti',
 'Reino Unido',
 'Paises Baixos',
 'Japão',
 'Alemanha',
 'Uruguai']

In [238]:
df_total_top10 = df_total_por_pais[df_total_por_pais['Destino'].isin(top10)]
df_total_top10

Unnamed: 0,Origem,Destino,Litros,USD,USD_por_Litro
0,Brasil,Paraguai,29214770.0,38719031.0,1.33
1,Brasil,Estados Unidos,3563355.0,9684567.0,2.72
2,Brasil,China,2509458.0,4746525.0,1.89
3,Brasil,Espanha,1993000.0,3808552.0,1.91
4,Brasil,Haiti,1791603.0,2327208.0,1.3
5,Brasil,Reino Unido,1239551.0,4711464.0,3.8
6,Brasil,Paises Baixos,1236154.0,3791611.0,3.07
7,Brasil,Japão,1181692.0,2377716.0,2.01
8,Brasil,Alemanha,909051.0,2546394.0,2.8
9,Brasil,Uruguai,792595.0,1219878.0,1.54


In [239]:
df_exportacao_top10 = df_exportacao[df_exportacao['Destino'].isin(top10)]
df_exportacao_top10.head()

Unnamed: 0,Destino,Ano,Litros,USD,Origem
0,Alemanha,2008-01-01,265742.0,429970.0,Brasil
1,Alemanha,2009-01-01,225086.0,393482.0,Brasil
2,Alemanha,2010-01-01,27715.0,138666.0,Brasil
3,Alemanha,2011-01-01,36070.0,144150.0,Brasil
4,Alemanha,2012-01-01,8189.0,56342.0,Brasil


In [240]:
fig = px.bar(df_total_top10, x='Destino', y=['Litros'], title='Litros exportados destino')
fig.show()

In [241]:
fig = px.bar(df_total_top10, x='Destino', y=['USD'], title='Dolares por destino')
fig.show()

In [242]:
fig = px.bar(df_total_top10.sort_values(by='USD_por_Litro',ascending=False), x='Destino', y=['USD_por_Litro'], title='Dolar por Litro em cada destino')
fig.show()

In [243]:
df_producao_exportacao = pd.read_excel('./ProducaoExportacao.xlsx')
df_producao_exportacao['Ano'] = pd.to_datetime(df_producao_exportacao['Ano'], format='%Y')
df_producao_exportacao['Produzido'] = df_producao_exportacao['Produzido'].astype(float)
df_producao_exportacao['Exportado'] = df_producao_exportacao['Exportado'].astype(float)
df_producao_exportacao['PTAX'] = df_producao_exportacao['PTAX'].astype(float)
df_producao_exportacao.head()

Unnamed: 0,Ano,Produzido,Exportado,PTAX
0,2008-01-01,334841312.0,10346323.0,2.34
1,2009-01-01,245318774.0,25514198.0,1.74
2,2010-01-01,220073693.0,1280574.0,1.67
3,2011-01-01,305439220.0,1214834.0,1.88
4,2012-01-01,257977767.0,5775376.0,2.04


In [244]:
fig = px.bar(df_producao_exportacao.sort_values(by='Produzido',ascending=False), x='Ano', y=['Produzido','Exportado'], title='Produzido vs Exportado', barmode='group')
fig.show()

In [245]:
fig = go.Figure()
fig.add_trace(go.Bar(x=df_producao_exportacao['Ano'], y=df_producao_exportacao['Produzido'], name='Produzido'))
fig.add_trace(go.Scatter(x=df_producao_exportacao['Ano'], y=df_producao_exportacao['Produzido'], mode='lines', name='Tendência', line=dict(color='red')))
fig.update_layout(title='Variação da Produção Anual com Linha de Tendência',
                  xaxis_title='Ano',
                  yaxis_title='Produção',
                  barmode='group',
                  xaxis_tickangle=-45,
                  xaxis=dict(tickvals=df_producao_exportacao['Ano'], ticktext=df_producao_exportacao['Ano'].dt.year))

fig.show()

#### Observação: Em 2016, a safra de uvas teve uma das maiores quebras registradas, com uma redução de 57% em relação ao ano anterior, equivalente, aproximadamente, a 300 milhões de quilos de uvas no território gaúcho. A principal causa da quebra histórica no ano 2016 foi uma série de acontecimentos climáticos que prejudicaram o desenvolvimento das uvas ao longo do ano, como geadas e excesso de chuvas.

In [246]:
fig = go.Figure()
fig.add_trace(go.Bar(x=df_producao_exportacao['Ano'], y=df_producao_exportacao['Exportado'], name='Exportado'))
fig.add_trace(go.Scatter(x=df_producao_exportacao['Ano'], y=df_producao_exportacao['Exportado'], mode='lines', name='Tendência', line=dict(color='red')))
fig.update_layout(title='Variação da Exportação Anual com Linha de Tendência',
                  xaxis_title='Ano',
                  yaxis_title='Exportação',
                  barmode='group',
                  xaxis_tickangle=-45,
                  xaxis=dict(tickvals=df_producao_exportacao['Ano'], ticktext=df_producao_exportacao['Ano'].dt.year))

fig.show()

In [247]:
fig = go.Figure()
fig.add_trace(go.Bar(x=df_producao_exportacao['Ano'], y=df_producao_exportacao['PTAX'], name='PTAX'))
fig.add_trace(go.Scatter(x=df_producao_exportacao['Ano'], y=df_producao_exportacao['PTAX'], mode='lines', name='Tendência', line=dict(color='red')))
fig.update_layout(title='Variação da PTAX Anual com Linha de Tendência',
                  xaxis_title='Ano',
                  yaxis_title='PTAX',
                  barmode='group',
                  xaxis_tickangle=-45,
                  xaxis=dict(tickvals=df_producao_exportacao['Ano'], ticktext=df_producao_exportacao['Ano'].dt.year))

fig.show()

In [248]:
total_produzido = df_producao_exportacao['Produzido'].sum()
total_exportado = df_producao_exportacao['Exportado'].sum()
dolar_medio = df_producao_exportacao['PTAX'].mean()
percentual_exportado= (total_exportado/total_produzido) * 100

print(f"Total Produzido: {total_produzido}")
print(f"Total Exportado: {total_exportado}")
print(f"Percentual Exportado: {percentual_exportado}")
print(f"Dolar Médio: {dolar_medio}")

Total Produzido: 3548338710.0
Total Exportado: 87982432.0
Percentual Exportado: 2.4795387134843168
Dolar Médio: 3.268986666666667


# Pegando dados de consumo, importação, exportação inflação projetada e produção do top 10

In [249]:
df_dados_top10 = pd.read_excel('./top10.xlsx')
df_dados_top10['Ano'] = pd.to_datetime(df_dados_top10['Ano'], format='%Y')
df_dados_top10['Litros'] = df_dados_top10['Litros'].astype(float)
df_dados_top10.sample(10)

Unnamed: 0,Ano,Pais,Variavel,Litros
250,2008-01-01,Espanha,Produção,3591300000.0
521,2011-01-01,Reino Unido,Exportação,86600000.0
268,2014-01-01,Espanha,Produção,3949400000.0
55,2011-01-01,Alemanha,Importação,1613300000.0
549,2009-01-01,Uruguai,Exportação,2000000.0
328,2019-01-01,Reino Unido,Produção,7900000.0
245,2021-01-01,Paraguai,Importação,26000000.0
520,2010-01-01,Reino Unido,Exportação,89800000.0
82,2020-01-01,Alemanha,Importação,1448600000.0
529,2019-01-01,Reino Unido,Exportação,95400000.0


In [250]:
df_pivot = df_dados_top10.pivot_table(index=['Ano', 'Pais'], columns='Variavel', values='Litros', aggfunc='sum').reset_index()
df_pivot.fillna(0, inplace=True)
columns_to_update = ['Produção', 'Exportação', 'Importação', 'Consumo']
df_pivot[columns_to_update] = df_pivot[columns_to_update] / 1000000
df_pivot['Saldo'] =  df_pivot['Produção'] + df_pivot['Importação'] - df_pivot['Exportação'] - df_pivot['Consumo']
df_pivot.head()

Variavel,Ano,Pais,Consumo,Exportação,Importação,Produção,Saldo
0,2008-01-01,Alemanha,2074.7,358.0,1370.8,999.1,-62.8
1,2008-01-01,China,1404.6,5.4,164.9,1260.0,14.9
2,2008-01-01,Espanha,954.2,1691.4,60.7,3591.3,1006.4
3,2008-01-01,Estados Unidos,2770.0,463.8,825.0,1934.0,-474.8
4,2008-01-01,Haiti,0.5,0.0,0.5,0.0,0.0


In [251]:
df_economia_top10 = pd.read_excel('./WEO_Data.xlsx')
df_economia_top10['Ano'] = pd.to_datetime(df_economia_top10['Ano'], format='%Y')
df_pivot_economia = df_economia_top10.pivot_table(index=['Ano', 'Pais'], columns='Variavel', values='Percentual', aggfunc='sum').reset_index()
df_pivot_economia.fillna(0, inplace=True)
df_pivot_economia.head()

Variavel,Ano,Pais,Importação,Inflação
0,2024-01-01,Alemanha,3.39,2.75
1,2024-01-01,China,0.78,1.9
2,2024-01-01,Espanha,4.8,3.37
3,2024-01-01,Estados Unidos,-0.83,2.59
4,2024-01-01,Haiti,1.4,12.68


In [252]:

figs = []

for pais in df_pivot['Pais'].unique():
    df_temp = df_pivot[df_pivot['Pais'] == pais]

    df_temp2 = df_exportacao_top10[df_exportacao_top10['Destino'] == pais]
    
    fig2 = px.bar(df_temp2, 
                  x='Ano', 
                  y='Litros', 
                  title=f'Brasil para {pais} por ano',
                  labels={'Litros': 'Litros Exportados', 'Ano': 'Ano'})

    fig = px.bar(df_temp,
                 x="Ano",
                 y=["Consumo", "Importação", "Produção", "Exportação"],
                 color_discrete_sequence=["blue", "green", "red","orange"],
                 barmode="group")
    
    fig.update_layout(title=f'Consumo, Importação, Exportação e Produção - {pais}',
                      xaxis_title='Ano',
                      yaxis_title='Milhões de Litros',
                      xaxis_tickangle=-45,
                      legend_title_text='',
                      xaxis=dict(tickvals=df_temp['Ano'], ticktext=df_temp['Ano'].dt.year))

    fig1 = go.Figure()
    fig1.add_trace(go.Bar(x=df_temp['Ano'], y=df_temp['Saldo'], name='Saldo'))
    fig1.add_trace(go.Scatter(x=df_temp['Ano'], y=df_temp['Saldo'], mode='lines', name='Tendência', line=dict(color='red')))
    fig1.update_layout(title=f'Saldo Anual com Linha de Tendência - {pais}',
                    xaxis_title='Ano',
                    yaxis_title='Milhões de Litros',
                    barmode='group',
                    xaxis_tickangle=-45,
                    xaxis=dict(tickvals=df_pivot['Ano'], ticktext=df_pivot['Ano'].dt.year))
    
    fig3 = go.Figure()
    subset = df_pivot_economia[df_pivot_economia['Pais'] == pais]
    fig3.add_trace(go.Scatter(x=subset['Ano'], y=subset['Inflação'],
                    mode='lines+markers',
                    name=pais))

    fig3.update_layout(title=f'Projeção de Inflação nos Próximos anos - {pais}',
                    xaxis_title='Ano',
                    yaxis_title='Inflação (%)',
                    xaxis=dict(tickvals=subset['Ano'], ticktext=subset['Ano'].dt.year))

    figs.append(fig)
    figs.append(fig1)
    figs.append(fig2)
    figs.append(fig3)

for fig in figs:
    fig.show()


