### Puxar base de dados

In [None]:
import pandas as pd
from pathlib import Path
import os
import locale

# Definir a localidade para os Estados Unidos para formatação de moeda
locale.setlocale(locale.LC_ALL, 'en_US.UTF-8')

# Obter o caminho completo do arquivo 'exportacoes_franca.csv' no diretório atual
caminho_arquivo = Path(os.getcwd()) / 'exportacoes_franca.csv'

# Ler o arquivo CSV no DataFrame
franca_df = pd.read_csv(caminho_arquivo)

# Exibir o DataFrame para verificar os dados
display(franca_df)


### Informações Gerais

Quantas linhas têm a tabela? Existe algum valor vazio que deveria ser tratado?

In [None]:
# Calcular o número de valores nulos em cada coluna
valores_nulos = franca_df.isnull().sum()

# Obter o número de linhas do DataFrame
numero_linhas = franca_df.shape[0]

# Exibir o número total de linhas do DataFrame
display('Número de linhas {}'.format(numero_linhas))

# Exibir a contagem de valores nulos em cada coluna
display(valores_nulos)


### Como foi a evolução das exportações para a frança ao longo dos anos?

Crie uma tabela com os anos de 2016, 2017, 2018, 2019 e 2020 e o valor US$ de exportações

In [None]:
# Filtrar os dados para obter apenas as exportações a partir de 2017 (ano > 2016)
franca_df2016_2020 = franca_df[franca_df['Year'] >= 2016]

# Calcular o valor total das exportações em dólares entre 2016 e 2020
valores_dolares2016_2020 = franca_df2016_2020['US$ FOB'].sum()

# Formatar o valor total das exportações em dólares para uma string formatada com separadores de milhar
valores_dolares2016_2020_formatado = locale.currency(valores_dolares2016_2020, grouping=True)

# Exibir o DataFrame filtrado para verificar os dados
display(franca_df2016_2020)

# Imprimir o valor total exportado de 2016 a 2020, formatado como moeda
print(f'Valor total exportado de 2016 há 2020: {valores_dolares2016_2020_formatado}')


### Quais os produtos mais exportados ao longo de todo o período?

Queremos saber os produtos com maior valor US$ de exportação

In [None]:
# Definir a localidade para os Estados Unidos
locale.setlocale(locale.LC_ALL, 'en_US.UTF-8')

# Agrupar os dados pela descrição dos produtos e somar os valores de 'US$ FOB'
produtos_mais_exportados = franca_df.groupby('SH2 Description')['US$ FOB'].sum().reset_index()

# Ordenar o DataFrame resultante pelo valor de 'US$ FOB' em ordem decrescente
produtos_mais_exportados = produtos_mais_exportados.sort_values(by='US$ FOB', ascending=False)

# Selecionar os 10 produtos mais exportados
top10_produtos_mais_exportados = produtos_mais_exportados.head(10)

# Imprimir o título
print('Top 10 produtos mais exportados: ')

# Iterar sobre os 10 produtos mais exportados e imprimir seus valores formatados
for index, row in top10_produtos_mais_exportados.iterrows():
    print(f'{index + 1} - {row["SH2 Description"]}: {locale.currency(row["US$ FOB"], grouping=True)}')

# Exibir o DataFrame completo dos produtos mais exportados
display(produtos_mais_exportados)


### Em 2020 qual cidade mais exportou para a França?
Em valores US$

In [None]:
# Agrupar os dados pelo nome da cidade e somar os valores de 'US$ FOB'
cidade_mais_exportou = franca_df.groupby('City')['US$ FOB'].sum().reset_index()

# Ordenar o DataFrame resultante pelo valor de 'US$ FOB' em ordem decrescente
cidade_mais_exportou = cidade_mais_exportou.sort_values(by='US$ FOB', ascending=False)

# Selecionar a cidade com o maior valor exportado (primeira linha do DataFrame ordenado)
cidade_mais_exportou = cidade_mais_exportou.head(1)

# Obter o nome da cidade que mais exportou
cidade = cidade_mais_exportou.iloc[0]['City']

# Obter o valor total exportado pela cidade que mais exportou
valor_exportado = cidade_mais_exportou.iloc[0]['US$ FOB']

# Imprimir o resultado formatado com o nome da cidade e o valor exportado em dólares
print(f'A cidade que mais exportou: {cidade} com um valor de {locale.currency(valor_exportado, grouping=True)}')


### Quais os produtos mais exportados (em US$) que as 2 maiores cidades (em exportação em 2020) exportaram?

In [None]:
# Agrupar por cidade e somar o peso líquido
duas_maiores_cidades = franca_df.groupby('City')['Net Weight'].sum().reset_index()

# Ordenar do maior para o menor peso líquido
duas_maiores_cidades = duas_maiores_cidades.sort_values(by='Net Weight', ascending=False)

# Selecionar as duas maiores cidades
duas_maiores_cidades = duas_maiores_cidades.head(2)

# Filtrar as exportações das duas maiores cidades em 2020
exportacao_2020_duas_maiores_cidades = franca_df[(franca_df['Year'] == 2020) & (franca_df['City'].isin(duas_maiores_cidades['City']))]

# Agrupar por cidade e somar o valor das exportações
exportacao_2020_duas_maiores_cidades = exportacao_2020_duas_maiores_cidades.groupby('City')['US$ FOB'].sum().reset_index()

# Obter a descrição do produto mais exportado em 2020 pelas duas maiores cidades
produtos_filtrados = franca_df[(franca_df['Year'] == 2020) & (franca_df['City'].isin(duas_maiores_cidades['City']))]
produto_mais_exportado_duas_maiores_cidades_2020 = produtos_filtrados.groupby(['City', 'SH2 Description'])['US$ FOB'].sum().reset_index()
produto_mais_exportado_duas_maiores_cidades_2020 = produto_mais_exportado_duas_maiores_cidades_2020.sort_values(by='US$ FOB', ascending=False).drop_duplicates('City')

# Imprimir os resultados
print("Exportação das duas maiores cidades em 2020:")
print(exportacao_2020_duas_maiores_cidades)
print("\nProduto mais exportado pelas duas maiores cidades em 2020:")
print(produto_mais_exportado_duas_maiores_cidades_2020)
