### Puxar base de dados

In [None]:
import pandas as pd
from pathlib import Path
import os
import locale

# Definir a localidade para os Estados Unidos para formatação de moeda
locale.setlocale(locale.LC_ALL, 'en_US.UTF-8')

# Obter o caminho completo do arquivo 'exportacoes_franca.csv' no diretório atual
caminho_arquivo = Path(os.getcwd()) / 'exportacoes_franca.csv'

# Ler o arquivo CSV no DataFrame
franca_df = pd.read_csv(caminho_arquivo)

# Exibir o DataFrame para verificar os dados
display(franca_df)


### Informações Gerais

Quantas linhas têm a tabela? Existe algum valor vazio que deveria ser tratado?

In [None]:
# Calcular o número de valores nulos em cada coluna
valores_nulos = franca_df.isnull().sum()

# Obter o número de linhas do DataFrame
numero_linhas = franca_df.shape[0]

# Exibir o número total de linhas do DataFrame
display('Número de linhas {}'.format(numero_linhas))

# Exibir a contagem de valores nulos em cada coluna
display(valores_nulos)


### Como foi a evolução das exportações para a frança ao longo dos anos?

Crie uma tabela com os anos de 2016, 2017, 2018, 2019 e 2020 e o valor US$ de exportações

In [None]:
# Agrupar os dados por ano e somar apenas as colunas numéricas
franca_df2016_2020 = franca_df.groupby('Year').sum(numeric_only=True)

# Selecionar apenas a coluna 'US$ FOB'
franca_df2016_2020 = franca_df2016_2020[['US$ FOB']]

# Calcular o valor total das exportações em dólares entre 2016 e 2020
valores_dolares2016_2020 = franca_df2016_2020['US$ FOB'].sum()

# Formatar o valor total das exportações em dólares para uma string formatada com separadores de milhar
valores_dolares2016_2020_formatado = locale.currency(valores_dolares2016_2020, grouping=True)

# Iterar sobre cada linha do DataFrame e imprimir o valor exportado por ano, formatado como moeda
for index, row in franca_df2016_2020.iterrows():
    print(f'{index}: {locale.currency(row["US$ FOB"], grouping=True)}')

# Imprimir o valor total exportado de 2016 a 2020, formatado como moeda
print(f'Valor total exportado de 2016 há 2020: {valores_dolares2016_2020_formatado}')


### Quais os produtos mais exportados ao longo de todo o período?

Queremos saber os produtos com maior valor US$ de exportação

In [None]:
# Definir a localidade para os Estados Unidos
locale.setlocale(locale.LC_ALL, 'en_US.UTF-8')

# Agrupar os dados pela descrição dos produtos e somar os valores de 'US$ FOB'
produtos_mais_exportados = franca_df.groupby('SH2 Description')['US$ FOB'].sum().reset_index()

# Ordenar o DataFrame resultante pelo valor de 'US$ FOB' em ordem decrescente
produtos_mais_exportados = produtos_mais_exportados.sort_values(by='US$ FOB', ascending=False)

# Selecionar os 10 produtos mais exportados
top10_produtos_mais_exportados = produtos_mais_exportados.head(10)

# Imprimir o título
print('Top 10 produtos mais exportados: ')

# Iterar sobre os 10 produtos mais exportados e imprimir seus valores formatados
for index, row in top10_produtos_mais_exportados.iterrows():
    print(f'{index + 1} - {row["SH2 Description"]}: {locale.currency(row["US$ FOB"], grouping=True)}')

### Em 2020 qual cidade mais exportou para a França?
Em valores US$

In [None]:
# Selecionar apenas os dados do ano de 2020
cidades2020 = franca_df[franca_df['Year'] == 2020]

# Agrupar os dados do ano de 2020 pelo nome da cidade e somar os valores de 'US$ FOB'
cidades2020_agrupado = cidades2020[['City', 'US$ FOB']].groupby('City').sum().reset_index()

# Ordenar o DataFrame resultante pelo valor de 'US$ FOB' em ordem decrescente
cidades2020_agrupado = cidades2020_agrupado.sort_values(by='US$ FOB', ascending=False)

# Obter o nome da cidade que mais exportou (primeira linha do DataFrame ordenado)
cidade_mais_exportou = cidades2020_agrupado.iloc[0]['City']

# Obter o valor total exportado pela cidade que mais exportou
valor_exportado = cidades2020_agrupado.iloc[0]['US$ FOB']

# Imprimir o resultado formatado com o nome da cidade e o valor exportado em dólares
print(f'A cidade que mais exportou: {cidade_mais_exportou} com um valor de {locale.currency(valor_exportado, grouping=True)}')


### Quais os produtos mais exportados (em US$) que as 2 maiores cidades (em exportação em 2020) exportaram?

In [None]:
# Selecionar apenas os dados do ano de 2020
cidades2020 = franca_df[franca_df['Year'] == 2020]

# Agrupar os dados do ano de 2020 pelo nome da cidade e somar os valores de 'US$ FOB'
cidades2020_agrupado = cidades2020[['City', 'US$ FOB']].groupby('City').sum().reset_index()

# Ordenar o DataFrame resultante pelo valor de 'US$ FOB' em ordem decrescente
cidades2020_agrupado = cidades2020_agrupado.sort_values(by='US$ FOB', ascending=False)

# Obter os nomes das duas cidades que mais exportaram (primeiras duas linhas do DataFrame ordenado)
cidades_top2 = cidades2020_agrupado.head(2)

# Iterar pelas duas cidades que mais exportaram
for index, row in cidades_top2.iterrows():
    cidade = row['City']
    valor_exportado = row['US$ FOB']
    
    # Filtrar os dados da cidade atual
    dados_cidade = cidades2020[cidades2020['City'] == cidade]
    
    # Agrupar os dados da cidade atual pela descrição dos produtos e somar os valores de 'US$ FOB'
    produtos_mais_exportados = dados_cidade[['SH2 Description', 'US$ FOB']].groupby('SH2 Description').sum()
    
    # Ordenar os produtos pelo valor de 'US$ FOB' em ordem decrescente
    produtos_mais_exportados = produtos_mais_exportados.sort_values(by='US$ FOB', ascending=False)
    
    # Imprimir os resultados
    print(f'Os produtos mais exportados por {cidade} em 2020:')
    for index, row in produtos_mais_exportados.head(3).iterrows():
        print(f'{index}: {locale.currency(row["US$ FOB"], grouping=True)}')
    print("\n")
