# O que é o Pandas e para que serve

- Análise de Dados (seja para DataScience, seja para trabalhar de forma integrada com arquivos em Excel e Banco de Dados)
- Melhor biblioteca/módulo para trabalhar com quantidades enormes de informações
- Uma mistura de listas e dicionários de forma muito eficiente

## Resumo

Se você trabalha com muitos dados, você vai precisar usar o pandas

## Forma de usar

In [None]:
import pandas as pd

produto_df = pd.read_csv(r"C:\Users\andre\OneDrive\Documentos\GitHub\Cursos\Python\arquivos\Contoso - Cadastro Produtos.csv", encoding="ISO-8859-1", sep=';')

produto_df.info()

In [None]:
import pandas as pd

vendas_df = pd.read_csv(r"arquivos\Contoso - Vendas - 2017.csv", sep=';')

vendas_df['ID Cliente']

In [None]:
vendas_df[:3]

In [None]:
vendas_df[['Numero da Venda', 'Data da Venda', 'ID Produto']]

In [None]:
vendas_df['ID Produto'][0]

## Aplicações

In [None]:
# Informações da tabela

vendas_df.info()

In [None]:
# Criar uma lista de Clientes

lista_clientes = vendas_df['ID Cliente']

lista_clientes

In [None]:
# Criar uma lista com produto e quantidade, pode ser feito de duas formas:

# lista_produto = ['ID Produto', 'Quantidade Vendida', 'Quantidade Devolvida']
# produtos_quantidades = vendas_df[lista_produto]

produtos_quantidades = vendas_df[['ID Produto', 'Quantidade Vendida', 'Quantidade Devolvida']]

produtos_quantidades

In [None]:
import pandas as pd

# As vezes precisa mudar o encoding. Possíveis valores para testar:
# encoding = 'Latin1', encoding='ISO-8859-1', encoding='utf-8' ou encoding='cp1252'
produtos_df = pd.read_csv(r'arquivos\Contoso - Cadastro Produtos.csv', encoding="ISO-8859-1", sep=';')
clientes_df = pd.read_csv(r'arquivos\Contoso - Clientes.csv', encoding="ISO-8859-1", sep=';')
lojas_df = pd.read_csv(r'arquivos\Contoso - Lojas.csv', encoding="ISO-8859-1", sep=';')
promocoes_df = pd.read_csv(r'arquivos\Contoso - Promocoes.csv', encoding="ISO-8859-1", sep=';')
vendas_df = pd.read_csv(r"arquivos\Contoso - Vendas - 2017.csv", sep=';')

# Usar o display para ver todos os dataframes
display(produtos_df)
display(clientes_df)
display(lojas_df)
display(promocoes_df)
display(vendas_df)

In [None]:
# Tirar as colunas inúteis

clientes_df = clientes_df.drop(['Unnamed: 7', 'Unnamed: 8', 'Unnamed: 9', 'Unnamed: 10'], axis=1)
display(clientes_df)

In [None]:
# Ou selecionar as colunas que eu quero
produtos_df = produtos_df[['ID Produto', 'ÿNome do Produto']]
lojas_df = lojas_df[['ÿID Loja', 'Nome da Loja']]
clientes_df = clientes_df[['ÿID Cliente', 'E-mail']]
display(clientes_df)

In [None]:
# Renomear as colunas
produtos_df = produtos_df.rename(columns={'ÿNome do Produto': 'Nome do Produto'})
display(produtos_df)

lojas_df = lojas_df.rename(columns={'ÿID Loja': 'ID Loja'})
display(lojas_df)

clientes_df.columns = clientes_df.columns.str.replace("ÿ", "", regex=False)
display(clientes_df)

In [None]:
display(vendas_df)

In [None]:
# Juntando os dataframes para ter somente UM dataframe
vendas_df = vendas_df.merge(produtos_df, on='ID Produto')
vendas_df = vendas_df.merge(clientes_df, on='ID Cliente')
vendas_df = vendas_df.merge(lojas_df, on='ID Loja')

display(vendas_df)

In [None]:
frequencia_clientes = vendas_df['E-mail'].value_counts() # quantidade que aparece
display(frequencia_clientes)
frequencia_clientes[:5].plot(figsize=(15,5)) # os primeiros 5 itens

In [None]:
frequencia_clientes[:5].plot(figsize=(15,5), yticks=range(68, 78, 2))

In [None]:
# Agrupando e somando

vendas_lojas = vendas_df.groupby('Nome da Loja').sum()
vendas_lojas = vendas_lojas[['Quantidade Vendida']]
display(vendas_lojas)

In [None]:
# ordenar o dataframe
# Ascending - Crescente:True Decrescente:False
vendas_lojas = vendas_lojas.sort_values('Quantidade Vendida', ascending=False)
display(vendas_lojas)
vendas_lojas[:5].plot(figsize=(15,5), kind='bar')
print(vendas_lojas[0:1]) # maior valor
print(vendas_lojas[-1:]) # menor valor

In [None]:
# Pegar o maior valor

maior_valor = vendas_lojas['Quantidade Vendida'].max()
melhor_loja = vendas_lojas['Quantidade Vendida'].idxmax()
print(melhor_loja, maior_valor)

In [None]:
# Pegar o menor valor

menor_valor = vendas_lojas['Quantidade Vendida'].min()
pior_loja = vendas_lojas['Quantidade Vendida'].idxmin()
print(pior_loja, menor_valor)

## Filtrando Informações

In [None]:
# Percentual das vendas devolvidas
qtd_vendida = vendas_df['Quantidade Vendida'].sum()
qtd_devolvida = vendas_df['Quantidade Devolvida'].sum()

print('{:.2%}'.format(qtd_devolvida/qtd_vendida))

In [None]:
# Filtrar apenas os itens da Loja Contoso Europe Online - ID 306

vendas_loja_contoso_europe_online = vendas_df[vendas_df['ID Loja'] == 306]
display(vendas_loja_contoso_europe_online)

In [None]:
qtd_vendida = vendas_loja_contoso_europe_online['Quantidade Vendida'].sum()
qtd_devolvida = vendas_loja_contoso_europe_online['Quantidade Devolvida'].sum()

print('{:.2%}'.format(qtd_devolvida/qtd_vendida))

In [None]:
# vendas_loja_contoso_europe_online = vendas_df[vendas_df['ID Loja'] == 306]

loja_306 = vendas_df['ID Loja'] == 306
display(loja_306)

In [None]:
vendas_loja_contoso_europe_online = vendas_df[loja_306]
display(vendas_loja_contoso_europe_online)

In [None]:
# Mais de um filtro
df_306_semdevolucao = vendas_df[(vendas_df['ID Loja'] == 306) & (vendas_df['Quantidade Devolvida'] == 0)]
display(df_306_semdevolucao)

loja306 = vendas_df['ID Loja'] == 306
qtd_devolvida_0 = vendas_df['Quantidade Devolvida'] == 0
df2_306_semdevolucao = vendas_df[loja306 & qtd_devolvida_0]
display(df2_306_semdevolucao)

In [None]:
vendas_df.info()

In [None]:
# Coluna Data da Venda em DATA
vendas_df['Data da Venda'] = pd.to_datetime(vendas_df['Data da Venda'], format='%d/%m/%Y')

# Adicionando colunas
vendas_df['Ano da Venda'] = vendas_df['Data da Venda'].dt.year
vendas_df['Mes da Venda'] = vendas_df['Data da Venda'].dt.month
vendas_df['Dia da Venda'] = vendas_df['Data da Venda'].dt.day
display(vendas_df)
vendas_df.info()

## Método loc e iloc

In [None]:
novo_produto_df = pd.read_csv(r'arquivos\Contoso - Cadastro Produtos.csv', encoding="ISO-8859-1", sep=';')
display(novo_produto_df.head())

In [None]:
novo_produto_df = novo_produto_df.rename(columns={'ÿNome do Produto':'Nome do Produto'})
display(novo_produto_df.head())

In [None]:
novo_produto_df.loc[[0,2,5]]

In [None]:
novo_produto_df = novo_produto_df.set_index('Nome do Produto')
display(novo_produto_df)

In [None]:
# Como foi setado o index, o loc não funciona mais pelo número, mas pelo nome do Produto
novo_produto_df.loc['Contoso Wireless Laser Mouse E50 Grey']

In [None]:
novo_produto_df.loc['Contoso Wireless Laser Mouse E50 Grey', 'Tipo']

In [None]:
# por iloc número da linha e número da coluna - df.iloc[linha,coluna]
print(novo_produto_df.iloc[2,6])

### A empresa decidiu aumentar o preço do produto ID 873 (Contoso Wireless Laser Mouse E50 Grey):

In [None]:
# Primeira forma acessando pelo índice, mudando para R$ 23,00
novo_produto_df.loc['Contoso Wireless Laser Mouse E50 Grey', 'Preco Unitario'] = 23
novo_produto_df.loc['Contoso Wireless Laser Mouse E50 Grey']

In [None]:
# Segunda forma acessando por critério, mudando para R$ 25,00
novo_produto_df.loc[novo_produto_df['ID Produto'] == 873, 'Preco Unitario'] = 25
novo_produto_df.loc['Contoso Wireless Laser Mouse E50 Grey']

### Exportando do dataframe para um csv

In [None]:
vendas_df = vendas_df[['Data da Venda', 'Nome do Produto', 'Nome da Loja', 'Quantidade Vendida', 'ID Loja']]
vendas_df_contoso_austin = vendas_df[vendas_df['ID Loja'] == 86]
display(vendas_df_contoso_austin)

In [None]:
vendas_df_contoso_austin.to_csv(r'arquivos\Novo Vendas 2017.csv', sep=';')

### Criando um dicionário, transformando depois em um dataframe

In [None]:
niveis_co2 = {
    'AC': [325,405,429,486,402],
    'AL': [492,495,310,407,388],
    'AP': [507,503,368,338,400],
    'AM': [429,456,352,377,363],
    'BA': [321,508,372,490,412],
    'CE': [424,328,425,516,480],
    'ES': [449,506,461,337,336],
    'GO': [425,460,385,485,460],
    'MA': [361,310,344,425,490],
    'MT': [358,402,425,386,379],
    'MS': [324,357,441,405,427],
    'MG': [345,367,391,427,516],
    'PA': [479,514,392,493,329],
    'PB': [418,499,317,302,476],
    'PR': [420,508,419,396,327],
    'PE': [404,444,495,320,343],
    'PI': [513,513,304,377,475],
    'RJ': [502,481,492,502,506],
    'RN': [446,437,519,356,317],
    'RS': [427,518,459,317,321],
    'RO': [517,466,512,326,458],
    'RR': [466,495,469,495,310],
    'SC': [495,436,382,483,479],
    'SP': [495,407,362,389,317],
    'SE': [508,351,334,389,418],
    'TO': [339,490,304,488,419],
    'DF': [376,516,320,310,518], 
}

niveis_co2_df = pd.DataFrame.from_dict(niveis_co2, orient='index')
niveis_co2_df = niveis_co2_df.rename(columns={0: 'Janeiro', 1: 'Fevereiro', 2: 'Março', 3: 'Abril', 4: 'Maio'})
# niveis_co2_df.index.name = 'Estado'   --- colocar título no index, ou fazer na exportação para csv
display(niveis_co2_df)
niveis_co2_df.to_csv(r'arquivos\Níveis CO2.csv',encoding='latin1', sep=';', index_label="Estado")

## Lendo da Internet

# pandas lendo csv da internet

### Essa é uma das formas de importar arquivos da internet, direto do pandas. Mas nem sempre você vai conseguir abrir assim direto.

### 2 situações principais em que você consegue fazer direto

1. Arquivo csv direto no link (melhor dos mundos)
2. O arquivo csv é gerado para você, mas fica no meio de uma requisição que precisa ser tratada.

### Apenas para lembrar os tipos de encoding principais que vamos usar:

- encoding='latin1'
- encoding='ISO-8859-1'
- encoding='utf-8'
- encoding='cp1252'

### Caso 1: csv direto no link

- Criei um arquivo csv e disponibilizei o link para download no Drive: https://drive.google.com/uc?authuser=0&id=1Ru7s-x3YJuStZK1mqr_qNqiHVvdHUN66&export=download

In [None]:
import pandas as pd

url = "https://drive.google.com/uc?authuser=0&id=1Ru7s-x3YJuStZK1mqr_qNqiHVvdHUN66&export=download"
cotacao_df = pd.read_csv(url)
display(cotacao_df)

### Caso 2: csv em uma requisição que precisa ser tratada

Pesquisei por histórico de preços do café no Google e cheguei nesse site: https://portalweb.cooxupe.com.br:9080/portal/precohistoricocafe_2.jsp

In [None]:
import pandas as pd
import requests
import io

url = 'https://portalweb.cooxupe.com.br:9080/portal/precohistoricocafe_2.jsp?d-3496238-e=2&6578706f7274=1'
conteudo_url = requests.get(url).content
arquivo = io.StringIO(conteudo_url.decode('latin1'))
cafe_df = pd.read_csv(arquivo, sep=r'\t')
display(cafe_df)

## Integração Python + Excel
- Pandas
- Openpyxl

### Desafio:
- Atualizar o Multiplicador Imposto - Serviço para 1.5

In [None]:
#pandas
import pandas as pd

tabela = pd.read_excel(r'arquivos\Produtos.xlsx')
display(tabela)

In [None]:
# atualizar o multiplicador

tabela.loc[tabela['Tipo']=='Serviço','Multiplicador Imposto'] = 1.5

# fazer a conta do Preço Base Reais
tabela['Preço Base Reais'] = tabela['Multiplicador Imposto'] * tabela['Preço Base Original']

tabela.to_excel(r'arquivos\ProdutosPandas.xlsx', index=False)

In [None]:
#openpyxl
from openpyxl import Workbook, load_workbook

planilha = load_workbook(r'arquivos\Produtos.xlsx')

aba_ativa = planilha.active

for celula in aba_ativa['C']:
    if celula.value == 'Serviço':
        linha = celula.row
        aba_ativa[f'D{linha}'] = 1.5

planilha.save(r'arquivos\ProdutosOpenPy.xlsx')

### Acompanhando o progresso - tqdm

In [None]:
import pandas as pd

# Importando os arquivos
vendas_df = pd.read_csv(r"arquivos\Contoso - Vendas - 2017.csv", sep=';')
produtos_df = pd.read_csv(r'arquivos\Contoso - Cadastro Produtos.csv', encoding="ISO-8859-1", sep=';')
lojas_df = pd.read_csv(r'arquivos\Contoso - Lojas.csv', encoding="ISO-8859-1", sep=';')
clientes_df = pd.read_csv(r'arquivos\Contoso - Clientes.csv', encoding="ISO-8859-1", sep=';')
promocoes_df = pd.read_csv(r'arquivos\Contoso - Promocoes.csv', encoding="ISO-8859-1", sep=';')

# Limpando apenas as colunas que queremos
clientes_df = clientes_df[['ÿID Cliente', 'E-mail']].rename(columns={'ÿID Cliente': 'ID Cliente'})
produtos_df = produtos_df[['ID Produto', 'ÿNome do Produto']].rename(columns={'ÿNome do Produto':'Nome do Produto'})
lojas_df = lojas_df[['ÿID Loja', 'Nome da Loja']].rename(columns={'ÿID Loja':'ID Loja'})

# Mesclando e renomeando os dataframes
vendas_df = vendas_df.merge(produtos_df, on='ID Produto')
vendas_df = vendas_df.merge(lojas_df, on='ID Loja')
vendas_df = vendas_df.merge(clientes_df, on='ID Cliente').rename(columns={'E-mail': 'E-mail do Cliente'})

display(vendas_df)

In [None]:
from tqdm import tqdm

pbar = tqdm(total=len(vendas_df['ID Loja']),position=0, leave=True)

for i, id_loja in enumerate(vendas_df['ID Loja']):
    pbar.update()
    if id_loja == 222:
        vendas_df.loc[i,'Quantidade Devolvida'] += 1

display(vendas_df)

# Exercício - Mini Projeto de Análise de Dados

Vamos fazer um exercício completo de pandas para um miniprojeto de análise de dados.

Esse exercício vai obrigar a gente a usar boa parte dos conhecimento de pandas e até de outros módulos que já aprendemos ao longo do curso.

### O que temos?

Temos os dados de 2019 de uma empresa de prestação de serviços. 

- CadastroFuncionarios
- CadastroClientes
- BaseServiçosPrestados

Obs1: Para ler arquivos csv, temos o read_csv<br>
Obs2: Para ler arquivos xlsx (arquivos em excel normais, que não são padrão csv), temos o read_excel

### O que queremos saber/fazer?

1. Valor Total da Folha Salarial -> Qual foi o gasto total com salários de funcionários pela empresa? <br>
    Sugestão: calcule o salário total de cada funcionário, salário + benefícios + impostos, depois some todos os salários
    
    
2. Qual foi o faturamento da empresa?<br>
    Sugestão: calcule o faturamento total de cada serviço e depois some o faturamento de todos
    
    
3. Qual o % de funcionários que já fechou algum contrato?<br>
    Sugestão: na base de serviços temos o funcionário que fechou cada serviço. Mas nem todos os funcionários que a empresa tem já fecharam algum serviço.<br>
    . Na base de funcionários temos uma lista com todos os funcionários<br>
    . Queremos calcular Qtde_Funcionarios_Fecharam_Serviço / Qtde_Funcionários_Totais<br>
    . Para calcular a qtde de funcionários que fecharam algum serviço, use a base de serviços e conte quantos funcionários tem ali. Mas lembre-se, cada funcionário só pode ser contado uma única vez.<br><br>
    Dica: se você aplicar o método .unique() em uma variável que é apenas 1 coluna de um dataframe, ele vai excluir todos os valores duplicados daquela coluna.<br>
    Ex: unicos_colunaA = dataframe['colunaA'].unique() te dá como resposta uma lista com todos os itens da colunaA aparecendo uma única vez. Todos os valores repetidos da colunaA são excluidos da variável unicos_colunaA 
    
    
4. Calcule o total de contratos que cada área da empresa já fechou


5. Calcule o total de funcionários por área


6. Qual o ticket médio mensal (faturamento médio mensal) dos contratos?<br>
    Dica: .mean() calcula a média -> exemplo: media_colunaA = dataframe['colunaA'].mean()

Obs: Lembrando as opções mais usuais de encoding:<br>
encoding='latin1', encoding='ISO-8859-1', encoding='utf-8' ou então encoding='cp1252'

Observação Importante: Se o seu código der um erro na hora de importar os arquivos:<br>
- CadastroClientes.csv
- CadastroFuncionarios.csv

Use separador ";" (ponto e vírgula) para resolver

### Importando os dado

In [None]:
import pandas as pd

funcionarios_df = pd.read_csv(r'arquivos\CadastroFuncionarios.csv', sep=';', decimal=',')
clientes_df = pd.read_csv(r'arquivos\CadastroClientes.csv', sep=';', decimal=',')
servicos_df = pd.read_excel(r'arquivos\BaseServiçosPrestados.xlsx')

# remover colunas Estado Civil e Cargo
funcionarios_df = funcionarios_df.drop(['Estado Civil', 'Cargo'], axis=1)

display(funcionarios_df)
display(clientes_df)
display(servicos_df)

### 1. Valor Total da Folha Salarial

In [None]:
funcionarios_df['Salario Total'] = funcionarios_df['Salario Base'] + funcionarios_df['Impostos'] + funcionarios_df['Beneficios'] + funcionarios_df['VT'] + funcionarios_df['VR']
display(funcionarios_df)

# Soma total:
# 1 modo
print(sum(funcionarios_df['Salario Total']))
# 2 modo
print('Valor total mensal da folha salarial R$ {:,}'.format(funcionarios_df['Salario Total'].sum()))

### 2. Faturamento da Empresa

In [None]:
# Relacionando todas as colunas para formar um único dataframe
funcionarios_df = funcionarios_df[['ID Funcionário', 'Nome Completo', 'Area','Salario Total']].rename(columns={'Nome Completo': 'Nome Funcionário'})
clientes_df = clientes_df[['ID Cliente', 'Cliente', 'Valor Contrato Mensal']]

servicos_df = servicos_df.merge(funcionarios_df, on='ID Funcionário')
servicos_df = servicos_df.merge(clientes_df, on='ID Cliente')

servicos_df['Valor Global Contrato'] = servicos_df['Tempo Total de Contrato (Meses)'] * servicos_df['Valor Contrato Mensal']

display(servicos_df)

In [None]:
print('Faturamento Total de R$ {:,}'.format(servicos_df['Valor Global Contrato'].sum()))

### 3. Qual o % de funcionários que já fechou algum contrato?

In [None]:
qtd_funcionario = funcionarios_df['ID Funcionário'].nunique()
funcionarios_contrato = servicos_df['ID Funcionário'].nunique()
# funcionarios_contrato = len(servicos_df['ID Funcionário'].unique())
percentual_fechou = (funcionarios_contrato/qtd_funcionario) * 100

print(f'O Total de funcionário é {qtd_funcionario}, sendo que {funcionarios_contrato} fecharam algum contrato, dando assim um percentual de {percentual_fechou:.2f}%')

### 4. Calcule o total de contratos que cada área da empresa já fechou


In [None]:
contrato_area_qtd = servicos_df['Area'].value_counts()
print(contrato_area_qtd)
contrato_area_qtd.plot(kind='bar')

### 5. Calcule o total de funcionários por área

In [None]:
funcionarios_area = funcionarios_df['Area'].value_counts()
print(funcionarios_area)
funcionarios_area.plot(kind='bar')

### 6. Qual o ticket médio mensal (faturamento médio mensal) dos contratos?

In [None]:
ticket_medio = clientes_df['Valor Contrato Mensal'].mean()
print('Ticket médio mensal: R$ {:,.2f}'.format(ticket_medio))

## Exercícios

### Transformando arquivo full de exportação em um arquivo filtrado por Francça e Ano maior igual a 2016

In [None]:
import pandas as pd

exportacao_df = pd.read_csv(r'C:\Users\andre\OneDrive\Documentos\Curso\Ciência de Dados\exportacao_full.csv')

display(exportacao_df)

In [None]:
exportacao_df = exportacao_df.loc[exportacao_df['Year'] >= 2016, :]
exportacao_df = exportacao_df.loc[exportacao_df['Country'] == 'France', :]
display(exportacao_df)
exportacao_df.to_csv(r'arquivos\exportacao_france.csv', index=False)

### Analisando os dados do arquivo filtrado

### Importação

In [2]:
import pandas as pd

exportacao_franca = pd.read_csv(r'arquivos\exportacao_france.csv')
display(exportacao_franca)

Unnamed: 0,Year,Month,Country,City,SH4 Code,SH4 Description,SH2 Code,SH2 Description,Economic Block,US$ FOB,Net Weight
0,2016,1,France,Águas Mornas - SC,303,"Fish, frozen, excluding fish fillets and other...",3,"Fish and crustaceans, molluscs and other aquat...",Europe,79360,14150
1,2016,1,France,Águas Mornas - SC,303,"Fish, frozen, excluding fish fillets and other...",3,"Fish and crustaceans, molluscs and other aquat...",European Union (EU),79360,14150
2,2016,1,France,Águas Mornas - SC,304,Fish fillets and other fish meat (whether or n...,3,"Fish and crustaceans, molluscs and other aquat...",Europe,69412,9385
3,2016,1,France,Águas Mornas - SC,304,Fish fillets and other fish meat (whether or n...,3,"Fish and crustaceans, molluscs and other aquat...",European Union (EU),69412,9385
4,2016,1,France,Alfenas - MG,901,"Coffee, whether or not roasted or decaffeinate...",9,"Coffee, tea, maté and spices",Europe,180914,57600
...,...,...,...,...,...,...,...,...,...,...,...
142355,2020,12,France,Vinhedo - SP,8424,Mechanical appliances (whether or not hand-ope...,84,"Nuclear reactors, boilers, machinery and mecha...",European Union (EU),2316,4
142356,2020,12,France,Vitória de Santo Antão - PE,714,"Manioc, arrowroot, salep, Jerusalem artichokes...",7,Edible vegetables and certain roots and tubers,Europe,27060,26400
142357,2020,12,France,Vitória de Santo Antão - PE,714,"Manioc, arrowroot, salep, Jerusalem artichokes...",7,Edible vegetables and certain roots and tubers,European Union (EU),27060,26400
142358,2020,12,France,Xapuri - AC,4409,Wood (including strips and friezes for parquet...,44,Wood and articles of wood; wood charcoal,Europe,31111,23045


### Informação

In [3]:
display(exportacao_franca.info())

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 142360 entries, 0 to 142359
Data columns (total 11 columns):
 #   Column           Non-Null Count   Dtype 
---  ------           --------------   ----- 
 0   Year             142360 non-null  int64 
 1   Month            142360 non-null  int64 
 2   Country          142360 non-null  object
 3   City             142360 non-null  object
 4   SH4 Code         142360 non-null  int64 
 5   SH4 Description  142360 non-null  object
 6   SH2 Code         142360 non-null  int64 
 7   SH2 Description  142360 non-null  object
 8   Economic Block   142360 non-null  object
 9   US$ FOB          142360 non-null  int64 
 10  Net Weight       142360 non-null  int64 
dtypes: int64(6), object(5)
memory usage: 11.9+ MB


None

### Evolução das exportações para a França ao longo dos anos

In [13]:
# Agrupar os anos e trazendo o valor total

exportacao_franca_anos = exportacao_franca[['Year','US$ FOB']].groupby('Year').sum()
display(exportacao_franca_anos)
# exportacao_franca_anos.plot(kind='line')

Unnamed: 0_level_0,US$ FOB
Year,Unnamed: 1_level_1
2016,4615500082
2017,4448705456
2018,5239424416
2019,5218723612
2020,3967594810


In [18]:
# 2 MÉTODO PARA RESOLVER

exportacao_franca_anos_2 = exportacao_franca.groupby('Year').sum(numeric_only=True)
exportacao_franca_anos_2 = exportacao_franca_anos_2[['US$ FOB']]

def formatar(valor):
    valor_formatado = f'US$ {valor:,.2f}'
    return valor_formatado
exportacao_franca_anos_2['US$ FOB'] = exportacao_franca_anos_2['US$ FOB'].apply(formatar)

display(exportacao_franca_anos_2)

Unnamed: 0_level_0,US$ FOB
Year,Unnamed: 1_level_1
2016,"US$ 4,615,500,082.00"
2017,"US$ 4,448,705,456.00"
2018,"US$ 5,239,424,416.00"
2019,"US$ 5,218,723,612.00"
2020,"US$ 3,967,594,810.00"
