## Extraindo os dados

#### Caminho do arquivo JSON

In [1]:
__path__json = '../data/raw/dados_empresaA.json'

Importando o módulo 'json' para ler arquivos JSON

In [5]:
import json

Abrindo o arquivo JSON no modo de leitura ('r') e carregando os dados como um dicionário

In [19]:
with open(__path__json, 'r') as file:
    dados_json = json.load(file) # Carrega todo o conteúdo do JSON como um dicionário

Exibindo o primeiro item do conteúdo carregado

In [18]:
dados_json[0]

{'Nome do Produto': 'Blush em pó',
 'Categoria do Produto': 'Eletrodomésticos',
 'Preço do Produto (R$)': 79.41,
 'Quantidade em Estoque': 7,
 'Filial': 'Filial 7'}

#### Caminho do arquivo CSV

In [6]:
__path__csv = '../data/raw/dados_empresaB.csv'

Importa a biblioteca CSV para manipulação de arquivos CSV

In [20]:
import csv

Abrindo o arquivo JSON no modo de leitura ('r') e carregando os dados como um dicionário

In [None]:
dados_csv = []

with open(__path__csv, 'r') as file:
    # Criando um leitor de CSV que transforma cada linha em um dicionário
    spamreader = csv.DictReader(file, delimiter=',')

    # Percorre cada linha do arquivo e adiciona à lista
    for row in spamreader:
        dados_csv.append(row)

#### Comparando campos (json x csv)

In [None]:
# Exibir os dados lidos
dados_json[0]

{'Nome do Produto': 'Blush em pó',
 'Categoria do Produto': 'Eletrodomésticos',
 'Preço do Produto (R$)': 79.41,
 'Quantidade em Estoque': 7,
 'Filial': 'Filial 7'}

In [22]:
# Exibir os dados lidos
dados_csv[0]

{'Nome do Item': 'Lápis de sobrancelha',
 'Classificação do Produto': 'Roupas',
 'Valor em Reais (R$)': '55.17',
 'Quantidade em Estoque': '62',
 'Nome da Loja': 'Filial 1',
 'Data da Venda': '2023-04-13 18:58:06.794203'}

#### Exibindo as chaves do primeiro elemento para entender a estrutura dos dados JSON

In [27]:
nome_colunas_json = list(dados_json[0].keys())
print(nome_colunas_json)

['Nome do Produto', 'Categoria do Produto', 'Preço do Produto (R$)', 'Quantidade em Estoque', 'Filial']


In [28]:
len(nome_colunas_json)

5

#### Exibindo as chaves do primeiro elemento para entender a estrutura dos dados CSV

In [31]:
nome_colunas_csv = list(dados_csv[0].keys())
print(nome_colunas_csv)

['Nome do Item', 'Classificação do Produto', 'Valor em Reais (R$)', 'Quantidade em Estoque', 'Nome da Loja', 'Data da Venda']


In [32]:
len(nome_colunas_csv)

6

## Transformando os dados

#### Renomeando os campos

In [34]:
key_mapping = {'Nome do Item': 'Nome do Produto',
                'Classificação do Produto': 'Categoria do Produto',
                'Valor em Reais (R$)': 'Preço do Produto (R$)',
                'Quantidade em Estoque': 'Quantidade em Estoque',
                'Nome da Loja': 'Filial',
                'Data da Venda': 'Data da Venda'}

print(key_mapping)

{'Nome do Item': 'Nome do Produto', 'Classificação do Produto': 'Categoria do Produto', 'Valor em Reais (R$)': 'Preço do Produto (R$)', 'Quantidade em Estoque': 'Quantidade em Estoque', 'Nome da Loja': 'Filial', 'Data da Venda': 'Data da Venda'}


### Atualização dos nomes dos registros

#### Transformando dados CSV com base em um mapeamento de chaves

#### O objetivo é substituir as chaves dos dicionários em 'dados_csv' pelas novas chaves definidas em 'key_mapping'

In [36]:
new_dados_csv = []  # Lista para armazenar os novos dicionários

for old_dict in dados_csv:  # Itera sobre cada dicionário em dados_csv
    dict_temp = {}  # Cria um dicionário temporário
    for old_key, value in old_dict.items():  # Itera sobre as chaves e valores de cada dicionário
        dict_temp[key_mapping[old_key]] = value  # Mapeia a chave antiga para a nova chave, atribuindo o valor correspondente
    
    new_dados_csv.append(dict_temp)  # Adiciona o dicionário transformado à lista

# Exibe o primeiro dicionário após a transformação
print(new_dados_csv[0])

{'Nome do Produto': 'Lápis de sobrancelha', 'Categoria do Produto': 'Roupas', 'Preço do Produto (R$)': '55.17', 'Quantidade em Estoque': '62', 'Filial': 'Filial 1', 'Data da Venda': '2023-04-13 18:58:06.794203'}


Comparação com o antigo dado

In [38]:
dados_csv[0]

{'Nome do Item': 'Lápis de sobrancelha',
 'Classificação do Produto': 'Roupas',
 'Valor em Reais (R$)': '55.17',
 'Quantidade em Estoque': '62',
 'Nome da Loja': 'Filial 1',
 'Data da Venda': '2023-04-13 18:58:06.794203'}