### **02. Lendo os dados**

Vamos iniciar tentando ler os dados para **Empresa A** que estão no formato JSON

In [34]:
path_json = '../data_raw/dados_empresaA.json'

In [35]:
with open(path_json, 'r') as file:
    print(file.readline())

[{"Nome do Produto":"Blush em p\u00f3","Categoria do Produto":"Eletrodom\u00e9sticos","Pre\u00e7o do Produto (R$)":79.41,"Quantidade em Estoque":7,"Filial":"Filial 7"},



Como podemos perceber anteriormente, o file.readline() nos retornou os dados no formato de string, o que não é legal para tratarmos, portanto, vamos utilizar a biblioteca nativa do python json.
Essa biblioteca, ajuda na leitura do formato json.

In [36]:
import json

In [37]:
with open(path_json, 'r') as file:
    dados_json = json.load(file)

In [38]:
dados_json[0:3]

[{'Nome do Produto': 'Blush em pó',
  'Categoria do Produto': 'Eletrodomésticos',
  'Preço do Produto (R$)': 79.41,
  'Quantidade em Estoque': 7,
  'Filial': 'Filial 7'},
 {'Nome do Produto': 'Lápis de sobrancelha',
  'Categoria do Produto': 'Eletrodomésticos',
  'Preço do Produto (R$)': 85.47,
  'Quantidade em Estoque': 78,
  'Filial': 'Filial 8'},
 {'Nome do Produto': 'Base líquida',
  'Categoria do Produto': 'Roupas',
  'Preço do Produto (R$)': 75.02,
  'Quantidade em Estoque': 34,
  'Filial': 'Filial 8'}]

Agora que conseguimos ler os dados anteriores, vamos tentar ler os dados para **Empresa B** que estão no formato CSV

In [39]:
path_csv = '../data_raw/dados_empresaB.csv'

In [40]:
with open(path_csv, 'r') as file:
    print(file.readlines()[0])

Nome do Item,Classificação do Produto,Valor em Reais (R$),Quantidade em Estoque,Nome da Loja,Data da Venda



In [41]:
import csv

In [42]:
dados_csv = []
with open(path_csv, 'r') as file:
    spamreader = csv.reader(file, delimiter=',') 
    for row in spamreader:
        dados_csv.append(row)

In [43]:
dados_csv[0]

['Nome do Item',
 'Classificação do Produto',
 'Valor em Reais (R$)',
 'Quantidade em Estoque',
 'Nome da Loja',
 'Data da Venda']

Conseguimos realizar a leitura dos nossos dados tanto em JSON quanto em CSV e construir estruturas de dados que os representam. Para o nosso arquivo em JSON, conseguimos uma estrutura de listas e dicionários. Já para o arquivo CSV, temos uma lista de listas.

Estas duas estruturas diferentes se tornam um problema quando queremos criar manipulações para ambos os arquivos. Se quisermos contar, por exemplo, quantos dados temos no CSV e no JSON, conseguimos criar uma função que funcione para ambos, pois inicialmente estão em listas. Contudo, para itens mais complexos, como contar a quantidade de colunas, teríamos que criar uma função específica para cada uma das estruturas.

Se observarmos uma lista de dicionários, temos o nome das colunas em cada um dos registros. Já para os dados representados em lista de listas, apenas no primeiro registro temos o nome da coluna. No restante, não temos. Então teríamos que criar uma função específica para cada um.

Como queremos construir um pipeline de dados, é interessante que construamos ambos os dados numa única estrutura. Dessa forma, poderíamos reaproveitar funções em ambas as situações.

Ao olharmos para os nossos dados de JSON e acessarmos o primeiro valor, usando o colchete zero [], ele retorna para o nosso dicionário.

In [44]:
dados_json[0]

{'Nome do Produto': 'Blush em pó',
 'Categoria do Produto': 'Eletrodomésticos',
 'Preço do Produto (R$)': 79.41,
 'Quantidade em Estoque': 7,
 'Filial': 'Filial 7'}

Se quisermos olhar a quantidade em estoque desse produto, precisamos apenas informar a chave desse registro, como por exemplo: `dados_json[0]['Qquantidade em Estoque'].`

In [45]:
dados_json[0]['Quantidade em Estoque']

7

Ao executarmos essa célula, ele retornará o valor 7, que era a quantidade em estoque. Isso foi bastante simples, selecionamos o primeiro registro e a coluna que queríamos.

Agora, no caso do nosso CSV, retirar esta mesma informação se torna mais trabalhoso.

Para acessar uma informação específica, temos que lembrar a ordem das colunas e ainda que em linguagem de programação, os índices começam em zero. Vou colocar um exemplo fazendo isso: `dados[3]`, que nos retorna 62, suponho que é a quantidade em estoque desse produto.

In [46]:
dados_csv[1][3]

'62'

Em contraposição, ao olharmos para os dados de lista de dicionários, é intuitivo. Queremos o nome da coluna, passamos o nome dessa coluna e teremos acesso a ela. Já para a lista de listas, temos uma sequência de números que não representam muito para nós. Então, a exploração do dado por este método csv parece ser mais trabalhosa.

Por essa razão que o melhor caminho para nós é testar a lista de dicionários para o restante do processo. Isso não significa que uma lista de dicionários seja sempre superior a uma lista de listas. Para cada situação, você precisa analisar e entender qual é o seu objetivo. Nesse momento de exploração, a lista de dicionários se mostrou superior.

Se formos à documentação do CSV, sempre recomendando que vocês visitem as documentações das ferramentas, veremos que conhecendo essa biblioteca, entenderemos que temos outro método, além do reader. Temos um método que traz os nossos dados em uma estrutura diferente, chamado DictReader.

O DictReader pode receber os mesmos valores que o reader, o file e o delimitador. Ele continua retornando um spamreader e continuamos salvando esses dados em um for. A diferença é que, como o nome sugere, o reader retorna uma lista e o DictReader retorna um dicionário.

In [47]:
dados_csv = []
with open(path_csv, 'r') as file:
    spamreader = csv.DictReader(file, delimiter=',')
    for row in spamreader:
        dados_csv.append(row)

In [48]:
dados_csv[0]

{'Nome do Item': 'Lápis de sobrancelha',
 'Classificação do Produto': 'Roupas',
 'Valor em Reais (R$)': '55.17',
 'Quantidade em Estoque': '62',
 'Nome da Loja': 'Filial 1',
 'Data da Venda': '2023-04-13 18:58:06.794203'}

In [49]:
dados_json[0]

{'Nome do Produto': 'Blush em pó',
 'Categoria do Produto': 'Eletrodomésticos',
 'Preço do Produto (R$)': 79.41,
 'Quantidade em Estoque': 7,
 'Filial': 'Filial 7'}

#### **Para saber mais: estrutura de dados**

Estruturas de dados são elementos fundamentais na programação, usados para organizar e armazenar informações de maneira eficiente e acessível. Em Python, uma linguagem de programação versátil e popular, você pode trabalhar com várias estruturas de dados diferentes. Duas das estruturas mais comuns são listas e dicionários.

**Listas em Python:**

Uma lista é uma estrutura de dados que permite armazenar uma coleção ordenada de elementos. Em Python, você pode criar uma lista colocando os elementos entre colchetes [] e separando-os por vírgulas. Por exemplo:

```python
minha_lista = [1, 2, 3, 4, 5]
```

As listas são indexadas, o que significa que você pode acessar elementos específicos usando um índice. O primeiro elemento tem um índice de 0, o segundo um índice de 1 e assim por diante. Além disso, as listas são mutáveis, o que significa que você pode adicionar, remover ou modificar elementos.

**Dicionários em Python:**

Um dicionário é outra estrutura de dados em Python que permite armazenar informações, porém, em vez de usar índices numéricos, você usa chaves para acessar os valores. Um dicionário é criado usando chaves `{}` e pares de chave-valor separados por dois pontos `:`. Por exemplo:

```python
meu_dicionario = {'nome': 'João', 'idade': 30, 'cidade': 'São Paulo'}
```

Nesse contexto, nota-se que 'nome', 'idade' e 'cidade' são as chaves, e 'João', 30 e 'São Paulo' são os valores correspondentes. Por esse motivo, os dicionários são úteis e podem ser bem vantajosos quando você desejar associar informações relacionadas.

**Outros exemplos de estruturas de dados em Python:**

1 - **Tuplas:** Uma tupla é semelhante a uma lista, mas é imutável, ou seja, seus elementos não podem ser alterados após a criação. Elas são definidas usando parênteses `()`.

```python
minha_tupla = (1, 2, 3)
```
2 - **Conjuntos:** Um conjunto é uma coleção não ordenada de elementos únicos. Eles são criados usando chaves `{}` ou a função `set()`.

```python
meu_conjunto = {1, 2, 3}
```

3 - **Strings:** Embora não sejam estruturas de dados tradicionais, as strings são usadas para armazenar sequências de caracteres e são amplamente usadas em Python.

```python
minha_string = "Olá, mundo!"
```

Esses são apenas alguns exemplos das muitas estruturas de dados disponíveis em Python. A escolha da estrutura de dados depende da natureza dos dados que você está manipulando e das operações que deseja realizar sobre eles. Cada estrutura de dados tem suas próprias vantagens e desvantagens, e é importante escolher a mais apropriada para o seu problema específico.

**CSV (Comma-Separated Values):**

CSV é um formato comum para armazenar dados tabulares. Você pode representar dados CSV em Python usando uma lista de listas, onde cada lista interna representa uma linha da tabela e os elementos dessa lista são os valores nas colunas. Por exemplo, suponha que você tenha o seguinte CSV:

```csv
Nome,Idade,Cidade
João,30,São Paulo
Maria,25,Rio de Janeiro
```

Você pode representar esses dados em Python da seguinte forma:

```python
dados_csv = [
    ["Nome", "Idade", "Cidade"],
    ["João", 30, "São Paulo"],
    ["Maria", 25, "Rio de Janeiro"]
]
```

Dessa forma, você possui uma estrutura de lista de listas que reflete a estrutura dos dados CSV.

**JSON (JavaScript Object Notation):**

JSON é um formato leve e amplamente utilizado para representar dados estruturados. Você pode representar dados JSON em Python usando dicionários e listas. Os dicionários são usados para representar objetos JSON, e as listas são usadas para representar arrays JSON.

Por exemplo, se você tiver o seguinte JSON:

```json
{
    "pessoa": {
        "nome": "João",
        "idade": 30,
        "cidade": "São Paulo"
    }
}
```

Você pode representar esses dados em Python da seguinte forma:

```python
dados_json = {
    "pessoa": {
        "nome": "João",
        "idade": 30,
        "cidade": "São Paulo"
    }
}
```

Nesse caso, você tem um dicionário aninhado para representar a estrutura de objetos JSON.

Em resumo, Python oferece a flexibilidade de usar listas, dicionários e suas combinações para representar dados que estão em formatos como CSV e JSON. Isso facilita a leitura, manipulação e processamento desses dados em seu código Python.

### **03. Transformando os dados**

**Continuação**

In [50]:
dados_json[0]

{'Nome do Produto': 'Blush em pó',
 'Categoria do Produto': 'Eletrodomésticos',
 'Preço do Produto (R$)': 79.41,
 'Quantidade em Estoque': 7,
 'Filial': 'Filial 7'}

In [51]:
dados_csv[0]

{'Nome do Item': 'Lápis de sobrancelha',
 'Classificação do Produto': 'Roupas',
 'Valor em Reais (R$)': '55.17',
 'Quantidade em Estoque': '62',
 'Nome da Loja': 'Filial 1',
 'Data da Venda': '2023-04-13 18:58:06.794203'}

In [52]:
nome_colunas_json = list(dados_json[0].keys())
nome_colunas_json

['Nome do Produto',
 'Categoria do Produto',
 'Preço do Produto (R$)',
 'Quantidade em Estoque',
 'Filial']

In [53]:
nome_colunas_csv = list(dados_csv[0].keys())
nome_colunas_csv

['Nome do Item',
 'Classificação do Produto',
 'Valor em Reais (R$)',
 'Quantidade em Estoque',
 'Nome da Loja',
 'Data da Venda']

In [54]:
print(f'Quantidade de colunas no JSON: {len(nome_colunas_json)}')
print(f'Quantidade de colunas no CSV: {len(nome_colunas_csv)}')

Quantidade de colunas no JSON: 5
Quantidade de colunas no CSV: 6


***Após conversas com o time de analytics, foi definido que o nome das colunas da empresa A era o ideal para eles.***

In [55]:
key_mapping = {
    'Nome do Item': 'Nome do Produto',
    'Classificação do Produto':'Categoria do Produto',
    'Valor em Reais (R$)':'Preço do Produto (R$)',
    'Quantidade em Estoque':'Quantidade em Estoque',
    'Nome da Loja':'Filial',
    'Data da Venda':'Data da Venda'
}

In [56]:
dados_csv[0]

{'Nome do Item': 'Lápis de sobrancelha',
 'Classificação do Produto': 'Roupas',
 'Valor em Reais (R$)': '55.17',
 'Quantidade em Estoque': '62',
 'Nome da Loja': 'Filial 1',
 'Data da Venda': '2023-04-13 18:58:06.794203'}

In [57]:
dados_csv[0].keys()

dict_keys(['Nome do Item', 'Classificação do Produto', 'Valor em Reais (R$)', 'Quantidade em Estoque', 'Nome da Loja', 'Data da Venda'])

In [58]:
print(key_mapping.values())

dict_values(['Nome do Produto', 'Categoria do Produto', 'Preço do Produto (R$)', 'Quantidade em Estoque', 'Filial', 'Data da Venda'])


**Minha abordagem**

In [59]:

data_columns_renamed = []
for row in dados_csv:    
    dict_temp = {}
    for key_dict, value_dict in row.items():
        new_key = key_mapping.get(key_dict, key_dict)
        dict_temp[new_key] = value_dict

    data_columns_renamed.append(dict_temp)



In [60]:
data_columns_renamed

[{'Nome do Produto': 'Lápis de sobrancelha',
  'Categoria do Produto': 'Roupas',
  'Preço do Produto (R$)': '55.17',
  'Quantidade em Estoque': '62',
  'Filial': 'Filial 1',
  'Data da Venda': '2023-04-13 18:58:06.794203'},
 {'Nome do Produto': 'Batom matte',
  'Categoria do Produto': 'Eletrônicos',
  'Preço do Produto (R$)': '74.15',
  'Quantidade em Estoque': '48',
  'Filial': 'Filial 9',
  'Data da Venda': '2023-06-03 18:58:06.794203'},
 {'Nome do Produto': 'Corretivo',
  'Categoria do Produto': 'Roupas',
  'Preço do Produto (R$)': '54.86',
  'Quantidade em Estoque': '36',
  'Filial': 'Filial 5',
  'Data da Venda': '2023-06-08 18:58:06.794203'},
 {'Nome do Produto': 'Delineador líquido',
  'Categoria do Produto': 'Roupas',
  'Preço do Produto (R$)': '91.29',
  'Quantidade em Estoque': '1',
  'Filial': 'Filial 8',
  'Data da Venda': '2023-02-27 18:58:06.794203'},
 {'Nome do Produto': 'Batom líquido',
  'Categoria do Produto': 'Roupas',
  'Preço do Produto (R$)': '44.65',
  'Quantidad

**Abordagem do professor:**

In [61]:
new_dados_csv = []

for old_dict in dados_csv:
    dict_temp = {}
    for old_key, value in old_dict.items():
        dict_temp[key_mapping[old_key]] = value
    
    new_dados_csv.append(dict_temp)


In [62]:
new_dados_csv

[{'Nome do Produto': 'Lápis de sobrancelha',
  'Categoria do Produto': 'Roupas',
  'Preço do Produto (R$)': '55.17',
  'Quantidade em Estoque': '62',
  'Filial': 'Filial 1',
  'Data da Venda': '2023-04-13 18:58:06.794203'},
 {'Nome do Produto': 'Batom matte',
  'Categoria do Produto': 'Eletrônicos',
  'Preço do Produto (R$)': '74.15',
  'Quantidade em Estoque': '48',
  'Filial': 'Filial 9',
  'Data da Venda': '2023-06-03 18:58:06.794203'},
 {'Nome do Produto': 'Corretivo',
  'Categoria do Produto': 'Roupas',
  'Preço do Produto (R$)': '54.86',
  'Quantidade em Estoque': '36',
  'Filial': 'Filial 5',
  'Data da Venda': '2023-06-08 18:58:06.794203'},
 {'Nome do Produto': 'Delineador líquido',
  'Categoria do Produto': 'Roupas',
  'Preço do Produto (R$)': '91.29',
  'Quantidade em Estoque': '1',
  'Filial': 'Filial 8',
  'Data da Venda': '2023-02-27 18:58:06.794203'},
 {'Nome do Produto': 'Batom líquido',
  'Categoria do Produto': 'Roupas',
  'Preço do Produto (R$)': '44.65',
  'Quantidad

##### **Exercício "Iterando por dicionários"**

In [63]:
lista_livros = [
    {
        "titulo": "1984",
        "autor": "George Orwell",
        "categoria": "FIC"
    },
    {
        "titulo": "Uma Breve História do Tempo",
        "autor": "Stephen Hawking",
        "categoria": "SCI"
    }
]

In [64]:
categorias = {"FIC": "Ficção", "BIO": "Biografia", "HIS": "História", "SCI": "Ciência", "PHI": "Filosofia"}


In [None]:
livros_atualizados = []

for livro in lista_livros:
    livro_temp = {}
    for k, v in livro.items():
        if k == "categoria":
            livro_temp[k] = categorias[v]
        else:
            livro_temp[k] = v
    livros_atualizados.append(livro_temp)

categoria : FIC
categoria : SCI


In [71]:
livros_atualizados

[{'titulo': '1984', 'autor': 'George Orwell', 'categoria': 'Ficção'},
 {'titulo': 'Uma Breve História do Tempo',
  'autor': 'Stephen Hawking',
  'categoria': 'Ciência'}]

#### **Continuando as atividades**

**Quero agora unir os dois conjuntos de dados, para isso primeiro vamos verificar a quantidade de linhas dos dois datasets**

In [89]:
print(f'Dados do CSV:  {len(new_dados_csv)} \nDados do JSON: {len(dados_json)}\n-------------------\nSomatório:     {len(new_dados_csv) + len(dados_json)}')

Dados do CSV:  1323 
Dados do JSON: 3123
-------------------
Somatório:     4446


In [90]:
combined_list = []
combined_list.extend(dados_json)
combined_list.extend(new_dados_csv)

In [91]:
len(combined_list)

4446

**Verificando se a combinação deu certo:**

In [92]:
combined_list[0]

{'Nome do Produto': 'Blush em pó',
 'Categoria do Produto': 'Eletrodomésticos',
 'Preço do Produto (R$)': 79.41,
 'Quantidade em Estoque': 7,
 'Filial': 'Filial 7'}

In [93]:
dados_json[0]

{'Nome do Produto': 'Blush em pó',
 'Categoria do Produto': 'Eletrodomésticos',
 'Preço do Produto (R$)': 79.41,
 'Quantidade em Estoque': 7,
 'Filial': 'Filial 7'}

In [94]:
combined_list[3123]

{'Nome do Produto': 'Lápis de sobrancelha',
 'Categoria do Produto': 'Roupas',
 'Preço do Produto (R$)': '55.17',
 'Quantidade em Estoque': '62',
 'Filial': 'Filial 1',
 'Data da Venda': '2023-04-13 18:58:06.794203'}

In [95]:
new_dados_csv[0]

{'Nome do Produto': 'Lápis de sobrancelha',
 'Categoria do Produto': 'Roupas',
 'Preço do Produto (R$)': '55.17',
 'Quantidade em Estoque': '62',
 'Filial': 'Filial 1',
 'Data da Venda': '2023-04-13 18:58:06.794203'}

**Agora quero salvar esses dados para disponibilizar para o time de analytics**

In [97]:
# preciso definir qual o nome do arquivo
arquivo_combinado = 'dados_combinados.csv'
# preciso determinar onde quero salvar
path_dados_combinados = f'../data_processed/{arquivo_combinado}'

In [99]:
nomes_colunas = list(combined_list[0].keys())
nomes_colunas

['Nome do Produto',
 'Categoria do Produto',
 'Preço do Produto (R$)',
 'Quantidade em Estoque',
 'Filial']

In [123]:
# aqui vamos precisar escrever o arquivo que vamos gerar
# fieldnames precisa de uma lista com o nome do cabeçalho da primeira linha do arquivo
with open(path_dados_combinados, 'w') as file:
    writer = csv.DictWriter(file, fieldnames=nomes_colunas)
    # quero que ele escreva o cabeçalho
    writer.writeheader()

    # agora vou focar na escrita dos dados
    for row in combined_list:
        writer.writerow(row)

ValueError: dict contains fields not in fieldnames: 'Data da Venda'

**Está dando o erro acima, porque uma parte do conjunto de dados não tem a chave 'Data da Venda', logo vamos precisar tratar isso para seguir com o salvamento do arquivo**

In [124]:
combined_list[0]

{'Nome do Produto': 'Blush em pó',
 'Categoria do Produto': 'Eletrodomésticos',
 'Preço do Produto (R$)': 79.41,
 'Quantidade em Estoque': 7,
 'Filial': 'Filial 7'}

In [125]:
combined_list[-1]

{'Nome do Produto': 'Sombra de olhos',
 'Categoria do Produto': 'Eletrônicos',
 'Preço do Produto (R$)': '41.73',
 'Quantidade em Estoque': '5',
 'Filial': 'Filial 6',
 'Data da Venda': '2022-11-21 18:58:06.794203'}

In [126]:
combined_list[0]['Data da Venda']

KeyError: 'Data da Venda'

In [127]:
combined_list[0].get('Data da Venda')

In [128]:
combined_list[-1].get('Data da Venda')

'2022-11-21 18:58:06.794203'

In [None]:
combined_list[0].get(key='Data da Venda', default='Indisponível')

'Indisponível'

In [136]:
nomes_colunas = list(combined_list[-1].keys())
nomes_colunas

['Nome do Produto',
 'Categoria do Produto',
 'Preço do Produto (R$)',
 'Quantidade em Estoque',
 'Filial',
 'Data da Venda']

In [141]:
dados_combinados_tabela = [nomes_colunas]

for row in combined_list:
    linha = []
    for column in nomes_colunas:
        linha.append(row.get(column, 'Indisponível'))
    dados_combinados_tabela.append(linha)

In [146]:
dados_combinados_tabela[0]

['Nome do Produto',
 'Categoria do Produto',
 'Preço do Produto (R$)',
 'Quantidade em Estoque',
 'Filial',
 'Data da Venda']

In [144]:
dados_combinados_tabela[1]

['Blush em pó', 'Eletrodomésticos', 79.41, 7, 'Filial 7', 'Indisponível']

In [147]:
dados_combinados_tabela[-1]

['Sombra de olhos',
 'Eletrônicos',
 '41.73',
 '5',
 'Filial 6',
 '2022-11-21 18:58:06.794203']

In [148]:
path_dados_combinados = '../data_processed/dados_combinados.csv'

with open(path_dados_combinados, 'w') as file:
    writer = csv.writer(file)
    writer.writerows(dados_combinados_tabela)

##### **Mão na massa: substituindo o for por um list comprehension**

Para uniformizar os nomes das colunas em nossos conjuntos de dados, empregamos laços `for` para iterar por cada dicionário. Em cada iteração, renomeamos as colunas com base nas correspondências definidas no dicionário `key_mapping`.

```python
key_mapping = {
    'Nome do Item': 'Nome do Produto',
    'Classificação do Produto': 'Categoria do Produto',
    'Valor em Reais (R$)': 'Preço do Produto (R$)',
    'Quantidade em Estoque': 'Quantidade em Estoque',
    'Nome da Loja': 'Filial',
    'Data da Venda': 'Data da Venda'
}
```
Com base nesse mapeamento, a lógica de renomeação foi codificada como:

```python
new_dados_csv = []

for old_dict in dados_csv:
  dict_temp = {}
  for old_key, value in old_dict.items():
    dict_temp[key_mapping.get(old_key)] = value
  new_dados_csv.append(dict_temp)
new_dados_csv[0]
```

Nosso desafio agora é refinar este código, tornando-o mais conciso através da implementação de uma list comprehension. Para auxiliar nesta tarefa, recomendamos a consulta à documentação oficial do Python e também a revisão da atividade complementar "Para saber mais: list comprehension".

In [120]:
dados_novos_csv = [{key_mapping.get(old_key): value for old_key, value in old_dict.items()} for old_dict in dados_csv]

In [121]:
dados_novos_csv

[{'Nome do Produto': 'Lápis de sobrancelha',
  'Categoria do Produto': 'Roupas',
  'Preço do Produto (R$)': '55.17',
  'Quantidade em Estoque': '62',
  'Filial': 'Filial 1',
  'Data da Venda': '2023-04-13 18:58:06.794203'},
 {'Nome do Produto': 'Batom matte',
  'Categoria do Produto': 'Eletrônicos',
  'Preço do Produto (R$)': '74.15',
  'Quantidade em Estoque': '48',
  'Filial': 'Filial 9',
  'Data da Venda': '2023-06-03 18:58:06.794203'},
 {'Nome do Produto': 'Corretivo',
  'Categoria do Produto': 'Roupas',
  'Preço do Produto (R$)': '54.86',
  'Quantidade em Estoque': '36',
  'Filial': 'Filial 5',
  'Data da Venda': '2023-06-08 18:58:06.794203'},
 {'Nome do Produto': 'Delineador líquido',
  'Categoria do Produto': 'Roupas',
  'Preço do Produto (R$)': '91.29',
  'Quantidade em Estoque': '1',
  'Filial': 'Filial 8',
  'Data da Venda': '2023-02-27 18:58:06.794203'},
 {'Nome do Produto': 'Batom líquido',
  'Categoria do Produto': 'Roupas',
  'Preço do Produto (R$)': '44.65',
  'Quantidad

In [122]:
len(dados_novos_csv)

1323