<a href="https://colab.research.google.com/github/Gabriel-data/Python_Modelos_para_Tratar_e_Preparar_Dados/blob/main/01_02_Tratar_C%C3%A1lculos_Num%C3%A9ricos_com_Valores_Monet%C3%A1rios_Parte2_Python.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# OBJETIVO: Preparar e tratar dados no Python - parte 2 - cálculos numéricos.

# Preparação do ambiente (carga de dados).

In [1]:
# Importar as bibliotecas
import numpy as np
import pandas as pd

In [7]:
## Alternativa para preparar o Drive
import os
#pasta = "/content/drive/MyDrive"
pasta = "/content/drive/MyDrive/A-Colab_Note_2"
if not os.path.exists(pasta):
  os.makedirs(pasta)

In [8]:
# Montar o Drive
from google.colab import drive
# drive.mount('/content/drive')
drive.mount('/content/drive/MyDrive/A-Colab_Note_2')

Mounted at /content/drive/MyDrive/A-Colab_Note_2


### Extração de dados

In [9]:
# CARREGAR O DATASET em formato Excel, tipo de arquivo .CSV.

# O arquivo na origem possui mais de uma planilha, por isso foi acrescentado um direcionamento para a Lista (planilha).

dados = pd.read_csv('/content/drive/MyDrive/A-Colab_Note_2/MyDrive/A-Colab_Note_2/z_Bases/Lista_20_Prod-Tratada_Etapa_1_falta_Precos.CSV')

# 0. Coleta de Requisitos

### 0.1 Informações gerais e necessidades:

    * Nome do arquivo: **Lista_20_Produtos_Isol.CSV**

    * Origem do arquivo: Local, da máquina de usuário.

    * Responsável (usuário chave): Gabriel Silva

    * Característica geral e objetivo do arquivo: armazena uma lista única e completa de produtos (SKU), informações de características (marca, categoria), informações financeiras (estoque movimentado, preço de custo, preço de venda e totalizadores) e informações sobre a movimentação de pedidos (pedido, data_movimento, vendedores).

    * Armazenamento para tratativas: Google Drive | Gabriel

    * Integração direta: Não

### 0.2 Regras de Negócios para os campos com valores:

		*   PRECO_VISTA = VALOR_CUSTO + 50%
		*   PRECO_PRAZO = PRECO_VISTA + 10
		*   TOTAL_VLR_CUSTO = VALOR_CUSTO * quantidade de Estoque
		*   TOTAL_VLR_VENDA = PRECO_VISTA * quantidade de Estoque

# 1. Analisar estrutura da base de dados

####1.1 Identificação da estrutura de dados

In [10]:
# CONSULTAR A ESTRUTURA GERAL DO DATASET

dados.head(3)

# Resultado: positivo, está de acordo com o arquivo de origem que foi carregado.

Unnamed: 0,SKU,TITULO,MARCA,CATEGORIA,VALOR_CUSTO,PRECO_VISTA,PRECO_PRAZO,ESTOQUE,TOTAL_VLR_CUSTO,TOTAL_VLR_VENDA,Estado,Pais,Pedido,Data_Movimento,Vendedor
0,XYZ102030,Item 1,Amazon,Eletronico,300,450,495,10,3000,4500,Rio Grande do Sul,Brasil,214401,2024-12-09,Cleber
1,XYZ102031,Item 2,IBM,Eletronico,650,975,1072,20,13000,19500,Rio Grande do Sul,Brasil,540247,2023-08-10,Fonseca
2,XYZ102032,Item 3,Google,Internet,900,1350,1485,30,27000,40500,São Paulo,Brasil,367707,2022-12-18,Ana


In [11]:
# CONTAR O NÚMERO TOTAL DE LINHAS E COLUNAS DO DATASET

dados.shape

# Resultado: O número total de linhas é 18 e o número total de colunas é 15.

(18, 15)

###1.2 Identificação de Campos:

In [12]:
# EXTRAIR NOME DOS CAMPOS DO DATASET

# Finalidade: listar o nome dos campos separados por vírgula.

colunas = dados.columns.tolist()
descricao_campos = ', '.join(colunas)

print(descricao_campos)

SKU, TITULO, MARCA, CATEGORIA, VALOR_CUSTO, PRECO_VISTA, PRECO_PRAZO, ESTOQUE, TOTAL_VLR_CUSTO, TOTAL_VLR_VENDA, Estado, Pais, Pedido, Data_Movimento, Vendedor


Identificação de Campos específicos a serem considerados para este tratamento:

In [13]:
# Extrair descrição e número de cada campo do Dataset
# Permite a otimização para futuros tratamentos.

colunas = dados.columns.tolist()
descricao_campos = ', '.join([f'{coluna} ({i})' for i, coluna in enumerate(colunas)])

print(descricao_campos)

# Resultado (de quais campos preciso?):
# SKU (0), TITULO (1), VALOR_CUSTO (4), PRECO_VISTA (5), PRECO_PRAZO (6), ESTOQUE (7),TOTAL_VLR_CUSTO (8), TOTAL_VLR_VENDA (9).


SKU (0), TITULO (1), MARCA (2), CATEGORIA (3), VALOR_CUSTO (4), PRECO_VISTA (5), PRECO_PRAZO (6), ESTOQUE (7), TOTAL_VLR_CUSTO (8), TOTAL_VLR_VENDA (9), Estado (10), Pais (11), Pedido (12), Data_Movimento (13), Vendedor (14)


In [14]:
# IDENTIFICAR TIPOS DE CAMPOS
dados.dtypes


# TRATAR (CONVERTER) TIPOS DE CAMPOS

# Convertendo para float
#dados['PRECO_VISTA'] = dados['PRECO_VISTA'].astype('int64')

# Consulta após conversão dos tipos
#print(dados.dtypes)

# Resultado da análise: Não requerido alterações, todos os campos de valores são do tipo Int65.

Unnamed: 0,0
SKU,object
TITULO,object
MARCA,object
CATEGORIA,object
VALOR_CUSTO,int64
PRECO_VISTA,int64
PRECO_PRAZO,int64
ESTOQUE,int64
TOTAL_VLR_CUSTO,int64
TOTAL_VLR_VENDA,int64


In [15]:
## EXIBIR LINHAS E COLUNAS ESPECÍFICAS

#dados.head(10)

## Exibir entre linhas
#dados.iloc[1:20]

## Exibir linhas e colunas específicas
#dados1.iloc[[2,5,17], [0,1,2,5]]

## Exibir colunas específicas
#print(dados.iloc[:, [2, 6]])
dados.iloc[:5, [0,1,4,5,6,7,8,9]]

## Exibir linhas específicas
#dados.iloc[[2,19]]

Unnamed: 0,SKU,TITULO,VALOR_CUSTO,PRECO_VISTA,PRECO_PRAZO,ESTOQUE,TOTAL_VLR_CUSTO,TOTAL_VLR_VENDA
0,XYZ102030,Item 1,300,450,495,10,3000,4500
1,XYZ102031,Item 2,650,975,1072,20,13000,19500
2,XYZ102032,Item 3,900,1350,1485,30,27000,40500
3,XYZ102033,Item 4,6500,9750,10725,10,65000,97500
4,XYZ102034,Item 5,650,975,1072,50,32500,48750


In [16]:
# RESERVANDO UMA CÓPIA DO DATASET ORIGINAL

d2 = dados.copy()

# 2. VALIDANDO CAMPOS (CÁLCULOS) CONFORME REGRAS

### 2.1 Regra: "PRECO_VISTA = VALOR_CUSTO + 50%"

In [17]:
# Etapa 1-4

##############################################################################
# Regra: "PRECO_VISTA = VALOR_CUSTO + 50%"
##############################################################################

# Criando a coluna de validação com validação da regra:
d2['Val_PRECO_VISTA'] = d2['PRECO_VISTA'] == d2['VALOR_CUSTO'] * 1.5

# Retornar resultados como "FALSE", ou seja com erros:
erros = d2[d2['Val_PRECO_VISTA'] == False]

print(erros)

# Ocorrências: Encontradas na linha 17 com descrepância no campo PRECO_VISTA.
# Ação requerida: correção na Origem. Não sendo possível.
# Ação paliativa: correção na linha do campo.
# Ação preventiva: correção em todas as linhas do campo. Recálculo das regras.

          SKU   TITULO   MARCA CATEGORIA  VALOR_CUSTO  PRECO_VISTA  \
17  ABC102049  Item 20  Nestle  Nutrição          100         1500   

    PRECO_PRAZO  ESTOQUE  TOTAL_VLR_CUSTO  TOTAL_VLR_VENDA     Estado    Pais  \
17          165      200            20000                0  São Paulo  Brasil   

    Pedido Data_Movimento Vendedor  Val_PRECO_VISTA  
17  234984     2024-06-08  Fonseca            False  


In [18]:
# Etapa 2-4
# Criando um novo campo com base na regra ou recriar o mesmo campo:

# Neste caso estou recriando o mesmo campo e recálculando todas as linhas de acordo com as regras:

d2['PRECO_VISTA'] = (dados['VALOR_CUSTO'] * 1.5).round(0).astype(int)

In [None]:
# Etapa 3-4
# (Opcional): Coreção de dados em linhas e campos específicos:

# Altera o valor de 'PRECO_VISTA' na linha 17 para 150 e dispensa execução da etapa 4-4.

# dados.loc[17, 'PRECO_VISTA'] = 150

# OBS.: Não foi aplicado neste caso.

In [19]:
# Etapa 4-4

# Recriando a coluna de Revalidação com base em um novo campo cálculado com a regra:
d2['Val_PRECO_VISTA'] = d2['PRECO_VISTA'] == d2['VALOR_CUSTO'] * 1.5

# Retornar resultados como "FALSE", ou seja com erros:
erros = d2[d2['Val_PRECO_VISTA'] == False]

print(erros)

# Ocorrências: ação concluída.

Empty DataFrame
Columns: [SKU, TITULO, MARCA, CATEGORIA, VALOR_CUSTO, PRECO_VISTA, PRECO_PRAZO, ESTOQUE, TOTAL_VLR_CUSTO, TOTAL_VLR_VENDA, Estado, Pais, Pedido, Data_Movimento, Vendedor, Val_PRECO_VISTA]
Index: []


In [20]:
## Exibir colunas específicas
d2.iloc[15:20, [0,1,4,5,6,7,8,9]]

Unnamed: 0,SKU,TITULO,VALOR_CUSTO,PRECO_VISTA,PRECO_PRAZO,ESTOQUE,TOTAL_VLR_CUSTO,TOTAL_VLR_VENDA
15,ABC102045,Item 16,800,1200,1320,160,128000,192000
16,ABC102048,Item 19,650,975,1072,190,123500,185250
17,ABC102049,Item 20,100,150,165,200,20000,0


Análise geral da validação:
###### A linha com erro e todoas as demais linhas do campo foram recálculadas e revalidadas, sendo que as inconsistências foram tratadas.

### 2.2 Regra: "PRECO_PRAZO = PRECO_VISTA + 10%"

In [21]:
# Etapa 1-4

##############################################################################
# Regra: "PRECO_PRAZO = PRECO_VISTA + 10%"
##############################################################################

# Criando a coluna de validação com validação da regra:
d2['Val_PRECO_PRAZO'] = d2['PRECO_PRAZO'] == (d2['PRECO_VISTA'] * 1.1).round(0).astype(int)

# Retornar resultados como "FALSE", ou seja com erros:
erros = d2[d2['Val_PRECO_PRAZO'] == False]

print(erros)

# Ocorrências: Encontradas na linha 6, porém o retorno do cálculo está correto, mas há necessidades de arredondamentos.
# Ação requerida: correção na Origem. Não sendo possível.
# Ação paliativa: correção na linha do campo.
# Ação preventiva: correção em todas as linhas do campo. Recálculo das regras e arredondamentos.

         SKU  TITULO   MARCA CATEGORIA  VALOR_CUSTO  PRECO_VISTA  PRECO_PRAZO  \
6  XYZ102036  Item 7  Google  Internet          990         1485         1633   

   ESTOQUE  TOTAL_VLR_CUSTO  TOTAL_VLR_VENDA     Estado    Pais  Pedido  \
6       70            69300           103950  São Paulo  Brasil  390903   

  Data_Movimento Vendedor  Val_PRECO_VISTA  Val_PRECO_PRAZO  
6     2022-07-12   Cleber             True            False  


In [22]:
# Etapa 2-4
# Criando um novo campo com base na regra ou recriar o mesmo campo:

# Neste caso estou recriando o mesmo campo e recálculando todas as linhas de acordo com as regras:

d2['PRECO_PRAZO'] = (d2['PRECO_VISTA'] * 1.1).round(0).astype(int)

In [None]:
# Etapa 3-4
# (Opcional): Coreção de dados em linhas e campos específicos:

# Altera o valor de 'PRECO_VISTA' na linha 17 para 150
# dados.loc[17, 'PRECO_PRAZO'] = 150


## Exibir colunas específicas
# dados.iloc[16:18, [0,1,4,5,8,7,17]]

# OBS.: Não requerido neste caso.

In [23]:
# Etapa 4-4

# Recriando a coluna de Revalidação com base em um novo campo cálculado com a regra:
d2['Val_PRECO_PRAZO'] = d2['PRECO_PRAZO'] == (d2['PRECO_VISTA'] * 1.1).round(0).astype(int)

# Retornar resultados como "FALSE", ou seja com erros:
erros = d2[d2['Val_PRECO_PRAZO'] == False]

print(erros)

# Ocorrências: ação concluída.

Empty DataFrame
Columns: [SKU, TITULO, MARCA, CATEGORIA, VALOR_CUSTO, PRECO_VISTA, PRECO_PRAZO, ESTOQUE, TOTAL_VLR_CUSTO, TOTAL_VLR_VENDA, Estado, Pais, Pedido, Data_Movimento, Vendedor, Val_PRECO_VISTA, Val_PRECO_PRAZO]
Index: []


In [24]:
## Exibir colunas específicas
d2.iloc[6:8, [0,1,4,5,6,7,8,9]]

Unnamed: 0,SKU,TITULO,VALOR_CUSTO,PRECO_VISTA,PRECO_PRAZO,ESTOQUE,TOTAL_VLR_CUSTO,TOTAL_VLR_VENDA
6,XYZ102036,Item 7,990,1485,1634,70,69300,103950
7,XYZ102037,Item 8,650,975,1072,80,52000,78000


Análise geral da validação:
###### A linha e todos os campos foram recálculados e aplicado arredondamentos. Não permanecendo nenhuma inconsistência.

### 2.3 Regra: "TOTAL_VLR_CUSTO = VALOR_CUSTO * quantidade de Estoque"

In [31]:
# Etapa 1-4

##############################################################################
# Regra: "TOTAL_VLR_CUSTO = VALOR_CUSTO * quantidade de Estoque"
##############################################################################

# Criando a coluna de validação com validação da regra:
d2['Val_TOTAL_VLR_CUSTO'] = (d2['VALOR_CUSTO'] * d2['ESTOQUE']) == d2['TOTAL_VLR_CUSTO']

# Retornar resultados como "FALSE", ou seja com erros:
erros = d2[d2['Val_TOTAL_VLR_CUSTO'] == False]

print(erros)

# Ocorrências: Encontradas na linha 6, porém o retorno do cálculo está correto, mas há necessidades de arredondamentos.
# Ação requerida: correção na Origem. Não sendo possível.
# Ação paliativa: correção na linha do campo.
# Ação preventiva: correção em todas as linhas do campo. Recálculo das regras e arredondamentos.

Empty DataFrame
Columns: [SKU, TITULO, MARCA, CATEGORIA, VALOR_CUSTO, PRECO_VISTA, PRECO_PRAZO, ESTOQUE, TOTAL_VLR_CUSTO, TOTAL_VLR_VENDA, Estado, Pais, Pedido, Data_Movimento, Vendedor, Val_PRECO_VISTA, Val_PRECO_PRAZO, Val_TOTAL_VLR_CUSTO]
Index: []


In [32]:
# Etapa 2-4
# Criando um novo campo com base na regra ou recriar o mesmo campo:

# Neste caso estou recriando o mesmo campo e recálculando todas as linhas de acordo com as regras:

d2['TOTAL_VLR_CUSTO'] = (d2['VALOR_CUSTO'] * d2['ESTOQUE']).astype(int)

# Ocorrência: não se faz necessário essa etapa, pais a validação na etapa 1-4 não identificou erros.

In [None]:
# Etapa 3-4
# (Opcional): Coreção de dados em linhas e campos específicos:

# Altera o valor de 'PRECO_VISTA' na linha 17 para 150
# dados.loc[17, 'TOTAL_VLR_CUSTO'] = 150


## Exibir colunas específicas
# dados.iloc[16:18, [0,1,4,5,8,7,17]]

# OBS.: Não requerido neste caso.

In [33]:
# Etapa 4-4

# Recriando a coluna de Revalidação com base em um novo campo cálculado com a regra:
d2['Val_TOTAL_VLR_CUSTO'] = (d2['VALOR_CUSTO'] * d2['ESTOQUE']) == d2['TOTAL_VLR_CUSTO']

# Retornar resultados como "FALSE", ou seja com erros:
erros = d2[d2['Val_TOTAL_VLR_CUSTO'] == False]

print(erros)

# Ocorrência: não se faz necessário essa etapa, por motivo que a validação na etapa 1-4 não identificou erros.

Empty DataFrame
Columns: [SKU, TITULO, MARCA, CATEGORIA, VALOR_CUSTO, PRECO_VISTA, PRECO_PRAZO, ESTOQUE, TOTAL_VLR_CUSTO, TOTAL_VLR_VENDA, Estado, Pais, Pedido, Data_Movimento, Vendedor, Val_PRECO_VISTA, Val_PRECO_PRAZO, Val_TOTAL_VLR_CUSTO]
Index: []


In [35]:
## Exibir colunas específicas
d2.iloc[6:8, [0,1,4,5,6,7,8,9]]

Unnamed: 0,SKU,TITULO,VALOR_CUSTO,PRECO_VISTA,PRECO_PRAZO,ESTOQUE,TOTAL_VLR_CUSTO,TOTAL_VLR_VENDA
6,XYZ102036,Item 7,990,1485,1634,70,69300,103950
7,XYZ102037,Item 8,650,975,1072,80,52000,78000


Análise geral da validação:
###### Não se faz necessário ajustes, pois a validação na etapa 1-4 não identificou erros.

### 2.4 Regra: "TOTAL_VLR_VENDA = PRECO_VISTA * quantidade de Estoque"

In [41]:
# Etapa 1-4

##############################################################################
# Regra: "TOTAL_VLR_VENDA = PRECO_VISTA * quantidade de Estoque"
##############################################################################

# Criando a coluna de validação com validação da regra:
d2['Val_TOTAL_VLR_VENDA'] = (d2['PRECO_VISTA'] * d2['ESTOQUE']) == d2['TOTAL_VLR_VENDA']

# Retornar resultados como "FALSE", ou seja com erros:
erros = d2[d2['Val_TOTAL_VLR_CUSTO'] == False]

print(erros)

# Ocorrências: Encontradas na linha 6, porém o retorno do cálculo está correto, mas há necessidades de arredondamentos.
# Ação requerida: correção na Origem. Não sendo possível.
# Ação paliativa: correção na linha do campo.
# Ação preventiva: correção em todas as linhas do campo. Recálculo das regras e arredondamentos.

Empty DataFrame
Columns: [SKU, TITULO, MARCA, CATEGORIA, VALOR_CUSTO, PRECO_VISTA, PRECO_PRAZO, ESTOQUE, TOTAL_VLR_CUSTO, TOTAL_VLR_VENDA, Estado, Pais, Pedido, Data_Movimento, Vendedor, Val_PRECO_VISTA, Val_PRECO_PRAZO, Val_TOTAL_VLR_CUSTO, Val_TOTAL_VLR_VENDA, TOTAL_VLR_VENDA_REC]
Index: []


In [42]:
# Etapa 2-4
# Criando um novo campo com base na regra ou recriar o mesmo campo:

# Neste caso estou recriando o mesmo campo e recálculando todas as linhas de acordo com as regras:

d2['TOTAL_VLR_VENDA'] = (d2['PRECO_VISTA'] * d2['ESTOQUE']).astype(int)

In [None]:
# Etapa 3-4
# (Opcional): Coreção de dados em linhas e campos específicos:

# Altera o valor de 'PRECO_VISTA' na linha 17 para 150
# dados.loc[17, 'Val_TOTAL_VLR_VENDA'] = 150


## Exibir colunas específicas
# dados.iloc[16:18, [0,1,4,5,8,7,17]]

# OBS.: Não requerido neste caso.

In [43]:
# Etapa 4-4

# Recriando a coluna de Revalidação com base em um novo campo cálculado com a regra:
d2['Val_TOTAL_VLR_VENDA'] = (d2['PRECO_VISTA'] * d2['ESTOQUE']) == d2['TOTAL_VLR_VENDA']

# Retornar resultados como "FALSE", ou seja com erros:
erros = d2[d2['Val_TOTAL_VLR_VENDA'] == False]

print(erros)

# Ocorrências: ação concluída.

Empty DataFrame
Columns: [SKU, TITULO, MARCA, CATEGORIA, VALOR_CUSTO, PRECO_VISTA, PRECO_PRAZO, ESTOQUE, TOTAL_VLR_CUSTO, TOTAL_VLR_VENDA, Estado, Pais, Pedido, Data_Movimento, Vendedor, Val_PRECO_VISTA, Val_PRECO_PRAZO, Val_TOTAL_VLR_CUSTO, Val_TOTAL_VLR_VENDA, TOTAL_VLR_VENDA_REC]
Index: []


In [44]:
## Exibir colunas específicas
d2.iloc[6:8, [0,1,4,5,6,7,8,9]]

Unnamed: 0,SKU,TITULO,VALOR_CUSTO,PRECO_VISTA,PRECO_PRAZO,ESTOQUE,TOTAL_VLR_CUSTO,TOTAL_VLR_VENDA
6,XYZ102036,Item 7,990,1485,1634,70,69300,103950
7,XYZ102037,Item 8,650,975,1072,80,52000,78000


Análise geral da validação:
###### Não se faz necessário ajustes, pois a validação na etapa 1-4 não identificou erros.

#3. Alternativas

In [51]:
# RESERVANDO UMA CÓPIA DO DATASET ORIGINAL

df = d2.copy()

In [52]:
# Identificação de tipos de campo:
df.dtypes

Unnamed: 0,0
SKU,object
TITULO,object
MARCA,object
CATEGORIA,object
VALOR_CUSTO,int64
PRECO_VISTA,int64
PRECO_PRAZO,int64
ESTOQUE,int64
TOTAL_VLR_CUSTO,int64
TOTAL_VLR_VENDA,int64


In [53]:
# Extrair número campos (2)

colunas = df.columns.tolist()
descricao_campos = ', '.join([f'{coluna} ({i})' for i, coluna in enumerate(colunas)])

print(descricao_campos)

# Resultado (de quais campos preciso?):
# SKU (0), TITULO (1), VALOR_CUSTO (4), PRECO_VISTA (5), PRECO_PRAZO (6), ESTOQUE (7),TOTAL_VLR_CUSTO (8), TOTAL_VLR_VENDA (9).


SKU (0), TITULO (1), MARCA (2), CATEGORIA (3), VALOR_CUSTO (4), PRECO_VISTA (5), PRECO_PRAZO (6), ESTOQUE (7), TOTAL_VLR_CUSTO (8), TOTAL_VLR_VENDA (9), Estado (10), Pais (11), Pedido (12), Data_Movimento (13), Vendedor (14), Val_PRECO_VISTA (15), Val_PRECO_PRAZO (16), Val_TOTAL_VLR_CUSTO (17), Val_TOTAL_VLR_VENDA (18), TOTAL_VLR_VENDA_REC (19)


In [54]:
## Exibir colunas específicas

#print(dados.iloc[:, [2, 6]])

df.iloc[:5, [0,1,4,5,6,7,8,9]]

Unnamed: 0,SKU,TITULO,VALOR_CUSTO,PRECO_VISTA,PRECO_PRAZO,ESTOQUE,TOTAL_VLR_CUSTO,TOTAL_VLR_VENDA
0,XYZ102030,Item 1,300,450,495,10,3000,4500
1,XYZ102031,Item 2,650,975,1072,20,13000,19500
2,XYZ102032,Item 3,900,1350,1485,30,27000,40500
3,XYZ102033,Item 4,6500,9750,10725,10,65000,97500
4,XYZ102034,Item 5,650,975,1072,50,32500,48750


In [55]:
# Remoçao de campos (colunas) desnecessárias:

df = df.drop(columns=['Val_PRECO_VISTA', 'Val_PRECO_PRAZO', 'Val_TOTAL_VLR_CUSTO', 'Val_TOTAL_VLR_VENDA'])

In [56]:
# Renomear Campos (colunas)

df = df.rename(columns={'Vendedor': 'VENDEDORES'})

In [58]:
# Renoemar todas as colunas
# Atribuindo nome as colunas

# df.columns = ['novo_nome_coluna1', 'novo_nome_coluna2', 'novo_nome_coluna3']

In [57]:
# Remova a coluna da posição original
#precovista_coluna = df.pop('PRECO_VISTA')

# Alterar posição de campos
#df.insert(5, 'PRECO_VISTA', precovista_coluna)

#print(df)

In [59]:
#dfx = pd.Dataframe(df)

# Defina a ordem desejada das colunas por completo
ordem_colunas = ['SKU', 'TITULO', 'MARCA', 'CATEGORIA', 'VALOR_CUSTO', 'PRECO_VISTA', 'ESTOQUE', 'PRECO_PRAZO', 'TOTAL_VLR_CUSTO', 'TOTAL_VLR_VENDA', 'Estado', 'Pais', 'Pedido', 'Data_Movimento', 'VENDEDORES']

# Reordene as colunas do DataFrame
df = df[ordem_colunas]

#4. GERAR NOVA BASE DE DADOS TRATADA

In [60]:
# RESERVANDO UMA CÓPIA DO DATASET ANTERIOR

dfx = df.copy()

In [61]:
# REVISAR Dataset

dfx.head(5)


Unnamed: 0,SKU,TITULO,MARCA,CATEGORIA,VALOR_CUSTO,PRECO_VISTA,ESTOQUE,PRECO_PRAZO,TOTAL_VLR_CUSTO,TOTAL_VLR_VENDA,Estado,Pais,Pedido,Data_Movimento,VENDEDORES
0,XYZ102030,Item 1,Amazon,Eletronico,300,450,10,495,3000,4500,Rio Grande do Sul,Brasil,214401,2024-12-09,Cleber
1,XYZ102031,Item 2,IBM,Eletronico,650,975,20,1072,13000,19500,Rio Grande do Sul,Brasil,540247,2023-08-10,Fonseca
2,XYZ102032,Item 3,Google,Internet,900,1350,30,1485,27000,40500,São Paulo,Brasil,367707,2022-12-18,Ana
3,XYZ102033,Item 4,Microsoft,Software,6500,9750,10,10725,65000,97500,Distrito Federal,Brasil,529998,2024-07-12,Paulo
4,XYZ102034,Item 5,Amazon,Eletronico,650,975,50,1072,32500,48750,Rio Grande do Sul,Brasil,42227,2022-02-16,Diego


Conclusão:

Foram aplicados tratamentos em 4 campos com valores monetários.


## 6. Gerar novo Dataset tratado.



*   Exportar


In [62]:
# Criar cópia renomeada do Dataset

dados2 = dfx.copy()  # Faz uma cópia do DataFrame original

dados2.head(5)

Unnamed: 0,SKU,TITULO,MARCA,CATEGORIA,VALOR_CUSTO,PRECO_VISTA,ESTOQUE,PRECO_PRAZO,TOTAL_VLR_CUSTO,TOTAL_VLR_VENDA,Estado,Pais,Pedido,Data_Movimento,VENDEDORES
0,XYZ102030,Item 1,Amazon,Eletronico,300,450,10,495,3000,4500,Rio Grande do Sul,Brasil,214401,2024-12-09,Cleber
1,XYZ102031,Item 2,IBM,Eletronico,650,975,20,1072,13000,19500,Rio Grande do Sul,Brasil,540247,2023-08-10,Fonseca
2,XYZ102032,Item 3,Google,Internet,900,1350,30,1485,27000,40500,São Paulo,Brasil,367707,2022-12-18,Ana
3,XYZ102033,Item 4,Microsoft,Software,6500,9750,10,10725,65000,97500,Distrito Federal,Brasil,529998,2024-07-12,Paulo
4,XYZ102034,Item 5,Amazon,Eletronico,650,975,50,1072,32500,48750,Rio Grande do Sul,Brasil,42227,2022-02-16,Diego


In [63]:
# Exportando dados tratados para arquivo de Excel:

dados2.to_excel('/content/drive/MyDrive/A-Colab_Note_2/MyDrive/A-Colab_Note_2/z_Bases/Bases_Tratadas/Lista_20_Precos-Recalculados_310325.xlsx', index=False)

In [64]:
# Exportando dados tratados para arquivo de CSV:

dados2.to_csv('/content/drive/MyDrive/A-Colab_Note_2/MyDrive/A-Colab_Note_2/z_Bases/Bases_Tratadas/Lista_20_Precos-Recalculados_310325.CSV', index=False)

Próximo tema (PREVISTO):

    *   Tratamento de dados em Lote.


Obrigado por acompanhar até aqui!

Fim!