# 📘 Aula 6 – Limpeza e Organização de Dados com `pandas`
**Objetivos da Aula**:
- Identificar e tratar valores ausentes.
- Renomear colunas e padronizar nomes.
- Alterar o tipo de dados (casting).
- Filtrar e ordenar registros.
- Corrigir registros com erros ou duplicações.

## 🧠 Parte 1 – Por que limpar os dados?
Na prática, os dados podem ter:
- Erros de digitação
- Valores ausentes
- Formatos inconsistentes
- Colunas mal nomeadas

## 🧹 Parte 2 – Lidando com valores ausentes

In [None]:
import pandas as pd

df = pd.read_csv("vendas_ausente.csv", sep=";", decimal=",")
df.isnull()
df.isnull().sum()

Unnamed: 0,0
produto,9
quantidade,19
preco_unitario,6
data_venda,0
valor_total,23
custo_total,32


In [None]:
df.isnull()
df.isnull().sum()

Unnamed: 0,0
produto,0
quantidade,0
preco_unitario,6
data_venda,0
receita_total,23
custo_total,0


In [None]:
display(df)

Unnamed: 0,produto,quantidade,preco_unitario,data_venda,valor_total,custo_total
0,Monitor,5.0,120.0,2023-04-13,600.0,472.141407
1,Teclado,10.0,900.0,2023-12-15,9000.0,6531.120878
2,Mouse,10.0,900.0,2023-09-28,9000.0,5922.478564
3,Notebook,15.0,120.0,2023-04-17,1800.0,1484.808558
4,Impressora,15.0,80.0,2023-03-13,1200.0,835.167366
...,...,...,...,...,...,...
205,Monitor,5.0,120.0,2023-04-13,600.0,472.141407
206,Monitor,5.0,120.0,2023-04-13,600.0,472.141407
207,Monitor,5.0,120.0,2023-04-13,600.0,472.141407
208,Monitor,5.0,120.0,2023-04-13,600.0,472.141407


In [None]:
df_sem_nulos = df.dropna()
display(df_sem_nulos)

Unnamed: 0,produto,quantidade,preco_unitario,data_venda,valor_total,custo_total
0,Monitor,5.0,120.0,2023-04-13,600.0,472.141407
1,Teclado,10.0,900.0,2023-12-15,9000.0,6531.120878
2,Mouse,10.0,900.0,2023-09-28,9000.0,5922.478564
3,Notebook,15.0,120.0,2023-04-17,1800.0,1484.808558
4,Impressora,15.0,80.0,2023-03-13,1200.0,835.167366
...,...,...,...,...,...,...
205,Monitor,5.0,120.0,2023-04-13,600.0,472.141407
206,Monitor,5.0,120.0,2023-04-13,600.0,472.141407
207,Monitor,5.0,120.0,2023-04-13,600.0,472.141407
208,Monitor,5.0,120.0,2023-04-13,600.0,472.141407


In [None]:
import numpy as np
#df["quantidade"].replace("", np.nan, inplace=True)
df["quantidade"].fillna(0, inplace=True) # aonde tiver valores NA substitui por ZERO

df["produto"].fillna("desconhecido", inplace=True) # aonde tiver NA  preencher com DESCONHECIDO
df["custo_total"].fillna(0, inplace=True)

display(df)

The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  df["quantidade"].fillna(0, inplace=True) # aonde tiver valores NA substitui por ZERO
The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  df["produto"].fillna("desconhecido", inplace=True) # aonde tiver NA  preencher com DESCONHECIDO
The behavior will change in pandas 3.0. This inplac

Unnamed: 0,produto,quantidade,preco_unitario,data_venda,valor_total,custo_total
0,Monitor,5.0,120.0,2023-04-13,600.0,472.141407
1,Teclado,10.0,900.0,2023-12-15,9000.0,6531.120878
2,Mouse,10.0,900.0,2023-09-28,9000.0,5922.478564
3,Notebook,15.0,120.0,2023-04-17,1800.0,1484.808558
4,Impressora,15.0,80.0,2023-03-13,1200.0,835.167366
...,...,...,...,...,...,...
205,Monitor,5.0,120.0,2023-04-13,600.0,472.141407
206,Monitor,5.0,120.0,2023-04-13,600.0,472.141407
207,Monitor,5.0,120.0,2023-04-13,600.0,472.141407
208,Monitor,5.0,120.0,2023-04-13,600.0,472.141407


## 🏷️ Parte 3 – Renomeando colunas

In [None]:
df.rename(columns={"valor_total": "receita_total"}, inplace=True) #"nome antigo":"nome novo"
display(df)

Unnamed: 0,produto,quantidade,preco_unitario,data_venda,receita_total,custo_total
0,Monitor,5.0,120.0,2023-04-13,600.0,472.141407
1,Teclado,10.0,900.0,2023-12-15,9000.0,6531.120878
2,Mouse,10.0,900.0,2023-09-28,9000.0,5922.478564
3,Notebook,15.0,120.0,2023-04-17,1800.0,1484.808558
4,Impressora,15.0,80.0,2023-03-13,1200.0,835.167366
...,...,...,...,...,...,...
205,Monitor,5.0,120.0,2023-04-13,600.0,472.141407
206,Monitor,5.0,120.0,2023-04-13,600.0,472.141407
207,Monitor,5.0,120.0,2023-04-13,600.0,472.141407
208,Monitor,5.0,120.0,2023-04-13,600.0,472.141407


In [None]:
df.columns = df.columns.str.lower().str.replace(" ", "_").str.normalize("NFKD").str.encode("ascii", errors="ignore").str.decode("utf-8")
display(df.columns)

Index(['produto', 'quantidade', 'preco_unitario', 'data_venda',
       'receita_total', 'custo_total'],
      dtype='object')

## 🔄 Parte 4 – Alterar tipos de dados

In [None]:
df.dtypes

Unnamed: 0,0
produto,object
quantidade,float64
preco_unitario,float64
data_venda,object
receita_total,float64
custo_total,float64


In [None]:
df["quantidade"] = pd.to_numeric(df["quantidade"])
df["data_venda"] = pd.to_datetime(df["data_venda"], errors='coerce')
print(df.dtypes)

produto                   object
quantidade               float64
preco_unitario           float64
data_venda        datetime64[ns]
receita_total            float64
custo_total              float64
dtype: object


In [None]:
display(df)

Unnamed: 0,produto,quantidade,preco_unitario,data_venda,receita_total,custo_total
0,Monitor,5.0,120.0,2023-04-13,600.0,472.141407
1,Teclado,10.0,900.0,2023-12-15,9000.0,6531.120878
2,Mouse,10.0,900.0,2023-09-28,9000.0,5922.478564
3,Notebook,15.0,120.0,2023-04-17,1800.0,1484.808558
4,Impressora,15.0,80.0,2023-03-13,1200.0,835.167366
...,...,...,...,...,...,...
205,Monitor,5.0,120.0,2023-04-13,600.0,472.141407
206,Monitor,5.0,120.0,2023-04-13,600.0,472.141407
207,Monitor,5.0,120.0,2023-04-13,600.0,472.141407
208,Monitor,5.0,120.0,2023-04-13,600.0,472.141407


## 🗂️ Parte 5 – Filtrar e ordenar dados

In [None]:
#filtrando por partes
df_monitor=df[df["produto"]=="Monitor"]
#display(df_monitor)
df_monitor_preco150=df_monitor[df_monitor["preco_unitario"]>=150]
display(df_monitor_preco150)

Unnamed: 0,produto,quantidade,preco_unitario,data_venda,receita_total,custo_total
5,Monitor,5.0,900.0,2023-07-08,4500.0,0.0
11,Monitor,5.0,900.0,2023-03-29,4500.0,3076.768816
89,Monitor,20.0,250.0,2023-07-07,5000.0,0.0
90,Monitor,15.0,3500.0,2023-02-10,52500.0,33348.748392
91,Monitor,5.0,3500.0,2023-06-06,17500.0,11271.693066
116,Monitor,5.0,900.0,2023-03-03,4500.0,3335.446275
132,Monitor,15.0,3500.0,2023-10-10,52500.0,31833.195918
142,Monitor,15.0,250.0,2023-02-21,3750.0,2999.92133
144,Monitor,5.0,900.0,2023-08-10,4500.0,3434.339371
153,Monitor,10.0,900.0,2023-11-23,9000.0,5861.214665


In [None]:
#filtragem direta
df_monitor_preco150=df[(df["produto"]=="Monitor") & (df["preco_unitario"]>=150)]
#display(df_monitor_preco150)
df_monitor_preco150=df[(df["produto"]=="Monitor") & (df["preco_unitario"]>=150)
  & (df["data_venda"]>"2023-07-07")
]
#display(df_monitor_preco150)

df_monitor_preco150=df[(df["produto"]=="Monitor") & (df["preco_unitario"]>=150)
  & (df["data_venda"].dt.strftime("%m-%d")<="07-07")
]
#display(df_monitor_preco150)

df_monitor_preco150=df[(df["produto"]=="Monitor") & (df["preco_unitario"]>=150)
  & (df["data_venda"].dt.strftime("%y")>="2023")
] # a partir de 01 de janeiro de 2023
display(df_monitor_preco150)



#di.index.strftime("%m-%d") == "08-16"

Unnamed: 0,produto,quantidade,preco_unitario,data_venda,receita_total,custo_total
5,Monitor,5.0,900.0,2023-07-08,4500.0,0.0
11,Monitor,5.0,900.0,2023-03-29,4500.0,3076.768816
89,Monitor,20.0,250.0,2023-07-07,5000.0,0.0
90,Monitor,15.0,3500.0,2023-02-10,52500.0,33348.748392
91,Monitor,5.0,3500.0,2023-06-06,17500.0,11271.693066
116,Monitor,5.0,900.0,2023-03-03,4500.0,3335.446275
132,Monitor,15.0,3500.0,2023-10-10,52500.0,31833.195918
142,Monitor,15.0,250.0,2023-02-21,3750.0,2999.92133
144,Monitor,5.0,900.0,2023-08-10,4500.0,3434.339371
153,Monitor,10.0,900.0,2023-11-23,9000.0,5861.214665


In [None]:
df[(df["produto"] == "Notebook") & (df["quantidade"] > 5)]

Unnamed: 0,produto,quantidade,preco_unitario,data_venda,receita_total,custo_total
3,Notebook,15.0,120.0,2023-04-17,1800.0,1484.808558
6,Notebook,10.0,3500.0,2023-01-21,35000.0,28931.630971
10,Notebook,15.0,900.0,2023-11-27,13500.0,10218.514679
22,Notebook,20.0,120.0,2023-10-04,2400.0,1460.119461
37,Notebook,10.0,120.0,2023-12-30,1200.0,0.0
39,Notebook,15.0,,2023-09-01,,0.0
59,Notebook,20.0,120.0,2023-07-25,2400.0,1531.523426
63,Notebook,20.0,3500.0,2023-01-02,70000.0,54887.774123
64,Notebook,10.0,120.0,2023-02-23,1200.0,1000.310104
66,Notebook,20.0,3500.0,2023-09-17,70000.0,49889.689


In [None]:
# corrigir os problemas com receita_total

df["receita_total"].fillna(df["quantidade"] * df["preco_unitario"], inplace=True)

#df["receita_total"] = df["quantidade"] * df["preco_unitario"]

#df.dropna()

#df.isnull()
#df.isnull().sum()



display(df)



The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  df["receita_total"].fillna(df["quantidade"] * df["preco_unitario"], inplace=True)


Unnamed: 0,produto,quantidade,preco_unitario,data_venda,receita_total,custo_total
0,Monitor,5.0,120.0,2023-04-13,600.0,472.141407
1,Teclado,10.0,900.0,2023-12-15,9000.0,6531.120878
2,Mouse,10.0,900.0,2023-09-28,9000.0,5922.478564
3,Notebook,15.0,120.0,2023-04-17,1800.0,1484.808558
4,Impressora,15.0,80.0,2023-03-13,1200.0,835.167366
...,...,...,...,...,...,...
205,Monitor,5.0,120.0,2023-04-13,600.0,472.141407
206,Monitor,5.0,120.0,2023-04-13,600.0,472.141407
207,Monitor,5.0,120.0,2023-04-13,600.0,472.141407
208,Monitor,5.0,120.0,2023-04-13,600.0,472.141407


In [None]:
import numpy as np
import pandas as pd

# Se houver espaços no nome da coluna:
df.columns = df.columns.str.strip()

# Converta vazios e rótulos comuns de "na" para NaN
df = df.replace(r"^\s*$", np.nan, regex=True).replace(
    ["NaN", "nan", "NA", "None"], np.nan
)

# (Opcional) Troque infinitos por NaN
df = df.replace([np.inf, -np.inf], np.nan)

In [None]:
df.dropna()

df.isnull()
df.isnull().sum()

Unnamed: 0,0
produto,0
quantidade,0
preco_unitario,6
data_venda,0
receita_total,6
custo_total,0


In [None]:
df.sort_values(by="valor_total", ascending=False) #ordem crescente = falso

## ♻️ Parte 6 – Remover duplicações

In [None]:
df.drop_duplicates(inplace=True)

## 📝 Parte 7 – Exercícios
### 🔹 Exercício 1
Carregue o arquivo `empregados2.csv` e:
- Corrija os nomes das colunas
- Preencha salários ausentes com 0
- Ordene do maior para o menor salário

### 🔹 Exercício 2
Com o arquivo `estoque2.csv`:
- Adicione coluna `valor_total` = quantidade × preço
- Remova produtos com quantidade igual a 0
- Calcule o valor total do estoque

### 🔹 Exercício 3
Com o arquivo `financeiro.csv`:
- Renomeie `mês` para `mes`
- Crie coluna `resultado` (receita - despesa)
- Calcule o saldo acumulado

In [None]:
import pandas as pd

df = pd.read_csv("/content/empregados2.csv", sep=";", decimal=",", encoding='latin-1')
df.isnull()
df.isnull().sum()

Unnamed: 0,0
funcionário,0
salario mês,23
cargo ocupado,0


In [None]:
# renomear colunas (exercicio 1)
df.columns = df.columns.str.lower().str.replace(" ", "_").str.normalize("NFKD").str.encode("ascii", errors="ignore").str.decode("utf-8")
display(df.columns)



Index(['funcionario', 'salario_mes', 'cargo_ocupado'], dtype='object')

In [None]:
#Preencha salários ausentes com 0

df["salario_mes"].fillna(0, inplace=True)
#display(df)

df.isnull()
df.isnull().sum()

The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  df["salario_mes"].fillna(0, inplace=True)


Unnamed: 0,0
funcionario,0
salario_mes,0
cargo_ocupado,0


In [None]:
# Ordene do maior para o menor salário (decrescente)

df.sort_values(by="salario_mes", ascending=False) #ordem crescente = falso


Unnamed: 0,funcionario,salario_mes,cargo_ocupado
1,Funcionario 2,7500.0,Coordenador
13,Funcionario 14,7500.0,Diretor
37,Funcionario 38,7500.0,Assistente
39,Funcionario 40,7500.0,Assistente
41,Funcionario 42,7500.0,Diretor
...,...,...,...
158,Funcionario 159,0.0,Diretor
189,Funcionario 190,0.0,Gerente
199,Funcionario 200,0.0,Coordenador
195,Funcionario 196,0.0,Assistente


## 🔁 Parte 8 – Revisão da Aula
| Tarefa                     | Comando                                |
|----------------------------|-----------------------------------------|
| Ver valores ausentes       | `df.isnull().sum()`                     |
| Remover ausentes           | `df.dropna()`                           |
| Preencher ausentes         | `df["coluna"].fillna(valor)`            |
| Renomear colunas           | `df.rename(columns={...})`             |
| Padronizar nomes           | `df.columns = df.columns.str.lower()`  |
| Converter tipo de dado     | `pd.to_numeric()` ou `pd.to_datetime()`|
| Filtrar linhas             | `df[condição]`                          |
| Ordenar                    | `df.sort_values(by="coluna")`         |
| Remover duplicatas         | `df.drop_duplicates()`                 |

## 🧩 Tarefa para Casa
Utilize o arquivo `financeiro.csv`:
1. Corrija o nome da coluna `mês` para `mes`.
2. Preencha valores ausentes com 0.
3. Crie a coluna `resultado` = receita - despesa.
4. Crie a coluna `situacao`, onde:
   - “lucro” se `resultado > 0`
   - “prejuízo” se `resultado < 0`
   - “equilíbrio” se `resultado == 0`
5. Exiba o total de meses com lucro, prejuízo e equilíbrio.

### Resolução Exercício 2
Com o arquivo `estoque2.csv`:
- Adicione coluna `valor_total` = quantidade × preço
- Remova produtos com quantidade igual a 0
- Calcule o valor total do estoque

In [None]:
import pandas as pd

df = pd.read_csv("/content/estoque2.csv", sep=";", decimal=",")
df.isnull()
df.isnull().sum()

Unnamed: 0,0
produto,0
quantidade,0
preco,0


In [None]:
df.head()

Unnamed: 0,produto,quantidade,preco
0,Lápis,20,98.22
1,Lápis,50,92.88
2,Borracha,10,34.23
3,Grampeador,100,70.75
4,Lápis,0,65.26


In [None]:
df["Valor Total"]=df["quantidade"]*df["preco"]
display(df)

Unnamed: 0,produto,quantidade,preco,Valor Total
0,Lápis,20,98.22,1964.4
1,Lápis,50,92.88,4644.0
2,Borracha,10,34.23,342.3
3,Grampeador,100,70.75,7075.0
4,Lápis,0,65.26,0.0
...,...,...,...,...
205,Lápis,50,92.88,4644.0
206,Lápis,50,92.88,4644.0
207,Lápis,50,92.88,4644.0
208,Lápis,50,92.88,4644.0


In [None]:
novadf=df[df["quantidade"]!=0] # != diferente

In [None]:
display(novadf)

Unnamed: 0,produto,quantidade,preco,Valor Total
0,Lápis,20,98.22,1964.4
1,Lápis,50,92.88,4644.0
2,Borracha,10,34.23,342.3
3,Grampeador,100,70.75,7075.0
5,Grampeador,10,21.67,216.7
...,...,...,...,...
205,Lápis,50,92.88,4644.0
206,Lápis,50,92.88,4644.0
207,Lápis,50,92.88,4644.0
208,Lápis,50,92.88,4644.0


In [None]:
print("Estoque total {:.2f}" .format(novadf["Valor Total"].sum()))   #soma todas as células da coluna

Estoque total 372900.40


## 🧠 Complemento – Aprofundamento prático com `pandas`

### 🔍 Acessando e manipulando dados com `.loc` e `.iloc`

In [None]:
import pandas as pd

df = pd.read_csv("vendas_ausente.csv", sep=";", decimal=",")
df.isnull()
df.isnull().sum()

Unnamed: 0,0
produto,9
quantidade,19
preco_unitario,6
data_venda,0
valor_total,23
custo_total,32


In [None]:
# Selecionar a primeira linha inteira
print(df.loc[0])

produto              Monitor
quantidade               5.0
preco_unitario         120.0
data_venda        2023-04-13
valor_total            600.0
custo_total       472.141407
Name: 0, dtype: object


In [None]:
display(df)

Unnamed: 0,produto,quantidade,preco_unitario,data_venda,valor_total,custo_total
0,Monitor,5.0,120.0,2023-04-13,600.0,472.141407
1,Teclado,10.0,900.0,2023-12-15,9000.0,6531.120878
2,Mouse,10.0,900.0,2023-09-28,9000.0,5922.478564
3,Notebook,15.0,120.0,2023-04-17,1800.0,1484.808558
4,Impressora,15.0,80.0,2023-03-13,1200.0,835.167366
...,...,...,...,...,...,...
205,Monitor,5.0,120.0,2023-04-13,600.0,472.141407
206,Monitor,5.0,120.0,2023-04-13,600.0,472.141407
207,Monitor,5.0,120.0,2023-04-13,600.0,472.141407
208,Monitor,5.0,120.0,2023-04-13,600.0,472.141407


In [None]:
# Selecionar todas as vendas de Notebook
print(df.loc[df["produto"] == "Notebook"])

      produto  quantidade  preco_unitario  data_venda  valor_total  \
3    Notebook        15.0           120.0  2023-04-17       1800.0   
6    Notebook        10.0          3500.0  2023-01-21      35000.0   
10   Notebook        15.0           900.0  2023-11-27      13500.0   
22   Notebook        20.0           120.0  2023-10-04       2400.0   
26   Notebook         5.0           250.0  2023-09-10       1250.0   
29   Notebook         5.0           750.0  2023-02-18       3750.0   
37   Notebook        10.0           120.0  2023-12-30       1200.0   
39   Notebook        15.0             NaN  2023-09-01          NaN   
48   Notebook         NaN            80.0  2023-03-30          NaN   
59   Notebook        20.0           120.0  2023-07-25       2400.0   
63   Notebook        20.0          3500.0  2023-01-02      70000.0   
64   Notebook        10.0           120.0  2023-02-23       1200.0   
66   Notebook        20.0          3500.0  2023-09-17      70000.0   
80   Notebook       

In [None]:
# Alterar o produto da primeira linha para 'Notebook'
df.loc[0, "produto"] = "Notebook"
# Alterar o preço unitario da quinta linha para 100
df.loc[4, "preco_unitario"] = 100
df.head()

Unnamed: 0,produto,quantidade,preco_unitario,data_venda,valor_total,custo_total
0,Notebook,5.0,120.0,2023-04-13,600.0,472.141407
1,Teclado,10.0,900.0,2023-12-15,9000.0,6531.120878
2,Mouse,10.0,900.0,2023-09-28,9000.0,5922.478564
3,Notebook,15.0,120.0,2023-04-17,1800.0,1484.808558
4,Impressora,15.0,100.0,2023-03-13,1200.0,835.167366


In [None]:
# Selecionar a primeira linha (por posição)
print(df.iloc[0])

produto             Notebook
quantidade               5.0
preco_unitario         120.0
data_venda        2023-04-13
valor_total            600.0
custo_total       472.141407
Name: 0, dtype: object


In [None]:
# Selecionar valor da linha 0 e coluna 3 (coluna começa com ZERO)
print(df.iloc[0, 2])


120.0


In [None]:
# Selecionar as 7 primeiras linhas e 3 primeiras colunas
print(df.iloc[:7, :3])

      produto  quantidade  preco_unitario
0    Notebook         5.0           120.0
1     Teclado        10.0           900.0
2       Mouse        10.0           900.0
3    Notebook        15.0           120.0
4  Impressora        15.0           100.0
5     Monitor         5.0           900.0
6    Notebook        10.0          3500.0


### 🛠️ Usando `.apply()` para aplicar funções em colunas

In [None]:
# Criar nova coluna com classificação do valor_total

def classificar(valor):
    if valor >= 20000:
        return "alta"
    elif valor >= 10000:
        return "média"
    else:
        return "baixa"

In [None]:
# Antes de aplicar, preencher valores ausentes com 0 para evitar erro
valor_total_sem_nan = df["valor_total"].fillna(0)
valor_total_sem_nan.head()

Unnamed: 0,valor_total
0,600.0
1,9000.0
2,9000.0
3,1800.0
4,1200.0


In [None]:
df["categoria"] = valor_total_sem_nan.apply(classificar)
df[["valor_total", "categoria"]].head()

Unnamed: 0,valor_total,categoria
0,600.0,baixa
1,9000.0,baixa
2,9000.0,baixa
3,1800.0,baixa
4,1200.0,baixa


### 📊 Usando `.value_counts()` para contagens

In [None]:
display(df)

Unnamed: 0,produto,quantidade,preco_unitario,data_venda,valor_total,custo_total,categoria
0,Notebook,5.0,120.0,2023-04-13,600.0,472.141407,baixa
1,Teclado,10.0,900.0,2023-12-15,9000.0,6531.120878,baixa
2,Mouse,10.0,900.0,2023-09-28,9000.0,5922.478564,baixa
3,Notebook,15.0,120.0,2023-04-17,1800.0,1484.808558,baixa
4,Impressora,15.0,100.0,2023-03-13,1200.0,835.167366,baixa
...,...,...,...,...,...,...,...
205,Monitor,5.0,120.0,2023-04-13,600.0,472.141407,baixa
206,Monitor,5.0,120.0,2023-04-13,600.0,472.141407,baixa
207,Monitor,5.0,120.0,2023-04-13,600.0,472.141407,baixa
208,Monitor,5.0,120.0,2023-04-13,600.0,472.141407,baixa


In [None]:
# Número de aparições de cada produto
print(df["produto"].value_counts())


produto
Monitor       40
Impressora    39
Notebook      33
Mouse         30
Teclado       23
Webcam        21
Headset       15
Name: count, dtype: int64


In [None]:
# Vezes em que apareceu numero igual na coluna quantidade
print(df["quantidade"].value_counts())

quantidade
5.0     54
20.0    53
15.0    47
10.0    37
Name: count, dtype: int64


In [None]:
# Se tiver a coluna 'situacao', mostrar total de cada tipo
if "situacao" in df.columns:
    print(df["situacao"].value_counts())

In [None]:
if "valor_total" in df.columns:
    print(df["valor_total"].value_counts())


valor_total
600.0      23
1200.0     19
1600.0     14
2400.0     12
800.0      11
52500.0    11
1800.0     10
70000.0     9
4500.0      8
400.0       8
3750.0      7
9000.0      7
18000.0     7
17500.0     6
15000.0     6
7500.0      5
11250.0     5
1250.0      5
5000.0      4
13500.0     4
35000.0     3
2500.0      3
Name: count, dtype: int64
