### Operadores Lógicos Para Manipulação de Dados com Pandas

Os operadores lógicos são excelentes para filtrar dataframes e retornar exatamente os dados que precisamos para nosso trabalho.

Primeiro usaremos o operador lógico AND para checar duas condições. Serão retornados os registros quando as duas condições forem verdadeiras.

In [1]:
# Importando a biblioteca
import pandas as pd

In [2]:
# criando o dataframe e corrigindo os valores vazios
df = pd.read_csv("dados/dataset.csv")

df['Quantidade'] = df['Quantidade'].fillna(value=3.0)

In [4]:
# Verificando os segmentos
df.Segmento.value_counts()

Segmento
Consumer       5191
Corporate      3020
Home Office    1783
Name: count, dtype: int64

In [5]:
# Verificando as regiões
df.Regiao.value_counts()

Regiao
West       3203
East       2848
Central    2323
South      1620
Name: count, dtype: int64

In [7]:
# Filtando as vendas que ocorreram para o segmento de Home Office e na Região South
df[(df.Segmento == 'Home Office') & (df.Regiao == 'South')]

Unnamed: 0,ID_Pedido,Data_Pedido,ID_Cliente,Segmento,Pais,Regiao,ID_Produto,Categoria,Nome_Produto,Valor_Venda,Quantidade
182,CA-2014-158274,2014-11-19,RM-19675,Home Office,United States,South,TEC-PH-10003273,Technology,AT&T TR1909W,503.9600,4.0
183,CA-2014-158274,2014-11-19,RM-19675,Home Office,United States,South,TEC-PH-10004896,Technology,Nokia Lumia 521 (T-Mobile),149.9500,5.0
184,CA-2014-158274,2014-11-19,RM-19675,Home Office,United States,South,TEC-AC-10002345,Technology,HP Standard 104 key PS/2 Keyboard,29.0000,2.0
231,US-2017-100930,2017-04-07,CS-12400,Home Office,United States,South,FUR-TA-10001705,Furniture,Bush Advantage Collection Round Conference Table,233.8600,2.0
232,US-2017-100930,2017-04-07,CS-12400,Home Office,United States,South,FUR-TA-10003473,Furniture,Bretford Rectangular Conference Table Tops,620.6145,3.0
...,...,...,...,...,...,...,...,...,...,...,...
9805,CA-2016-136322,2016-10-21,AP-10720,Home Office,United States,South,FUR-FU-10002878,Furniture,"Seth Thomas 14"" Day/Date Wall Clock",45.5680,2.0
9806,CA-2016-136322,2016-10-21,AP-10720,Home Office,United States,South,OFF-BI-10004817,Office Supplies,GBC Personal VeloBind Strips,28.7520,8.0
9960,CA-2017-141446,2017-09-16,CL-12700,Home Office,United States,South,TEC-AC-10002305,Technology,KeyTronic E03601U1 - Keyboard - Beige,18.0000,1.0
9970,CA-2015-103772,2015-06-28,MP-17470,Home Office,United States,South,OFF-BI-10002867,Office Supplies,GBC Recycled Regency Composition Covers,119.5600,2.0


Mas pode ser necessário checar duas condições e retornar os registros se pelo menos uma for verdadeira. Nesse caso usamos o operador OR, conforme abaixo.

### A diferença entre .head(), .tail() e .sample() no pandas 👇

O método .head() retorna, por padrão, as 5 primeiras linhas do DataFrame.

O método .tail() retorna, por padrão, as 5 últimas linhas do DataFrame.

O método .sample() retorna uma amostra aleatória de linhas do DataFrame.

In [None]:
# Filtrando as Vendas que ocorreram para o segmento de Home Office ou região South
df[(df.Segmento == 'Home Office') | (df.Regiao == 'South')].tail()

O operador de negação é o contrário do primeiro exemplo.

In [None]:
# Filtrando as Vendas que não ocorreram para o segmento de Home Office ou região South
df[(df.Segmento != 'Home Office') & (df.Regiao != 'South')].sample(5)