# Introdução aos Pandas

## Módulo 1: Introdução à série Pandas

### Série Pandas Parte 2

- Usando operadores de comparação para produzir séries booleanas
- Usando indexação booleana para filtrar dados
- Usando operações OR e AND para criar filtros compostos
- Atribuindo subconjuntos às suas próprias variáveis
- Operando em subconjuntos no local usando `.loc`

In [None]:
import pandas as pd

In [None]:
# O Python básico usa índices numéricos para retornar um único elemento
ser = range(-2, 3)
ser[0]

In [None]:
# Vamos fazer uma série de pandas para entrar na indexação de pandas
ser = pd.Series(ser)
ser

In [None]:
# O índice correspondente para o primeiro elemento é True e os demais são False
# Usar o índice correspondente de uma coleção booleana para filtrar é chamado de "mascaramento booleano"
primeiro = [True, False, False, False, False]
ser[primeiro]

In [None]:
# Se todos os valores booleanos forem True, retornamos a série original
tds_true = [True, True, True, True, True]
ser[tds_true]

In [None]:
tds_false = [False, False, False, False, False]
ser[tds_false]

In [None]:
# A máscara booleana está filtrando nossos resultados aqui
primeiro_e_terceiro = [True, False, True, False, False]
ser[primeiro_e_terceiro]

In [None]:
# O mascaramento booleano deixa a série original intacta
ser

In [None]:
# Operadores de comparação retornam uma série booleana
# Observe que isso retorna uma série booleana
ser == 1

In [None]:
mask = ser == 1
ser[mask]

In [None]:
# Podemos colocar a série booleana diretamente dentro dos colchetes
ser[ser == 1]

In [None]:
# Usando uma série booleana entre colchetes após os resultados dos filtros de série
negativo = ser < 0
negativo

In [None]:
# Os valores True na série booleana habilitam os elementos correspondentes. Os valores Falsos ocultam os elementos correspondentes.
ser[negativo]

In [None]:
# Subconjuntos são cópias dos dados
negativos = ser[negativo]
negativos

In [None]:
# Reatribuir o resultado de uma máscara booleana mantém a série original intacta
ser

In [None]:
# Um operador de comparação usado com o operador módulo para retornar uma série booleana
impar = ser % 2 == 1
ser[impar]

In [None]:
# Vamos trabalhar com alguns dados novos
numeros = pd.Series(range(1, 13))
numeros

In [None]:
# Podemos usar os operadores & e | em nossa série booleana para produzir um comportamento mais complexo.
# Parênteses são úteis para a ordem das operações.
numeros[(numeros == 2) | (numeros == 5)]

In [None]:
# Se todas as expressões forem avaliadas como falsas, podemos obter uma série vazia
numeros[(numeros == 2) & (numeros == 5)]

In [None]:
# Para evitar parênteses, podemos atribuir cada série booleana separadamente.
# O operador & é o operador AND para séries booleanas
par = numeros % 2 == 0
divisivel_por_3 = numeros % 3 == 0
divisivel_por_3_ou_2 = par & divisivel_por_3
numeros[divisivel_por_3_ou_2]

In [None]:
# Se cada série/expressão booleana não for atribuída à sua própria variável, precisamos de parênteses para a ordem das operações.
# Observe como, com um operador AND, ambos os booleanos devem ser verdadeiros.
numeros[(numeros % 2 == 0) & (numeros % 5 == 0)]

In [None]:
# Usamos o operador | para operações OR
# Isso retorna todos os números pares ou os números divisíveis por 5
numeros[(numeros % 2 == 0) | (numeros % 5 == 0)]

In [None]:
# O mascaramento booleano é muito poderoso, mas e quanto à modificação de valores em uma série?
# O método .loc usa a mesma sintaxe booleana de série
par = numeros % 2 == 0

# Para simplificar, vamos atribuir a cada número par 200
numeros.loc[par] = 200

In [None]:
numeros

In [None]:
# E se precisarmos de mais reatribuição dinâmica?
numeros = pd.Series(range(1, 13))

# A sintaxe abreviada seria numeros.loc[par] *= 2
numeros.loc[par] = numeros.loc[par] * 2
numeros

## Leitura Adicional
- https://pandas.pydata.org/docs/user_guide/indexing.html
- https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.loc.html

## Exercício
- Crie uma série com os seguintes valores `[-4, -3, -2, -1, 0, 1, 2, 3, 4]` e armazene-a em uma variável chamada `ser`
- Escreva o código para filtrar apenas o número 2
- Escreva o código para filtrar os números 2 ou 4.
- Crie uma variável chamada `positivo` que será a série booleana, independentemente de o valor `ser` correspondente ser positivo ou não. Agora crie uma nova variável chamada `positivos` e use-a para armazenar apenas os números positivos.
- Siga os passos acima para criar uma série booleana chamada `par` e atribua uma nova variável chamada `pares` que contenha apenas os números pares.
- Use o que você aprendeu para produzir uma nova série booleana chamada `par_e_positivo` e atribuir os valores booleanos. Use sua nova série booleana para criar uma nova variável chamada `pares_positivos` que contenha apenas os números pares e positivos.
- Siga o padrão acima para produzir uma nova série booleana chamada `par_ou_positivo` e atribua os valores booleanos apropriados usando | para operações OU. Use sua nova série booleana para criar uma nova variável chamada `pares_ou_positivos` que contém apenas os números pares e positivos.
- Use o método `.loc` para reatribuir todos os números pares e positivos ao número zero.
- Use o método `.loc` e a sintaxe de reatribuição para multiplicar todos os números negativos por 20, no local.

In [None]:
# Faça uma série de [-4, -3, -2, -1, 0, 1, 2, 3, 4]


In [None]:
# Escreva o código para filtrar apenas o número 2


In [None]:
# Escreva o código para filtrar o número 2 ou 4.


In [None]:
# Crie uma variável chamada `positivo` que será a série booleana, independentemente de o valor `ser` correspondente ser positivo ou não. Agora crie uma nova variável chamada `positivos` e use-a para armazenar apenas os números positivos.

In [None]:
# Siga os passos acima para criar uma série booleana chamada `par` e atribua uma nova variável chamada `pares` que contenha apenas os números pares.


In [None]:
# Use o que você aprendeu para produzir uma nova série booleana chamada `par_e_positivo` e atribuir os valores booleanos. Use sua nova série booleana para criar uma nova variável chamada `pares_positivos` que contenha apenas os números pares e positivos.
par_e_positivo = par & positivo
pares_positivos = ser[par_e_positivo]
pares_positivos

In [None]:
# Siga o padrão acima para produzir uma nova série booleana chamada `par_ou_positivo` e atribua os valores booleanos apropriados usando | para operações OU. Use sua nova série booleana para criar uma nova variável chamada `pares_ou_positivos` que contém apenas os números pares e positivos.


In [None]:
# Use o método `.loc` para reatribuir todos os números pares e positivos como o número zero.


In [None]:
# Use o método `.loc` e a sintaxe de reatribuição para multiplicar cada número negativo por 20, no local.