# Pesquisa, Classificação e Filtragem

Nesta seção, abordaremos como pesquisar, classificar e filtrar matrizes. Você pode descobrir que essas tarefas são mais comuns no Pandas, mas haverá casos de uso em que você desejará filtrar registros usando matrizes.

## Pesquisa e Filtragem

Quando você começa a executar operadores condicionais em uma matriz (como `>`, `<`, `>=`, `<=`, `==`), você obterá uma matriz de valores booleanos (`True` e `False`).

In [None]:
import numpy as np

x = np.array([21, 500, 232, 72, 682])

x < 100

Ao pesquisar em um array, você normalmente retornará os índices dos elementos que atendem aos seus critérios. Por exemplo, podemos usar a função `where()` para encontrar elementos em um array `x` menores que 100. Isso retornará um array de índices para os elementos que atendem a essa condição.

In [None]:
import numpy as np

x = np.array([21, 500, 232, 72, 682])

i = np.where(x < 100)

print(i)

Se eu quisesse recuperar esses valores e não seus índices, bastaria passar o array de índices `i` de volta para `x` como `x[i]`.

In [None]:
import numpy as np

x = np.array([21, 500, 232, 72, 682])

i = np.where(x < 100)

print(x[i])

Também podemos usar o operador equals `==` para encontrar índices para um valor exato.

In [None]:
import numpy as np

x = np.array([21, 500, 232, 72, 682])

np.where(x == 500)

Também podemos usar `&` para combinar múltiplas condições, operando efetivamente como um "E". Apenas certifique-se de colocar cada condição entre parênteses. Abaixo, procuramos exclusivamente todos os índices onde x está entre 20 e 100.

In [None]:
import numpy as np

x = np.array([21, 500, 232, 72, 682])

i = np.where((20 < x) & (x < 100))

print(i)

In [None]:
import numpy as np

x = np.array([21, 500, 232, 72, 682])

i = np.where((20 < x) & (x < 100))

print(i)
print(x[i])

Use a barra vertical `|` para executar uma operação "OU". Abaixo, encontramos valores menores que 20 ou maiores que 100.

In [None]:
import numpy as np

x = np.array([21, 500, 232, 72, 682])

i = np.where((x < 20) | (100 < x))

print(i)
print(x[i])

Também podemos fornecer os argumentos `x` e `y` para a função `where()`. Isso fará o seguinte: se a condição for `True` para um elemento, retornará o elemento de `x`. Caso contrário, retornará o elemento de `y`.

Abaixo, mantemos todos os elementos de `x` maiores que `100`. Caso contrário, eles serão convertidos para `0`.

In [None]:
import numpy as np

x = np.array([21, 500, 232, 72, 682])
y = np.zeros(5)

np.where(x > 100, x, y)

Claro, essas ideias se estendem a matrizes multidimensionais. Abaixo, encontramos os índices para elementos maiores que 2 em uma matriz 2x2. Podemos então recuperar esses elementos para esses índices.

In [None]:
X = np.array([[1,2],[3,4]])

i = np.where(X > 2)

In [None]:
X[i]

## Classificação

Você pode classificar os elementos em um array usando a função `sort()`. Por padrão, ela classifica os elementos em ordem crescente.

In [None]:
x = np.array([6, 2, 8, -1, 0, 12])
np.sort(x) 

Que tal ordenar os elementos em ordem decrescente? Isso requer um pouco de habilidade. Primeiro, transformaremos todos os elementos `x` em negativos, faremos a ordenação e, em seguida, aplicaremos outra negativa para desfazer a primeira negativa.

In [None]:
-np.sort(-x)

Também podemos aplicar a ordenação em matrizes multidimensionais. Por padrão, ela ordena os elementos em cada linha para uma matriz 2x3.

In [None]:
x = np.array([[5, 1, 81], [45, 2, -1]])
x

In [None]:
np.sort(x)

Também podemos classificar cada coluna em vez de linha definindo `axis=0`.

In [None]:
np.sort(x, axis=0)

## Pesquisa ordenada

Se você tiver um array já classificado, você pode fazer uma busca especializada usando `searchsorted()`, que faz uma busca binária do array.

In [None]:
x = np.array([-1,  0,  2,  6,  6,  8, 12])

Digamos que eu queira encontrar a primeira instância de `6`. `searchsorted()` procurará da esquerda para a direita e parará no momento em que encontrar um `6`, depois retornará o índice.

In [None]:
np.searchsorted(x, 6)

Observe atentamente que a função `searchsorted()` se destina ao uso em arrays ordenados, pois se moverá da esquerda para a direita e encontrará a primeira instância daquele valor.

Também podemos iniciar a busca pela direita e obter o índice mais à direita. Observe que este não é um índice de `4`, pois esta função é frequentemente usada para inserção, o que mostraremos em breve.

In [None]:
np.searchsorted(x, 6, side='right')

Frequentemente usamos `sortedsearch()` para encontrar o índice e inserir um valor com base em uma classificação existente. Então, se eu quisesse inserir `4` antes do `6`, eu poderia fazer isso.

In [None]:
np.insert(x, 3, 4)

Se quiséssemos inserir um valor à direita, usaríamos o índice `5` para inserir um `7`.

In [None]:
np.insert(x,5,7)

## Exercício

Para os números inteiros de 0 a 99, pegue os elementos que estão inclusivamente entre 20 e 30, ou maiores que 70.

In [None]:
import numpy as np 

x = np.arange(0,100)

## coloque seu código aqui 



### RESPOSTA A BAIXO

|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
v 

In [None]:
import numpy as np 

x = np.arange(0,100)

## coloque seu código aqui 

i = np.where(((x >= 20) & (x <= 30)) | (x > 70))
x[i]