# NumPy

## O que é o NumPy?

O NumPy é uma poderosa biblioteca Python usada principalmente para realizar cálculos em Arrays Multidimensionais. O NumPy fornece um grande conjunto de funções e operações de biblioteca que ajudam os programadores a executar facilmente cálculos numéricos. Esses tipos de cálculos numéricos são amplamente utilizados em tarefas como:

* `Tarefas matemáticas`: NumPy é bastante útil para executar várias tarefas matemáticas como integração numérica, diferenciação, interpolação, extrapolação e muitas outras. O NumPy possui também funções incorporadas para álgebra linear e geração de números aleatórios. É uma biblioteca que pode ser usada em conjuto do SciPy e Matplotlib, substituindo o MATLAB quando se trata de tarefas matemáticas.

* `Processamento de Imagem e Computação Gráfica`: Imagens no computador são representadas como Arrays Multidimensionais de números. NumPy torna-se a escolha mais natural para o mesmo. O NumPy, na verdade, fornece algumas excelentes funções de biblioteca para rápida manipulação de imagens. Alguns exemplos são o espelhamento de uma imagem, a rotação de uma imagem por um determinado ângulo etc.

* `Modelos de Machine Learning`: Ao escrever algoritmos de Machine Learning, supõe-se que se realize vários cálculos numéricos em Array. Por exemplo, multiplicação de Arrays, transposição, adição, etc. O NumPy fornece uma excelente biblioteca para cálculos fáceis (em termos de escrita de código) e rápidos (em termos de velocidade). Os Arrays NumPy são usados para armazenar os dados de treinamento, bem como os parâmetros dos modelos de Machine Learning.


## Instalando

Existem diversas formas de instalar o numpy. A mais simples é instalar o pacote Anaconda (https://www.anaconda.com/distribution/) que já vem com o Python e diversas bibliotecas científicas e ciência de dados instaladas.

Outra forma, caso você já tenha o python instalado mas não o numpy, é o utilizar o gerenciador e pacotes pip, através do comando no seu **terminal**:

`$ pip install numpy`

ou dentro do jupyter

`!pip install numpy`

## Explorando a API do NumPy
### Importando numpy com o alias np

`np` é uma abreviação amplamente utilizada na comunidade python para o numpy.

In [2]:
import numpy as np

### 1D arrays

Array unidimensional, também chamado de vetor ou até mesmo matriz de 1 dimensão:


In [4]:
a = np.array([1, 2, 3])

Checando o tipo da variável a:

In [5]:
type(a)

numpy.ndarray

o nd significa n-dimensional


### Checando o tipo de dados do array

Diversos tipos de dados são possíveis em um array numpy, os mais comuns são os numéricos:

    int32
    int64
    float32
    float64


In [6]:
a.dtype

dtype('int64')


A consistência do dado é forte...

Se trocarmos um elemento na posição 0 para o valor 10, dará certo:

In [8]:
a[0] = 10
a

array([10,  2,  3])

Se trocarmos para ponto flutuante, o numpy irá truncar a parte decimal, dado que o array que criamos é inteiro.

In [9]:
a[0] = 1.2
a

array([1, 2, 3])

### 2D arrays

Matrizes podem ser consideradas um array de 2 dimensões.
_________________________________________________________________________________

Observação:

O NumPy possui também uma estrutura, matrix, mas não é recomendado utilizá-la pela própria documentação oficial e poderá ser removida no futuro.
_________________________________________________________________________________

Para criar uma matriz, basta aninhar múltiplas listas dentro de uma lista, como o exemplo a seguir:


In [10]:

b = np.array([[9.0, 8.0, 7.0],
                  [6.0, 5.0, 4.0]])
b

array([[9., 8., 7.],
       [6., 5., 4.]])

### Numpy x Lists

    Size - Numpy necessita de menos espaço
    Performance - escrito para ter alta performance
    Funcionalidade - SciPy e NumPy possuem operações de algebra linear built in.

<a href="https://webcourses.ucf.edu/courses/1249560/pages/python-lists-vs-numpy-arrays-what-is-the-difference" target="_blank">Referência</a> 

In [3]:
"""
Código comparando performance entre numpy e listas em uma soma de arrays
"""

import time
import numpy as np

size_of_vec = 1000

def pure_python_version():
    t1 = time.time()
    X = range(size_of_vec)
    Y = range(size_of_vec)
    Z = [X[i] + Y[i] for i in range(len(X)) ]
    return time.time() - t1

def numpy_version():
    t1 = time.time()
    X = np.arange(size_of_vec)
    Y = np.arange(size_of_vec)
    Z = X + Y
    return time.time() - t1


t1 = pure_python_version()
t2 = numpy_version()
print(t1, t2)
print("Numpy is in this example " + str(t1/t2) + " faster!")

0.0004303455352783203 5.269050598144531e-05
Numpy is in this example 8.167420814479637 faster!


### Propriedades
#### Dimensão e formato

Dois conceitos importantes já mencionados acima é o de dimensão e formato.

Para descobrir essas informações, basta acessar os atributos ndim e shape

In [None]:
print(a.ndim)
print(a.shape)

In [12]:
print(b.ndim)
print(b.shape)

2
(2, 3)



#### Tipo de dado e tamanho

Na sessão Checando o tipo de dados do array já foi dito dos tipos de dados, mas agora falaremos da diferença de tamanhos que isso ocupa na memória.

Então, temos as variáveis a e b criadas anteriormente com os seguintes tipos:


In [13]:
a.dtype

dtype('int64')

In [14]:
b.dtype

dtype('float64')


Por padrão, se o python instalado é 64 bits, ele irá criar tipos int ou float de 64 bits. Caso seu python fosse 32 bits, seria int32 e float32.

Vamos criar uma outra array, a16, com o tipo inteiro de 16 bits.


In [15]:
a16 = np.array([1, 2, 3], dtype=np.int16)
a16


array([1, 2, 3], dtype=int16)

Note que por ser um tipo diferente do padrão, ele ressalta ao imprimir.

Para descobrir quanto cada elemento individualmente ocupa na memória, podemos acessar o atributo itemsize:


In [16]:
a.itemsize

8


Ele retorna 8 e não 64! Isso é porque ele já converteu os bits para bytes. Bytes é o conjunto de 8 bits.

Logo:

$ 64/8=8 $

Já nosso array int16, temos:


In [17]:
a16.itemsize

2

Uma vez que:

$ 16/8 = 2 $

In [18]:
# quantidade de elementos total
a.size

3

Quantidade de elementos vezes o tamanho de cada elemento nos dará o tamanho total de bytes que o array inteiro ocupa:


In [19]:
a.size * a.itemsize

24


Mas ao invés de calcular isso, podemos simplesmente acessar o atributo `nbytes`, que já é o tamanho total de bytes ocupado pelo array:


In [20]:
a.nbytes

24

**Observação**

Geralmente não é necessário em reduzir o número de bits a não ser que você tenha certeza que um tamanho reduzido vai atender sua necessidade e você quer ser extremamente eficiente.



### Acessando e modificando elementos (Indexing & Slicing)

Dada a matriz a abaixo:

In [21]:
a = np.array([[1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14]])
print(a)


[[ 1  2  3  4  5  6  7]
 [ 8  9 10 11 12 13 14]]



Podemos acessar um elemento específico de forma similar a lista, utilzando a sintaxe de colchetes, com a diferença de que podemos separar cada posição com vírgulas.

Para uma array 2D, temos então a sintaxe:

Exemplo:


In [22]:
a[1, 5]


13

Podemos (menos comum) fazer dessa forma também:

In [23]:
a[1][5]


13

Usar números negativos funciona de trás pra frente a indexação:


In [24]:
a[1, -2]

13

Para pegar uma linha específica, podemos utilizar a sintaxe  `:` que pode ser lida como "todos" daquela dimensão (colunas).

Podemos ler então como: linha zero, todas as colunas


In [25]:
a[0:1]

array([[1, 2, 3, 4, 5, 6, 7]])

Também podemos fazer assim simplesmente:


In [26]:
a[0]

array([1, 2, 3, 4, 5, 6, 7])

Porém, para coluna específica não tem jeito, precisamos usar `:`.

Leia-se: todas as linhas, coluna 2


In [27]:
a[:, 2]

array([ 3, 10])

O operador `:` também conhecido como slicing, aceita o parâmetro:

    start
    end
    step

No formato

[ startindex : endindex : stepsize ]

O stepsize basicamente é quantos elementos deve ser pular. Podemos pegar do elemento 1 ao 6 pulando de 2 em 2 por exemplo da linha 0.


In [29]:
a[0, 1:6:2]

array([2, 4, 6])

Funciona com negativo também:


In [30]:
a[0, 1:-1:2]

array([2, 4, 6])

Para mudar um elemento específico, basta usar o operador `=`

In [33]:
a[1,5] = 20
a

array([[ 1,  2,  3,  4,  5,  6,  7],
       [ 8,  9, 10, 11, 12, 20, 14]])

Mudando uma coluna inteira para ser 5:


In [34]:
a[:, 2] = 5
print(a)

[[ 1  2  5  4  5  6  7]
 [ 8  9  5 11 12 20 14]]


Isso mostra uma característica fundamental do array do NumPy:

Ao alterar o pedaço da matriz recortada, você altera a matriz original

Slicing em listas geram cópias!

In [44]:
a = [1, 2, 3]
b = a[1:]
b


[2, 3]

In [36]:
b = [10, 11]

In [37]:
a

[1, 2, 3]

In [38]:
b

[10, 11]

Acessando o formato de um slicing:


In [45]:
a[:, 2].shape

TypeError: list indices must be integers or slices, not tuple

In [46]:
a[:, 2] = [5, 10]
print(a)

TypeError: list indices must be integers or slices, not tuple

### Exemplo 3D


In [47]:
b = np.array([[[1, 2], [3,4]], [[5, 6], [7, 8]]])
b


array([[[1, 2],
        [3, 4]],

       [[5, 6],
        [7, 8]]])

In [48]:
b.shape

(2, 2, 2)

Retirando o elemento 4:


In [50]:
b[0, 1, 1]

4

Pegando todos todos os elementos da posição 1 da dimensão 2:

In [51]:
b[:, 1, :]

array([[3, 4],
       [7, 8]])

Substituindo:


In [53]:
b[:, 1, :] = [[9, 9], [8, 8]]
b

array([[[1, 2],
        [9, 9]],

       [[5, 6],
        [8, 8]]])

#### Inicializando arrays usando métodos internos

O NumPy já possui diversos métodos built-in para gerar arrays dos mais diversos tipos
array apenas com zeros

In [55]:
np.zeros(5)

array([0., 0., 0., 0., 0.])

É possível gerar um array de qualquer formato, basta apenasr passar o formato como uma sequência (lista, tupla geralmente) como argumento


In [None]:
np.zeros((2,3))

In [None]:
np.zeros((2, 2, 3))

array apenas com uns

In [56]:
np.ones((4, 2, 2), dtype='int32')

array([[[1, 1],
        [1, 1]],

       [[1, 1],
        [1, 1]],

       [[1, 1],
        [1, 1]],

       [[1, 1],
        [1, 1]]], dtype=int32)

Um coisa muito comum é usar o np.ones para criar uma matriz de qualquer número fazendo a operação, exemplo:

In [None]:
np.ones((2, 2)) * 10

Mas o numpy já tem uma opção mais elegante, o full:


In [57]:
np.full((2, 2), 99)

array([[99, 99],
       [99, 99]])

Qualquer outro número copiando o formato de uma matriz existente


In [58]:
np.full_like(a, 4)

array([4, 4, 4])

### Números decimais aleatórios

O numpy tem um sub-módulo chamado random, que pode ser acessando via `np.random`. Embora o Python possua uma biblioteca padrão também chamada `random`, a biblioteca do *NumPy tem mais funcionalidades e gera diretamente vetores aleatórios*.

Criação de um vetor segundo uma distribuição uniforme no intervalo [0,1):


In [60]:
np.random.rand(4, 2)

array([[0.59567488, 0.60240456],
       [0.3562422 , 0.02057518],
       [0.16834956, 0.85796243],
       [0.37170169, 0.73970078]])

Criação de um vetor em que cada elemento segue uma distribuição normal com $/mu=10.0$ e $/sigma=1.0$

In [44]:
v = np.random.normal(10, 1, (4,4))
print(v)


[[12.57688166  8.50478476 10.50039879 10.08521074]
 [ 7.88346829 11.83317057  9.70774991  9.23799112]
 [ 9.20604525 12.78441452  9.87711403 11.03305377]
 [10.45788602  9.38947739  9.61530109  8.72941554]]


### Números inteiros:


In [62]:
np.random.randint(7, size=(3, 3))


array([[5, 4, 1],
       [1, 1, 6],
       [3, 2, 1]])

Os argumentos principais são low, high e size, exemplo: criando uma matriz de 0 a 99 de 100 elementos:


In [63]:
np.random.randint(0, high=100, size=100)


array([57, 80, 86, 82,  3, 85, 91, 47, 81, 92, 54, 25, 64, 12,  7, 75, 58,
       42, 15, 17, 63, 66, 69, 18, 95, 35, 55, 45, 16,  7, 69, 14, 55, 35,
       30, 80, 90, 25, 85, 40, 90, 51, 11, 47, 14, 48, 49, 23, 58, 88, 31,
       96, 96, 85, 43, 33, 78,  5, 73, 37, 21, 90,  2, 38, 26, 11, 22, 52,
       96, 60, 11, 76, 31, 43, 74, 62, 77, 31, 40, 17, 32, 60, 85, 29, 65,
       19,  8, 92, 81, 91, 84, 19, 44, 72, 32,  1, 21, 93, 19, 31])

Para incluir o 100, basta trocar o high por 101

Note que toda vez que rodarmos o código, os tensores terão valores diferentes. Podemos evitar esse comportamento, de forma que toda vez que o código é executado o tensor aleatório tenha o mesmo valor por meio da função seed, cujo argumento é a semente para o gerador de números aleatórios do Python:

In [45]:
np.random.seed(1000)
v = np.random.rand(4)
print(v)

np.random.seed(1000)
v = np.random.rand(4)
print(v)


[0.65358959 0.11500694 0.95028286 0.4821914 ]
[0.65358959 0.11500694 0.95028286 0.4821914 ]


#### Matriz identidade

Diagonal inteira com 1. É sempre uma matriz quadrada.

In [64]:
np.identity(3)


array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])

#### repeat

Método para repetir uma determinada array na direção do eixo escolhido.

Esse é a primeira função, de várias, que possui o parâmetro `axis`.

Diversas vezes o numpy permite fazer uma operação, nesse caso, `repeat`, no qual é opcional ou necessário dizer qual o **eixo da operação**.

Para um vetor de 1D, temos apenas 1 eixo, mas para matrizes, tempos dois:

**O eixo 0 é linha, o eixo 1 é coluna**

In [65]:
arr = np.array([1, 2, 3])
r1 = np.repeat(arr, 3)
print(r1)


[1 1 1 2 2 2 3 3 3]


Com axis = 0


In [66]:
arr = np.array([[1, 2, 3]])
r1 = np.repeat(arr, 3, axis=0)
print(r1)


[[1 2 3]
 [1 2 3]
 [1 2 3]]


#### arange

Função que retorna elementos igualmente espaçados num step (por padrão, 1) dentro de um certo intervalo.


In [None]:
np.arange(0, 10)

Step diferente de 1:


In [67]:
np.arange(0, 5, 0.1)

array([0. , 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1. , 1.1, 1.2,
       1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2. , 2.1, 2.2, 2.3, 2.4, 2.5,
       2.6, 2.7, 2.8, 2.9, 3. , 3.1, 3.2, 3.3, 3.4, 3.5, 3.6, 3.7, 3.8,
       3.9, 4. , 4.1, 4.2, 4.3, 4.4, 4.5, 4.6, 4.7, 4.8, 4.9])

#### linspace

Parecido com o arange, mas você diz quantos pontos você quer e o intervalo e ele define o espaçamento linear


In [68]:
np.linspace(0, 100, num=10)


array([  0.        ,  11.11111111,  22.22222222,  33.33333333,
        44.44444444,  55.55555556,  66.66666667,  77.77777778,
        88.88888889, 100.        ])

Tenha cuidado ao copiar arrays! <br>
Jeito errado


In [69]:
a = np.array([1, 2, 3])
b = a
b

array([1, 2, 3])

In [70]:
b[0] = 100
b

array([100,   2,   3])

In [71]:
a

array([100,   2,   3])

a também foi modificado! <br>
Jeito certo (seguro)


In [72]:
a = np.array([1, 2, 3])
b = a.copy()
b

array([1, 2, 3])

In [73]:
b[0] = 100
b

array([100,   2,   3])

In [74]:
a

array([1, 2, 3])

### Matemática

O numpy te fornece um conjunto de funções matemáticas:


#### Operação com escalares

In [75]:
a = np.array([1, 2, 3, 4])
a


array([1, 2, 3, 4])

##### Soma

In [76]:
a+2

array([3, 4, 5, 6])

##### Subtração:


In [77]:
a - 2

array([-1,  0,  1,  2])

##### Multiplicação

In [78]:
a*2

array([2, 4, 6, 8])

##### Divisão

In [79]:
a/2

array([0.5, 1. , 1.5, 2. ])

##### Incrementar

In [81]:
a += 2
a

array([5, 6, 7, 8])

##### Potência

In [82]:
a**2

array([25, 36, 49, 64])

#### Operação entre arrays

Tudo que você consegue fazer com escalar, você consegue fazer com arrays elemento-a-elemnto, por exemplo, para soma:


In [6]:
a = np.array([1, 2, 3, 4])
b = np.array([1, 0, 1, 0])
a + b


array([2, 2, 4, 4])

#### Funções matemáticas
O NumPy oferece diversas funções matemáticas clássicas, como exponencial, logaritmo, seno, cosseno etc. Essas funções são aplicadas a todos os elementos do array
##### Função seno:

In [7]:
np.sin(a)

array([ 0.84147098,  0.90929743,  0.14112001, -0.7568025 ])

##### Função cosseno

In [8]:
np.cos(a)

array([ 0.54030231, -0.41614684, -0.9899925 , -0.65364362])

#### Exponencial

In [11]:
np.exp(a)

array([ 2.71828183,  7.3890561 , 20.08553692, 54.59815003])

#### Log

In [13]:
np.log(a)

array([0.        , 0.69314718, 1.09861229, 1.38629436])

#### Álgebra Linear

Da definição do Wikipédia:

    Álgebra linear é um ramo da matemática que surgiu do estudo detalhado de sistemas de equações lineares, sejam elas algébricas ou diferenciais. A álgebra linear utiliza alguns conceitos e estruturas fundamentais da matemática como vetores, espaços vetoriais, transformações lineares, sistemas de equações lineares e matrizes.

O numpy nos permite executar diversas diversas operações de álgebra linear, mostradas a seguir:


In [88]:
a = np.ones((2, 3))
print(a)
print()

b = np.full((3, 2), 2)
print(b)


[[1. 1. 1.]
 [1. 1. 1.]]

[[2 2]
 [2 2]
 [2 2]]


##### Transposição

<img src="transposicao.png"  style="width: 400px" />

A operação de transposição pode ser feita da seguinte forma:

In [89]:
np.transpose(a)

array([[1., 1.],
       [1., 1.],
       [1., 1.]])

Ou acessando o atributo T:

In [90]:
a.T

array([[1., 1.],
       [1., 1.],
       [1., 1.]])

#### Multiplicação de matrizes

A tradicional multiplicação de matrizes, como mostra a imagem abaixo:

<img src="multiplicacao.gif"  style="width: 400px" />

pode ser feita no numpy simplesmente chamando `matmul`


In [91]:
np.matmul(a, b)

array([[6., 6.],
       [6., 6.]])

Operador `@` executa a função anterior:


In [92]:
a @ b

array([[6., 6.],
       [6., 6.]])

Outras funcções de Álgebra Linear: https://docs.scipy.org/doc/numpy/reference/routines.linalg.html

    Trace
    Decomposição de vetores
    Autovalor/autovetor
    Norma da Matriz
    Inversa
    Etc...


### Estatística

O numpy vem com várias funções básicas de estatística, como mínimo, máximo, média, mediana, etc.


In [50]:
stats = np.array([[1, 2, 3], [4, 5, 6]])
stats

array([[1, 2, 3],
       [4, 5, 6]])

In [51]:
np.min(stats)

1

In [55]:
stats.max()

array([3, 6])

In [53]:
#local do maior valor
stats.argmax()

5

In [54]:
#local do menor valor
stats.argmin()

0

Mínimo por linha:


In [97]:
np.min(stats, axis=1) 

array([1, 4])

Máximo por coluna:

In [56]:
stats.max(axis=1) 

array([3, 6])

Soma por coluna:

In [100]:
np.sum(stats, axis=0)

array([5, 7, 9])

In [57]:
stats.sum(axis=0)

array([5, 7, 9])

Média:


In [60]:
np.mean(stats)

3.5

#### Reorganizar Array

Muitas vezes você quer mudar o formato de array, por exemplo, de 4 elementos pra uma matriz 2x2, ou situações similares.

Para isso, você pode utilizar a função `reshape`.


In [104]:
before = np.array([[1,2,3,4],[5,6,7,8]])
print(before.shape)

(2, 4)


In [105]:
after = before.reshape((8, 1)) # tem que possuir a mesma quantidade!
after

array([[1],
       [2],
       [3],
       [4],
       [5],
       [6],
       [7],
       [8]])

In [107]:
before.reshape(2, 2, 2)

array([[[1, 2],
        [3, 4]],

       [[5, 6],
        [7, 8]]])

##### Anexar verticalmente os vetores


In [108]:
v1 = np.array([1,2,3,4])
v2 = np.array([5,6,7,8])

np.vstack([v1, v2])

array([[1, 2, 3, 4],
       [5, 6, 7, 8]])

##### Apendar horizontalmente os vetores

De forma similar ao anterior:


In [109]:
np.hstack(((v1,v2))) ### ???? olhar a difernça entre esse e o de baixo

array([1, 2, 3, 4, 5, 6, 7, 8])

In [110]:
h1 = np.ones((2, 4))
h2 = np.zeros((2, 2))
np.hstack((h1, h2))

array([[1., 1., 1., 1., 0., 0.],
       [1., 1., 1., 1., 0., 0.]])

### Funcionalidades extras
#### Carregar dados de um arquivo

Vamos supor que temos um arquivo data.txt com o seguinte conteúdo:

1,13,21,11,196,75,4,3,34,6,7,8,0,1,2,3,4,5 <br>
3,42,12,33,766,75,4,55,6,4,3,4,5,6,7,0,11,12 <br>
1,22,33,11,999,11,2,1,78,0,1,2,9,8,7,1,76,88 <br>

Podemos gerar uma matriz a partir desse arquivo da seguinte forma:


In [111]:
filedata = np.genfromtxt('data.txt', delimiter=',')
filedata

OSError: data.txt not found.

O primeiro argumento é o nome do arquivo.

Importante ressaltar o segundo key argumento, delimiter, no qual você especifica o que separa cada número individualmente no arquivo. Nesse caso, vírgula, mas podería ser ; por exemplo, espaços, ou tabs.

Podemos notar também que o numpy converteu para float nossos números, apesar de todos serem inteiros. Ele faz isso como uma medida preventiva dado que ele não sabe ao ler o arquivo qual tipo de dado que é.

Podemos converter manualmente para inteiro usando a função astype:

In [112]:
filedata.astype('int32')

NameError: name 'filedata' is not defined

Podemos também salvar uma matriz de uma forma mais otimizada não textual (binária) para uso futuro.

Isso gera um arquivo binário que inclusive salva o tipo de dado, nesse caso, int32.

Quando lido, vai converter corretamnete o tipo daquele dado.



In [None]:
np.save('data', filedata.astype('int32'))

Igual ao método de cima, porém comprime os dados (economiza espaço em disco, porém é um pouco mais lento pra ler).


In [None]:
np.savez_compressed('dataz', filedata)


Para ler os dados que acabamos de salvar, basta usar o `np.load`:


In [113]:
np.load('data.npy')

FileNotFoundError: [Errno 2] No such file or directory: 'data.npy'

### Máscara Boleana e Seleção Avançada

Conceito super importante no numpy e no pandas é o de máscara booleana.

Ao aplicar qualquer operador booleano

    >
    <
    <=
    >=
    ==
    in

o numpy retorna um array de True e False no qual ele aplicou elemento a elemento aquele operador.

Imagine para a matriz abaixo:


In [25]:
mat = np.array([1, 10, 20, 30]).reshape(2, 2)
mat

array([[ 1, 10],
       [20, 30]])

Eu quero saber todos os elementos maiores que 10, eu posso aplicar:


In [116]:
mat > 10

array([[False, False],
       [ True,  True]])

Me é retornado uma matriz de formato (2, 2) assim como com True na posição dos elementos que são maiores que 10.

Os tensores booleanos podem ser usados para filtrar valores em um tensor, por exemplo:


In [117]:
mat[mat > 10]

array([20, 30])

E será retornado um array com os elementos 20 e 30 como esperado.

Podemos fazer operações linha a linha ou coluna a coluna através de métodos auxiliares como any ou all:

    any: se qualquer elemento da linha for True, retorna True
    all: todos os elementos tem que ser True para retornar True

Exemplos:

Por coluna:


In [29]:
mat

array([[ 1, 10],
       [20, 30]])

In [37]:
np.any(mat > 10, axis=0)

array([ True,  True])

Por linha:

In [36]:
np.any(mat > 10, axis=1)

array([False,  True])

Geral:

In [41]:
np.any(mat > 10)

True

Comparando arrays

In [19]:
u = np.arange(4).reshape(2,2)
v = 2*np.ones((2,2))

In [16]:
u

array([[0, 1],
       [2, 3]])

In [17]:
v

array([[2., 2.],
       [2., 2.]])

In [None]:
w = u > v
print(w)

In [15]:
u[u > v]

array([3])

### Operador AND

Similar ao `and` do python, podemos usar múltiplas condições para filtrar dados da nossa matriz com o operador `&`.


In [48]:
mat

array([[ 1, 10],
       [20, 30]])

In [120]:
filt = (mat > 10) & (mat <= 20)
mat[filt]

array([20])

Observação: note que os colchetes além de melhorarem a legibilidade, são necessárias devido a ordem de precedência dos operadores python. Se não colocarmos os colchetes, dará um erro.


### Operador OR

Similar ao `or`, só que devemos utilizar `|`:


In [121]:
filt = (mat == 1) | (mat >= 20)
mat[filt]

array([ 1, 20, 30])

### Operador NOT

Similar ao `not`, mas devemos utilizar um til `~`.


In [122]:
filt = (mat == 1) | (mat >= 20)
mat[~filt]

array([10])

### Atribuir valores em determinadas condições
E podemos também atribuir um valor específico aos elementos de um vetor que satisfazem uma certa condições, por exemplo zerar todos os valores negativos:


In [23]:
u = np.array([-1,  2, -3])
print("u =", u)
print()

u[u < 0] = 0
print("u =", u)

u = [-1  2 -3]

u = [0 2 0]


#### Seleção passando listas

Podemos selecionar elementos específicos de um array passando uma lista de posições:


In [47]:
a = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9])
a[[1, 2, 5, 8]]

array([2, 3, 6, 9])

Referências   <br>
<a href="https://github.com/numpy/numpy" target="_blank">NumPy GitHub</a>  <br>
<a href="https://docs.scipy.org/doc/numpy/reference/" target="_blank">Documentação oficial</a>   <br>
<a href="https://docs.scipy.org/doc/numpy/reference/routines.math.html" target="_blank">Funções matemáticas</a>   <br>
<a href="https://docs.scipy.org/doc/numpy/reference/routines.linalg.html" target="_blank">Funções de Álgebra Linear</a>   <br>
<a href="http://www.opl.ufc.br/pt/post/numpy/" target="_blank">Outros</a> 
    

## Outros tópicos
* Broadcasting: operações com vetores de dimensões distintas

<a href="http://www.opl.ufc.br/pt/post/numpy/" target="_blank">Referência</a> 