# **SIN-393 - Introdução à Visão Computacional (2022-2)**

# Lecture 03 - Introduction to NumPy

Prof. João Fernando Mari ([*joaofmari.github.io*](https://joaofmari.github.io/))

---

* Material baseado no **Scipy Lecture Notes**. 
    * Disponível em: http://www.scipy-lectures.org/

## Importando o NumPy
---

* Convenções de importação.
* Documentação do NumPy:
    * http://docs.scipy.org/

In [None]:
import numpy as np

## Arranjos NumPy
---

* Arranjos NumPy são containers que fornecem operações numéricas rápidas e uso eficiente da memória.

In [None]:
a = np.array([0, 1, 2, 3])
a

* Calculando o quadrado de uma sequencia de 1000 inteiros usando listas Python.

In [None]:
# Uma lista com 1000 números inteiros
L = range(1000)

%timeit [i**2 for i in L]

* Calculando o quadrado de uma sequência de 1000 inteiros usando arranjos NumPy.

In [None]:
# Arranjo NumPy com 1000 números
a = np.arange(1000)
%timeit a**2

### Criando arranjos

#### Criação manual de arranjos NumPy

* Arranjos 1D

In [None]:
a = np.array([0, 1, 2, 3])
a

In [None]:
a.ndim

In [None]:
a.shape

In [None]:
len(a)

* Arranjos 2D

In [None]:
b = np.array([[0, 1, 2], 
              [3, 4, 5]])
b

In [None]:
b.ndim

In [None]:
b.shape

In [None]:
len(b)

* Arranjos 3D

In [None]:
c = np.array([
             [[1, 2, 3, 1],
              [4, 5, 6, 5],
              [7, 8, 9, 9]],
             [[10, 11, 12, 10],
              [13, 14, 15, 14],
              [16, 17, 18, 18]]
             ])
c

In [None]:
c.ndim

In [None]:
c.shape

#### Funções para criação de arranjos

* Na prática, raramente os arranjos são criados manualmente.

* Arranjos igualmente espaçados

In [None]:
a = np.arange(10) # 0 .. n-1
a

In [None]:
b = np.arange(1, 9, 2)
b

* Número de pontos.
    * Sintaxe: ```np.linspace(val_ini, val_fim, num_pontos)```
        - ```val_ini```: valor inicial;
        - ```val_fim```: valor final;
        - ```num_pontos```: número de pontos.

In [None]:
c = np.linspace(0, 1, 6)
c

In [None]:
d = np.linspace(0, 1, 5, endpoint=False)
d

#### Arranjos comuns

In [None]:
a = np.ones((3,3)) # (3, 3) é uma tupla
a

In [None]:
b = np.zeros((2,2))
b

In [None]:
c = np.eye(3)
c

In [None]:
d = np.diag(np.array([1, 2, 3, 4]))
d

* Números aleatórios

In [None]:
a = np.random.rand(4) # distribuição uniforme
a

In [None]:
b = np.random.randn(4) # distribuição gaussiana
b

In [None]:
np.random.seed(1234) # define a semente para geração dos números aleatórios

#### Tipos de dados

* O tipo de dados padrão do numpy é float64

In [None]:
c = np.ones((3, 3))
c.dtype

* Quando o arranjo é criado a partir diretamente, o tipo é inferido a partir dos dados.

In [None]:
c = np.array([1, 2, 3]) # inteiros (32 bits)
c.dtype

In [None]:
c = np.array([1., 2, 3]) # float (64 bits)
c.dtype

* Outros tipos de dados permitidos:

In [None]:
d = np.array([1+2j, 3+4j, 5+6j])
d.dtype

In [None]:
e = np.array([True, False, False, True])
e.dtype

In [None]:
f = np.array(['Um', 'Dois', 'Quatrocentos'])
f.dtype

* Outros tipos permitidos:
    * int16
    * int32
    * int64
    * uint32
    * float32
    * ...

### Visualização básica

In [None]:
import matplotlib.pyplot as plt

#### Plotando arranjos 1D

In [None]:
x = np.linspace(0, 3, 20)
x

In [None]:
y = np.linspace(0, 9, 20)
y

In [None]:
plt.plot(x, y) # Plota uma linha

In [None]:
plt.plot(x, y, 'o')

In [None]:
plt.plot(x, y)
plt.plot(x, y, 'o')

plt.show()

#### Plotando arranjos 2D

In [None]:
imagem = np.random.rand(30, 30)
plt.imshow(imagem)
plt.colorbar()

In [None]:
plt.imshow(imagem, cmap='gray')
plt.colorbar()

### Indexação e fatiamento (slicing)

* Os elementos de um  arranjo podem ser acessados e atribuídos por indexação e fatiamento de forma semelhante às coleções Python (listas, tuplas, ...).

In [None]:
a = np.arange(10) # 0 .. 9 
a

In [None]:
a[0], a[2], a[-1], a[-2]

* Obtendo um arranjo na ordem reversa

In [None]:
a[::-1]

#### Indexação em arranjos multidimensionais

* Os índices em arranjos multidimensionais são tuplas de inteiros

In [None]:
a = np.diag(np.arange(3)) # matriz identidade 3 x 3
a

In [None]:
a[1, 1] # linha 1, coluna 1

In [None]:
a [2, 1] # linha 2 (terceira linha), coluna 1 (segunda coluna)

In [None]:
a[1,:] # linha 1 inteira

In [None]:
a[:,2] # coluna 2 inteira

* Atribuição por indexação

In [None]:
a[2, 1] = 10
a

#### Fatiamento

In [None]:
a = np.arange(10)
a

In [None]:
a[2:9:3] # inicio : fim (exclusivo) : passo

* Assim como nas listas Python, o fim não é incluído

In [None]:
a[:4]

* Nenhum dos três componentes do fatiamento (inicio, fim, passo) é obrigatório.
* Caso sejam omitidos:
    * inicio = 0;
    * fim = último elemento;
    * passo = 1.

In [None]:
a

In [None]:
a[1:3]

In [None]:
a[::2]

In [None]:
a[3:]

* Atribuição com fatiamento

In [None]:
a[1:3] = 99
a

In [None]:
a[5:7] = np.array([88, 99])
a

#### Combinando indexação e fatiamento

In [None]:
a = np.arange(10)
a

In [None]:
a[5:] = 10
a

In [None]:
b = np.arange(5)
b

In [None]:
a[5:] = b[::-1]
a

#### Ilustração de indexação e fatiamento em arranjos NumPy

<img src='figures/slicing_numpy_example.png' style="height:300px">
<center>Fonte: [2].</center>

In [None]:
a = np.arange(6) + np.arange(0, 51, 10)[:, np.newaxis]
a

In [None]:
a[0, 3:5] # laranja

In [None]:
a[4:, 4:] # verde escuro

In [None]:
a[:, 2] # vermelho

In [None]:
a[2::2, ::2] # verde claro

### Cópias e visões

* Quando a visão é modificada, o arranjo original também é modificado.

In [None]:
a = np.arange(10)
a

In [None]:
b = a[::2]
b

In [None]:
np.may_share_memory(a, b)

In [None]:
b[0] = 12
b

In [None]:
a

* Forçando a cópia de um arranjo.

In [None]:
a = np.arange(10)
a

In [None]:
c = a[::2].copy()  # Força a cópia
c

In [None]:
np.may_share_memory(a, c)

In [None]:
c[0] = 12
c

In [None]:
a

* A utilização de visões possibilita economia de memória e operações mais rápidas.

### Indexação elegante

In [None]:
np.random.seed(3)

In [None]:
a = np.random.randint(0, 21, 15)
a

In [None]:
(a % 3) == 0 # True: multiplos de 3; 

In [None]:
mascara = (a % 3 == 0)
extract_from_a = a[mascara]  # Ou:  a[a%3==0]
extract_from_a

In [None]:
mascara = a > 10
mascara

In [None]:
a_10 = a[mascara]
a_10

#### Indexação por máscaras para atribuição de valores

In [None]:
a

In [None]:
a[a % 3 == 0] = -1
a

#### Indexação com arranjos de inteiros

In [None]:
a = np.arange(0, 100, 10) # De 0 até 100 (exclusivo), de 10 em 10.
a

In [None]:
lista_indices = [2, 6, 3, 9]
a[lista_indices]

* Ou diretamente:

In [None]:
a[[2, 6, 3, 9]]

* É possível repetir algum índice.

In [None]:
a[[2, 6, 3, 2, 9, 3]]

* E também é possível fazer atribuição de valores.

In [None]:
a[[9, 7]] = -100
a

* O resultado da indexação por arranjos de inteiros tem o formato do arranjo de índices.

In [None]:
a = np.arange(10) * 10
a

In [None]:
a.shape

In [None]:
indices = np.array([[3, 4], [9, 7]])
indices

In [None]:
indices.shape

In [None]:
a[indices]

#### Ilustração de vários exemplos de indexação elegante

<img src='figures/fancy_example.png' style="height:300px">
<center>Fonte: [2].</center>

In [None]:
a = np.arange(6) + np.arange(0, 51, 10)[:, np.newaxis]
a

In [None]:
a[(0, 1, 2, 3, 4), (1, 2, 3, 4, 5)] # Laranja

In [None]:
a[3:, [0, 2, 5]] # azul 

In [None]:
mascara = np.array([1, 0, 1, 0, 0, 1], dtype=bool)
a[mascara, 2] # vermelho

## Operações numéricas com arranjos
---

### Operações ponto a ponto

#### Operações básicas

* Com escalares.

In [None]:
import numpy as np
a = np.array([1, 2, 3, 4])
a + 1

In [None]:
a

In [None]:
b = 2 ** a
b

* Com arranjos.

In [None]:
b = np.ones(4) + 1
b

In [None]:
a

In [None]:
a - b

In [None]:
a * b # Obs.: não é produto escalar.

* Estas operações são muito mais rápidas do que quando implementadas em Python puro.

In [None]:
a = np.arange(10000)
%timeit a + 1

In [None]:
l = range(10000)
%timeit [i+1 for i in l]

* Obs.: Multiplicação de arranjos não é multiplicação de matrizes

In [None]:
c = np.ones((3, 3))
c

In [None]:
c * c

* Para multiplicação de matrizes:

In [None]:
c.dot(c)

#### Comparação de arranjos

In [None]:
a = np.array([1, 2, 3, 4])
b = np.array([4, 2, 2, 4])
a == b

In [None]:
a > b

* Comparação considerando todo o arranjo.

In [None]:
c = np.array([1, 2, 3, 4])
np.array_equal(a, c)

In [None]:
np.array_equal(a, b)

#### Operações lógicas

In [None]:
a = np.array([1, 1, 0, 0], dtype=bool)
b = np.array([1, 0, 1, 0], dtype=bool)
np.logical_or(a, b)

In [None]:
np.logical_and(a, b)

#### Funções transcendentais

In [None]:
a = np.arange(5)
np.sin(a)

In [None]:
np.cos(a)

In [None]:
np.log(a)

* Transposição de matrizes

In [None]:
a = np.triu(np.ones((3,3)), 1) # Cria uma matriz. "triu" mantém apenas a diagonal superior da matriz.
a

In [None]:
b = a.T # Transposição de a.

* Obs.: O resultado da transposição é uma visão.

In [None]:
np.may_share_memory(a, b)

### Reduções

<img src='figures/axis.png' style="height:300px">
<center>Fonte: [2].</center>

#### Soma

In [None]:
a = np.array([1, 2, 3, 4])
a

In [None]:
a.sum()

In [None]:
np.sum(a)

* Soma de linhas e colunas

In [None]:
x = np.array([[1, 1],
              [2, 2]])
x

In [None]:
x.sum()

In [None]:
x.sum(axis=0) # linhas (primeira dimensão)

In [None]:
x.sum(axis=1) # colunas (segunda dimensão)

* Outras reduções funcionam da mesma forma.

#### Extremos

In [None]:
x = np.array([2, 5, 1, 3])
x.min()

In [None]:
x.max()

In [None]:
x.argmin()

In [None]:
x.argmax()

#### Reduções lógicas

In [None]:
np.all([True, True, False])

In [None]:
np.all([True, True, True])

In [None]:
np.any([True, True, False])

In [None]:
np.any([False, False, False])

#### Estatística

In [None]:
x = np.array([2, 5, 1, 3])
x.mean()

In [None]:
x.std()

In [None]:
np.median(x)

### *Broadcasting*

* Operações básicas em Python são realizadas ponto a ponto. 
* Para isso os arranjos devem possuir o mesmo tamanho. 
* Entretanto é possível operar arranjos com tamanhos diferentes
    * Se o Python conseguir transformar esses arranjos de forma que eles passem a ter o mesmo tamanho.

<img src='figures/broadcasting.png' style="height:400px">
<center>Fonte: [2].</center>

In [None]:
a = np.tile(np.arange(0, 40, 10), (3, 1)).T
a

In [None]:
b = np.array([1, 1, 1])
b

In [None]:
a + b

* Broadcasting já foi utilizado sem sabermos.

In [None]:
a = np.ones((4, 5))
a

In [None]:
a[0] = 2
a

* Adicionando novas dimensões

In [None]:
a = np.arange(0, 40, 10)
a

In [None]:
a.shape

In [None]:
a = a[:, np.newaxis] # adiciona um novo eixo 1D -> 2D
a

In [None]:
a.shape

In [None]:
b

In [None]:
a + b

### Manipulação da forma dos arranjos

#### Achatamento

In [None]:
a = np.array([[1, 2, 3], [4, 5, 6]])
a

In [None]:
a.ravel()

#### Reformatar

In [None]:
a

In [None]:
a.shape

In [None]:
b = a.ravel()
b

In [None]:
b.shape

In [None]:
c = b.reshape(2, -1)
c

* **Cuidado!** np.reshape pode retornar uma visão ou uma cópia.

In [None]:
c[0, 0] = 99 # visão
a

In [None]:
d = c.T.reshape(2,3)
d

In [None]:
d[1, 1] = 99 # cópia
c

### Ordenação

#### *In-place*

In [None]:
a = np.array([[4, 3, 5],
              [1, 2, 1]])
a

In [None]:
a.sort() # Ordena cada linha individualmente. O mesmo que a.sort(axis=1)
a

In [None]:
a.sort(axis=0) # Ordena cada coluna individualmente
a

In [None]:
a = np.array([[4, 3, 5],
              [1, 2, 1]])
a

In [None]:
b = np.sort(a)
b

In [None]:
c = np.sort(b, axis=0) # Ordena as colunas
c

* Ordenação com os índices.

In [None]:
a = np.array([4, 3, 1, 2])
a

In [None]:
j = np.argsort(a)
j

In [None]:
a[j]

### Lendo e escrevendo arquivos de texto

In [None]:
data = np.array([[1900.,   30e3,    4e3, 48300],
                 [1901., 47.2e3,  6.1e3, 48200],
                 [1902., 70.2e3,  9.8e3, 41500],
                 [1902., 77.4e3, 35.2e3, 38200]])
data

In [None]:
np.savetxt('data.txt', data)

* Lendo um arranjo 2D a partir de um arquivo de texto.

In [None]:
data_2 = np.loadtxt('data.txt')
data_2

## Bibliography
---

* **Scipy Lecture Notes**.
    * Disponível em: http://www.scipy-lectures.org/ 
* Documentação do NumPy.
    * http://docs.scipy.org/
* Introduction to NumPy (SciPy 2015).
    * https://github.com/enthought/Numpy-Tutorial-SciPyConf-2015 
    * Obs: Inclui Matplotlib.