# <span style="color:#336699">SER-347 - Introdução à Programação para Sensoriamento Remoto</span>
<hr style="border:2px solid #0077b9;">

# <span style="color:#336699">NumPy</span>

[<img src="https://numpy.org/_static/numpy_logo.png" alt="NumPy" style="height: 75px;" align="right">](http://numpy.org)

Professores:
- Thales Sehn Körting
- Gilberto Ribeiro de Queiroz

## O básico sobre NumPy

O principal objeto manipulado pela NumPy é o _homogeneous multidimensional array_

* Uma tabela de elementos de mesmo tipo (em geral números) indexados por uma tupla de inteiros positivos
* As dimensões são chamadas de _axes_
* O número de axes é chamado de _rank_

Exemplos:

``[1, 2, 1]`` → ``rank = 1``

``[[ 1.0, 0.0, 0.0], [0.0, 1.0, 2.0]]`` → ``rank = 2``, a primeira dimensão tem tamanho 2, a segunda dimensão tem tamanho 3

A classe de array do NumPy é chamada ``ndarray (numpy.array)``

Supondo um ndarray contendo uma matriz de 30 linhas e 40 colunas:
* ``ndarray.ndim`` é o número de axes da array
* ``ndarray.shape`` é uma tupla de inteiros indicando o tamanho da array em cada dimensão (no exemplo acima, shape → 30, 40)
* ``ndarray.size`` é o total de elementos no array (no exemplo acima, size → 1200)
* ``ndarray.dtype`` é um objeto descrevendo o tipo dos elementos no array (por exemplo, numpy.int32, numpy.int16, numpy.float64)
* ``ndarray.itemsize`` é o tamanho em bytes de cada elemento no array (por exemplo, em um array de float64 itemsize → 8)
* ``ndarray.data`` é um buffer contendo os elementos do array, geralmente não é usado dessa forma pois temos facilidades de indexação

## Utilizando NumPy

In [None]:
# para utilizar a biblioteca numpy, fazemos sua importação
# a parte 'as np' informa um 'apelido' para a biblioteca, a ser usado no script
import numpy as np

# arange retorna um array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14])
# reshape altera as dimensões do array
a = np.arange(15).reshape(3, 5)

# criando um array a partir de uma lista
b = np.array([6, 7, 8])

print("array a:\n", a)
print("array b:\n", b)

In [None]:
a.shape

In [None]:
a.ndim

In [None]:
a.dtype

In [None]:
a.itemsize

In [None]:
a.size

In [None]:
type(a)

In [None]:
type(b)

As funções ``zeros/ones`` criam arrays contendo zeros/uns, de acordo com a quantidade de elementos solicitada

In [None]:
print(np.zeros((3,4)))
print(np.ones((2,3)))

A função ``arange`` cria números em sequência

Por exemplo:
* gerar números entre [10, 300)
* pulando de 5 em 5

In [None]:
print(np.arange(10, 300, 5))

Outro exemplo:
* gerar números entre [0, 50)
* pulando de 0.3 em 0.3

In [None]:
print(np.arange(0, 50, 0.3))

A função ``linspace`` gera um intervalo de números com um tamanho específico

Por exemplo:
* gerar números entre [0, 2]
* tamanho 80 elementos

In [None]:
exemplo = np.linspace(0, 2, 80)
print(exemplo)
print("número de elementos:", len(exemplo))

Outro exemplo:
* gerar 30 números entre [0, 2$\pi$]
* calcular o seno de todos os números

In [None]:
from numpy import pi
x = np.linspace(0, 2*pi, 30)
print(x)
print(np.sin(x))

## Funções matemáticas

### Operações básicas com arrays

Operações aritméticas se aplicam em cada elemento do array, gerando um novo array de resultado

In [None]:
a = np.array( [20,30,40,50] )
b = np.arange( 4 )
print("array a:\n", a)
print("array b:\n", b)
c = a - b
print("array c:\n", c)

In [None]:
print("cálculo complexo com todos os elementos de a:\n", 10 * np.sin(a))
print("array b, ao quadrado:\n", b**2)
print("consulta de elementos de a menores que o valor 35:\n", a < 35)

O operador ``*`` calcula o produto por elemento, e não por matriz (para isso usa-se a função ``dot``)

In [None]:
A = np.array( [[1,1],
               [0,1]] )
B = np.array( [[2,0],
               [3,4]] )
print("A*B:\n", A*B) 
print("A.dot(B):\n", A.dot(B))

Operações como ``+=`` e ``*=`` modificam a própria matriz

In [None]:
a = np.ones((2,3))
a *= 3 # é o mesmo que a = a * 3
print("a:\n", a)

b = np.random.random((2,3))
print("b:\n", b)
b += a # é o mesmo que b = b + a
print("b, após somar com a:\n", b)

As funções ``sum``, ``min`` e ``max`` funcionam para ndarrays

In [None]:
a = np.random.random((2,3))
print("a:\n", a)
print("a.sum():\n", a.sum())
print("a.min():\n", a.min())
print("a.max():\n", a.max())

Muitas funções podem operar sobre eixos específicos

In [None]:
b = np.arange(12).reshape(3,4)
print("b:\n", b)

print("maior elemento, axis = 0:\n", b.max(axis=0))
print("menor elemento, axis = 1:\n", b.min(axis=1))
print("soma cumulativa, axis = 1:\n", b.cumsum(axis=1))

Exemplos de funções que se aplicam a cada elemento de um ndarray


In [None]:
B = np.arange(3)
print("B:\n", B)

print("np.exp(B):\n", np.exp(B))
print("np.sqrt(B):\n", np.sqrt(B))

Para acessar os elementos do array, usamos um índice para cada eixo

In [None]:
b = np.arange(12).reshape(3,4)
print("array b:\n", b)
print("array na posição [1,2]:\n", b[1,2])

Tentativa de acessar elementos fora dos limites

In [None]:
print("limites do array b:\n", b.shape)
print("array na posição [3,4]:\n", b[3,4])

É possível acessar elementos utilizando índices negativos (neste caso o índice começa com -1)

In [None]:
print("array b:\n", b)
print("array b, acessando a última linha:\n", b[-1])
print("array b, acessando a primeira linha:\n", b[-3])

### Números aleatórios

NumPy oferece uma série de funções para geração de números aleatórios
* `rand(d0, d1, ..., dn)` _Random values in a given shape._
* `randn(d0, d1, ..., dn)` _Return a sample (or samples) from the “standard normal” distribution._
* `randint(low[, high, size, dtype])` _Return random integers from low (inclusive) to high (exclusive)._
* `random([size])`_Return random floats in the half-open interval [0.0, 1.0)._

Exemplo:

In [None]:
# para utilizar a biblioteca matplotlib, fazemos sua importação
# a parte 'as plt' informa um 'apelido' para a biblioteca, a ser usado no script
import matplotlib.pyplot as plt

# criação de conjuntos de pontos aleatórios (150 e 200 pontos 2D)
azuis = np.random.random(size=(2,150))
verdes = np.random.random(size=(2,200)) + 0.5

# gráfico 2D
plt.figure()
plt.scatter(azuis[0], azuis[1], c = 'blue')
plt.scatter(verdes[0], verdes[1], c = 'green')
plt.show()

### Hands on

* _gain_ é um número real que é multiplicado por todos os pixels de uma banda
* _offset_ é um número real que é somado a todos os pixels de uma banda

Suponha uma banda de uma imagem armazenada em uma matriz de 100 linhas e 200 colunas (com números aleatórios inteiros entre 0 e 100)

In [None]:
banda = np.random.randint(0, 101, [100, 200])

# utilizamos matplotlib para visualizar imagens
plt.imshow(banda, cmap='gray', vmin=0, vmax=255)
plt.show()

In [None]:
# experimentando gain para melhorar a visualização da banda
gain = 3
# aplicar o gain
banda_com_gain = banda * gain

# visualizar imagem
plt.imshow(banda_com_gain, cmap='gray', vmin=0, vmax=255)
plt.show()

In [None]:
# experimentando offset para melhorar a visualização da banda
offset = 200
# aplicar o offset
banda_com_offset = banda + offset
print(banda_com_offset.min())

# visualizar imagem
plt.imshow(banda_com_offset, cmap='gray', vmin=0, vmax=255)
plt.show()

Em alguns casos, se o resultado ultrapassar o range de uma imagem de 8 bits (entre 0 e 255), force para ficar dentro do range, por exemplo:
* -50 → 0
* 270 → 255

In [None]:
banda_com_gain[banda_com_gain > 255] = 255
banda_com_gain[banda_com_gain < 0] = 0

banda_com_offset[banda_com_offset > 255] = 255
banda_com_offset[banda_com_offset < 0] = 0

# apresentar os resultados
print("banda original")
plt.imshow(banda, cmap='gray', vmin=0, vmax=255)
plt.show()
print("banda_com_gain")
plt.imshow(banda_com_gain, cmap='gray', vmin=0, vmax=255)
plt.show()
print("banda_com_offset")
plt.imshow(banda_com_offset, cmap='gray', vmin=0, vmax=255)
plt.show()

Dadas as seguintes séries temporais
* $s_1$ → 168, 398, 451, 337, 186, 232, 262, 349, 189, 204, 220, 220, 207, 239, 259, 258, 242, 331, 251, 323, 106, 1055, 170
* $s_2$ → 168, 400, 451, 300, 186, 200, 262, 349, 189, 204, 220, 220, 207, 239, 259, 258, 242, 331, 251, 180, 106, 1055, 200

Utilize funções NumPy para calcular a distância euclidiana entre as séries

Como decompor o cálculo da distância euclidiana em passos?

$d(s_1, s_2) = \sqrt{\sum_{i=0}^{N-1}(s_{2_i} - s_{1_i})^2}$

Podemos inicialmente subtrair todos os termos

$\text{subtracao} = [s_2 - s_1]$

Depois fazemos o produto de cada elemento por si mesmo (quadrado)

$\text{quadrado} = \text{subtracao} * \text{subtracao}$

Por fim, fazemos calcular a raiz

$d(s_1, s_2) = \sqrt{\text{quadrado}}$

In [None]:
# definir as series
s_1 = np.array((168, 398, 451, 337, 186, 232, 262, 349, 189, 204, 220, 220, 207, 239, 259, 258, 242, 331, 251, 323, 106, 1055, 170))
s_2 = np.array((168, 400, 451, 300, 186, 200, 262, 349, 189, 204, 220, 220, 207, 239, 259, 258, 242, 331, 251, 180, 106, 1055, 200))

# aplicar o calculo 
subtracao = s_1 - s_2
print("subtração:\n", subtracao)
quadrado = subtracao * subtracao
print("quadrado:\n", quadrado)
somatorio = np.sum(quadrado)
print("somatorio:\n", somatorio)
distancia = np.sqrt(somatorio)
print("distância:\n", distancia)

# podemos utilizar o módulo de álgebra linear que
distancia2 = np.linalg.norm(s_1 - s_2)
print("distância 2:\n", distancia2)

## Referência

[NumPy](https://numpy.org/). Acesso: Abril, 2020. 