In [None]:
import numpy as np
from PIL import Image
from time import time

path = '/content/drive/MyDrive/2023 1/PDI/Notebooks-aulas/Numpy/'

#### **Salvando e carregando uma matriz em disco**

O `numpy` oferece recursos para salvar e carregar arquivos de dados em formato binário. Normalmente, utiliza-se a extensão de arquivo `.npy` para denotar estes arquivos, emborta seja possível estabelecer qualquer extensão.

***Obs.:** note que após o salvamento, o arquivo `.npy` pode demorar alguns instantes para aparecer na sua pasta do Drive...

In [None]:
# Obtendo os dados da imagem "pedacinho.png" e salvando em disco
img = Image.open(path + 'pedacinho.png')
arr = np.asarray(img).astype(int)

np.save(path + 'matriz3d.npy', arr)

In [None]:
# Carregando os dados da matriz salva
matriz = np.load(path + 'matriz3d.npy')

print(matriz.shape)

#### **Trabalhando com fatiamentos e projeções**

Vamos tentar extrar a informação composta por apenas pelo canal verde (eixo 2, posição 1) da matriz.

In [None]:
# Fatiamento
fatia = matriz[:,:,1] # :,: --> todas linhas, todas colunas
print(fatia.shape)

Note que o fatiamento acima é o que traz o resultado esperado. É comum se confundir esta operação com:

In [None]:
teste1 = matriz[:,:][1]
print(teste1.shape)

Na operação acima, estamos extraindo a matriz toda (:,:) e dela acessando a segunda linha (posição 1). Veja a equivalência com a operação a seguir:

In [None]:
teste2 = matriz[1]
print(teste2.shape)

A primeira linha (como qualquer outra) possui 44 colunas e 3 "camadas" de profundidade.

No entanto, dependendo da forma como são feitos, o fatiamento e as projeções podem trazer resultados equivalentes. Veja um caso:

In [None]:
teste3 = matriz[1][3]
print(teste3.shape)

In [None]:
teste4 = matriz[1,3]
print(teste4.shape)

In [None]:
teste5 = matriz[1,3,:]
print(teste5.shape)

Na dúvida, priorize o **fatiamento**.

Vamos recordar outros detalhes do fatiamento.

- Valores negativos acessam as posições "de trás para frente"

In [None]:
teste = matriz[:-4, :-1] # -4 estabelece que pararemos a fatia ANTES das 4 últimas posições
print(matriz.shape, teste.shape)

- Não é possível "decrescer" posições
- Note o caso estranho de matriz com dimensão de tamanho zero

In [None]:
teste = matriz[-1:-3]
print(matriz.shape, teste.shape)
print(teste)

- No entanto, é possível iniciar uma fatia com valor negativo, desde que o mesmo aumente:

In [None]:
# Acessando as 4 últimas colunas da matriz:
teste = matriz[:,-4:,:]
print(matriz.shape, teste.shape)

In [None]:
# Acessando as 3 colunas da matriz antes da última:
teste = matriz[:,-4:-1,:]
print(matriz.shape, teste.shape)

Também é possível se estabelecer passos para a indexação do fatiamento. Neste caso, vamos utilizar um array linear pequeno, para entender melhor o que está acontecendo...

In [None]:
x = np.arange(12)
print(x)

***Obs.:** abrindo um breve parêntesis, vale destacar aqui que há uma função com objetivo e funcionamento similar ao de `arange` que, no entanto, é diferente. É a função `linspace`. Veja abaixo:

In [None]:
# arange produz um array com uma sequência de inteiros
# Os parâmetros são: início (opcional), parada (obrigatório) e passo (opcional)
tmp = np.arange(2,10,2)
print(tmp)

# linspace produz um array com uma sequência de valores igualmente espaçados
# dentro dos limites estabelecidos. Os valores produzidos são float, não int
# Os parâmetros são: início, parada e quantidade de valores gerados
# Há um parâmetro opcional, chamado endpoint, para informar se a parada
# será gerada (True) ou não (False), o valor default é True
tmp2 = np.linspace(2,10,5)
print(tmp2)

tmp3 = np.linspace(2,10,5,endpoint=False)
print(tmp3)

tmp4 = np.linspace(2,10,8)
print(tmp4)

**Retomando o estudo de fatiamento...**

Vamos usar a notação: `início:parada:passo` para acessar as posições ímpares de `x`:

In [None]:
print(x[1:12:2])

Note que começamos na posição 1, usamos o valor 12 como critério de parada e avançamos de 2 em dois valores. Estes três parâmetros possuem valores *default*, caso omitidos:

- Início: 0
- Parada: tamanho do array
- Passo: 1

In [None]:
print("Omitindo a parada:", x[1::2])
print("Omitindo o passo:", x[1:])
print("Omitindo o início:", x[:7:3])
print("Omitindo início e parada:", x[::2])

Também é possível se trabalhar com valores negativos:

In [None]:
print("Passo negativo, começando da quarta posição de trás pra frente:", x[-4::-1])
print("Passo positivo, começando da quarta posição de trás pra frente:", x[-4::])

Note, no entanto, que a lógica da `parada` não é a de posição final, mas a de critério de parada. Portanto, para se partir do penúltimo elemento até o elemento da posição 3 do arranjo, em ordem reversa, utilizamos:

In [None]:
print(x[-2:2:-1])

Para concluir, vejamos a notação para gerar uma cópia reversa do array:

In [None]:
y = x[::-1]
print(x.shape, y.shape)
print(x)
print(y)

#### **Redimensionamento**

Podemos usar a função `reshape` para redimensionar um array:

In [None]:
# Reorganizando x em uma matriz 3x4
X = np.reshape(x, (3,4))
print(X.shape)
print(X)

In [None]:
# Redimensionando y para a mesma forma de X
Y = np.reshape(y, X.shape)
print(Y.shape)
print(Y)

#### **Usando fatiamento em múltiplas dimensões**

Vamos elaborar um pouco mais sobre o fatiamento em arrays multidimensionais...

In [None]:
# Obtendo os dados das colunas ímpares de X
C = X[:, 1::2]
print(X, end='\n\n')
print(C)

In [None]:
# Obtendo os dados das linhas pares e colunas ímpares de X
C = X[::2, 1::2]
print(X, end='\n\n')
print(C)

In [None]:
# Invertendo dimensões: ordem das linhas
C = X[::-1]
D = X[::-1,:]
print(X, end='\n\n')
print(C, end='\n\n')
print(D)

In [None]:
# Invertendo dimensões: ordem das colunas
C = X[:, ::-1]
print(X, end='\n\n')
print(C)

In [None]:
# Invertendo dimensões: tudo
C = X[::-1,::-1]
print(X, end='\n\n')
print(C)

**Pergunta 1:** esta operação de fatiamento corresponde à que transformação geométrica em uma imagem?

**Pergunta 2:** e a operação a seguir?

In [None]:
C = X.T[::-1,:]
print(X, end='\n\n')
print(C)

In [None]:
# Invertendo dimensões: ordem das camadas
C = matriz[:,:,::-1]
print(matriz.shape, C.shape, end='\n\n')
print(matriz[:3,:3,:], end='\n\n======\n\n')
print(C[:3,:3,:])

#### **Mais exemplos**

Vamos gerar uma imagem em tons de cinza a partir da média dos valores de cada canal, de maneiras diferentes.

#### **a. Acessando pixel a pixel**

In [None]:
# Cria uma matriz preenchida com valores zero, com o mesmo número de linhas e colunas de matriz
inicio = time()
cinza1 = np.zeros(matriz.shape[:-1]) # Atenção, usamos o fatiamento no atributo shape :-)
print(cinza1.shape)

for i in range(matriz.shape[0]):
  for j in range(matriz.shape[1]):
    # Cada pixel tem o formato 1x3
    cinza1[i,j] = matriz[i,j].mean() # Calcula a média dos valores do pixel

fim = time()

duracao_metodo1 = fim - inicio

Note que no códico acima, a média dos canais do pixel poderia ser calculada de diversas formas. Alguns exemplos:

- `cinza1[i,j] = (matriz[i,j,0] + matriz[i,j,1] + matriz[i,j,2]) / 3`
- `cinza1[i,j] = np.mean(matriz[i,j])`
- `cinza1[i,j] = np.sum(matriz[i,j]) / len(matriz[i,j])`
- `cinza1[i,j] = matriz[i,j].sum() / matriz[i,j].shape[0]`

#### **b. Acessando camada por camada, via fatiamento**

In [None]:
inicio = time()
cinza2 = np.zeros(matriz.shape[:-1])
# Manteremos o print para que haja a mesma quantidade de I/0 do método anterior
print(cinza2.shape)

# Percorre canal a canal somando os valores das fatias
canais = 3
for c in range(canais):
  # Soma os valores dos dados do canal c
  cinza2 += matriz[:,:,c]
# Calcula a média
cinza2 /= canais

fim = time()

duracao_metodo2 = fim - inicio

#### **c. Usando funções que são capazes de atuar sobre os eixos do array**

In [None]:
inicio = time()

# No nosso caso: eixo 0 --> linhas, eixo 1 --> colunas e eixo 2 --> canais
cinza3 = np.mean(matriz, axis=2)

# Manteremos o print para que haja a mesma quantidade de I/0 do método anterior
print(cinza3.shape)

fim = time()

duracao_metodo3 = fim - inicio

#### **d. Comparando resultados**

Primeiramente, vamos garantir que as três operações produziram o mesmo resultado. Vamos utilizar RMSE para comparação. Se der zero ou muito próximo de zero, os métodos se equivalem.

In [None]:
def rmse(arr1, arr2):
  return np.sqrt(np.sum((arr1 - arr2)**2))

In [None]:
# Comparando os dois primeiros métodos
difA = rmse(cinza1, cinza2)

# Comparando os dois últimos métodos
difB = rmse(cinza2, cinza3)

print('%.6f e %.6f' % (difA, difB))

Se $dif(A,B) = 0$ e $dif(B,C) = 0$, então $dif(A,C) = 0$. Portanto, os métodos se equivalem e produzem os mesmos resultados.

Verificaremos, agora, os tempos de execução.

In [None]:
print('Acesso pixel a pixel: %.4fs' % duracao_metodo1)
print('    Acesso às fatias: %.4fs' % duracao_metodo2)
print('       Usando função: %.4fs' % duracao_metodo3)

Não há diferenças significativas entre a segunda e a terceira abordagens.

#### **Observações:**

1. Diversas funções `numpy` podem ser acessadas de forma independente ou diretamente a partir do array. Ex.:
  - `np.mean(a)` ou `a.mean()`, onde `a` é um array numpy
  - `np.reshape(a, forma)` ou `a.reshape(forma)`, onde `forma` é uma tupla contendo o novo formato

2. Tenha cuidado ao trabalhar com as funções que admitem operar sobre os eixos de um array, pois o uso equivocado pode produzir resultados inesperados. Veja exemplos na célula a seguir:

In [None]:
print('Formato da matriz original:', matriz.shape)

# calcula a média de TODOS os valores da matriz, produzindo um único resultado (escalar)
m1 = matriz.mean() # equivale a: m1 = np.mean(matriz)

print('Média de todos os dados da matriz (m1): %.4f' % m1)
print('Formato de m1:', m1.shape)

# atuando no eixo 0
m2 = matriz.mean(axis=0) # equivale a: m2 = np.mean(matriz, axis=0)
print('Formato de m2 (eixo 0):', m2.shape)

# atuando no eixo 1
m3 = matriz.mean(axis=1) # equivale a: m3 = np.mean(matriz, axis=1)
print('Formato de m3 (eixo 1):', m3.shape)

# atuando no eixo 2
m4 = matriz.mean(axis=2) # equivale a: m4 = np.mean(matriz, axis=2)
print('Formato de m4 (eixo 2):', m4.shape)
print()

# valor médio de cada canal:
passo1 = matriz.mean(axis=0)
print('Passo 1:', passo1.shape)

passo2 = passo1.mean(axis=0)
print('Passo 2:', passo2.shape)

# De forma compacta:
mediaRGB = matriz.mean(axis=0).mean(axis=0)
print('Valores médios em cada canal:', mediaRGB)
print('Valores Arredondados:', mediaRGB.round())
print('Conferindo: %.4f' % mediaRGB.mean())

#### **Transposição**

Já vimos que o atributo `T` dos arrays numpy entregam a transposta de uma matriz. Mas em matrizes com mais de 2 dimensões, isso pode trazer resultados difíceis de controlar:

In [None]:
print(matriz.shape)
print(matriz.T.shape)

Uma alternativa flexível é utilizar a função `np.transpose`, onde existe um parâmetro `axes`, pelo qual se informa a nova ordem desejada dos eixos:

In [None]:
transp = np.transpose(matriz, axes=(1,0,2)) # invertendo linhas com colunas
print(matriz.shape)
print(transp.shape)
transp = np.transpose(matriz, axes=(1,2,0)) # outra inversão qualquer
print(transp.shape)

#### **Lidando com filtros**

Pode-se utilizar o recurso de filtro para atuar apenas em certos elementos de um array.

Na realidade, isto é atingido trabalhando-se com arrays de valores booleanos sendo passados como índices do array sobre o qual se deseja aplicar o filtro:

In [None]:
# Retomando a matriz X, pequena
print(X, end='\n\n')

# Produzindo uma matriz booleana
Y = X > 5

print(X.shape, Y.shape, end='\n\n')

print(Y, end='\n\n')

# Filtrando
F = X[Y]

print(F.shape, end='\n\n')
print(F)

Aplicando-se diretamente a noção de filtro:

In [None]:
F = X[X > 5]

print(F.shape, end='\n\n')
print(F)

Operações envolvendo array filtrados só funcionarão se os operandos possuírem formas compatíveis:

In [None]:
# Produzindo um outro array para operar com X
Y = X / 2

print(Y, end='\n\n')

Note, abaixo, que ao utilizarmos o mesmo filtro em amobs casos, estamos atuando sobre as mesmas posições dos arranjos envolvidos, uma vez que X e Y possuem o mesmo formato:

In [None]:
print(X[X > 5], end='\n\n')
print(Y[X > 5], end='\n\n')

Produzindo um resultado:

In [None]:
F = X[X > 5] + Y[X > 5]
print(F.shape, end='\n\n')
print(F)

Note, ainda, que pode-se filtrar também sobre o array que receberá o resultado:

In [None]:
# Produzindo um array preenchido com zeros e a mesma forma de X
F = np.zeros_like(X)

# Aplicando o filtro a todos arrays envolvidos
F[X > 5] = X[X > 5] + Y[X > 5]

print(F.shape, end='\n\n')
print(F)

Pode-se, ainda, combinar múltiplas condições para aplicação de filtros. Vamos considerar os arrays booleanos a seguir:

In [None]:
A = (X >= 5)
B = (Y >= 5)

print(A, end='\n\n')
print(B, end='\n\n')

As operações lógicas sobre arrays booleanos não são diretas como nos dados primitivos:

In [None]:
# Descomente a linha abaixo e veja que uma exceção é lançada
# print(A and B)

Para isso, essencialmente, devemos escolher se uma operação lógica entre arrays booleanos é satisfeita se:

- Pelo menos um par de elementos atende à operação
- Todos pares de elementos atendem à operação

In [None]:
# Pelo menos um (any):

print(A.any() and B)
# A linha abaixo produz erro (lança exceção)
# print(A and B.any())
print(A.any() and B.any())

In [None]:
# Todos (all):

print(A.all() and B)
# A linha abaixo produz erro (lança exceção)
# print(A and B.all())
print(A.all() and B.all())

In [None]:
# Mesclando:
print(A.any() and B.all())
print(A.all() and B.any())

- `any()` e `all()` também aceitam operação sobre eixos (parâmetro `axis`)
- `any()` e `all()` também podem ser evocados sem ser via array, como `np.all()` ou `np.any()`

No entanto, há um análogo às operações bit a bit nos arrays numpy. Ao invés de chamarmos de *bitwise*, chamamos de *element-wise*:

In [None]:
print('A')
print(A, end='\n\n')
print('B')
print(B, end='\n\n')

# Ou element-wise
C = A | B
print('A | B')
print(C, end='\n\n')

# E element-wise
C = A & B
print('A & B')
print(C, end='\n\n')

Desta forma, podemos fazer operações como:

In [None]:
F = np.zeros_like(X)

print(X > 5, end='\n\n')

print(Y <= 4, end='\n\n')

F[(X > 5) & (Y <= 4)] = 50

print(F)

#### **Aplicação 1**

Vamos juntar boa parte do que vimos até aqui em uma aplicação:

In [None]:
# Abre a imagem ipe_amarelo.jpg e extrai seu array de dados
img = Image.open(path + 'ipe_amarelo.jpg')
arr = np.asarray(img).astype(int)

# Calculando o valor médio em cada canal
medias = arr.mean(axis=0).mean(axis=0)

# Criando uma imagem toda preta
arrFiltro = np.zeros_like(arr)

# Verificando os pixels onde todos os valores dos canais estão
# abaixo da média do canal correspondente
testeR = arr[:,:,0] < medias[0]
testeG = arr[:,:,1] < medias[1]
testeB = arr[:,:,2] < medias[2]
teste = testeR & testeG & testeB

# Copia somente aquelas posições para a imagem de resposta
arrFiltro[teste] = arr[teste]

imgFiltro = Image.fromarray(arrFiltro.astype(np.uint8))
display(img)
display(imgFiltro)

#### **Aplicação 2: brilho seletivo**

In [None]:
# Percentual de aumento/diminuição e tipo de efeito
fator = 0.2
claro = False

# Fator de redução de brilho
fatorBrilho = round(fator*(arr.max() - arr.min()))
operacao = 'aumento' if claro else 'redução'
print('Usando fator de %s de brilho de %d' % (operacao, fatorBrilho))

# Calculando o valor médio e o desvio padrão em cada canal
medias = arr.mean(axis=0).mean(axis=0)

# Criando uma imagem toda preta
arrFiltro = np.zeros_like(arr)

# Verificando os pixels onde todos os valores dos canais estão
# abaixo da média do canal correspondente
testeR = arr[:,:,0] < medias[0]
testeG = arr[:,:,1] < medias[1]
testeB = arr[:,:,2] < medias[2]
teste = testeR & testeG & testeB

# Clareia/copia somente aquelas posições para a imagem de resposta
if claro:
  arrFiltro[teste] = arr[teste] + fatorBrilho
else:
  arrFiltro[teste] = arr[teste]

# Verificando os pixels onde pelo menos um dos valores dos canais estão
# a partir do valor médio do canal
testeR = arr[:,:,0] >= medias[0]
testeG = arr[:,:,1] >= medias[1]
testeB = arr[:,:,2] >= medias[2]
teste = testeR | testeG | testeB

# Copia/escurece somente aquelas posições para a imagem de resposta
if claro:
  arrFiltro[teste] = arr[teste]
else:
  arrFiltro[teste] = arr[teste] - fatorBrilho

# Prepara o array pra imagem
arrFiltro = arrFiltro.round() # Arredonda entradas
arrFiltro = arrFiltro.clip(0, 255) # Poda os valores entre 0 e 255

imgFiltro = Image.fromarray(arrFiltro.astype(np.uint8))
display(img)
display(imgFiltro)

#### **Considerações Finais**

- A biblioteca `numpy` é bastante poderosa e este documento cobriu apenas um pequeno recorte das possibilidades. Para saber mais, consulte a [documentação oficial](https://numpy.org/). Há **MUITO** mais material lá para ser explorado.
- Existem também subbibliotecas inteiras temáticas dentro da `numpy`, como a `numpy.linalg`, que possui bastante recursos úteis para manipulação de matrizes como, pra citar apenas um exemplo, um método para inversão de matrizes (usamos na conversão YIQ --> RGB)