In [None]:
import numpy as np

# Acessando e manipulando arrays

No notebook anterior, exploramos a criação de arrays NumPy. Agora vamos
aprender como acessar e manipular elementos dentro de arrays, e também
como extrair elementos específicos de arrays.

## $ \S 1 $ Acessando e modificando elementos individuais de arrays

Lembre-se que listas em Python são __mutáveis__, o que significa que podemos modificar
os elementos individuais de uma lista:

In [None]:
primes = [199, 1_999, 19_999]
primes[2] = 19
print(primes)

Em contraste, uma tupla em Python é __imutável__. Ainda podemos acessar seus
elementos através de `[]`, mas não podemos modificá-los:

In [None]:
fruits = ('🍎', '🍊', '🍍')
print(fruits[0])

In [None]:
fruits[0] = '🍉'

Arrays NumPy também são mutáveis, como listas. Considere o seguinte vetor $ \mathbf{a} $:

In [None]:
a = np.array([1, 2, 3])
print(a)

Para acessar ou modificar o elemento $ 0 $ de $ \mathbf a $ (lembre-se que sempre
contamos a partir de $ 0 $ em Python), usamos a mesma sintaxe que usaríamos se fosse uma
lista:

In [None]:
print(a[0])  # Acessa o elemento 0 de `a`
a[0] = -1    # Modifica este elemento
print(a)     # Imprime o resultado

Se estamos lidando com um array $ 2D $, usamos `[i, j]` para acessar sua entrada $ (i, j)
$, ou seja, o elemento na linha $ i $ e coluna $ j $.

__Exercício:__ Modifique os elementos fora da diagonal na seguinte matriz $ A $ para
transformá-la na matriz identidade $ 2 \times 2 $.

In [None]:
A = np.ones((2, 2))
print("Antes das modificações:")
print(A, '\n')

# ...
# ...
print("Depois das modificações:")
print(A)

Em geral, ao lidar com um array de $ n $ dimensões, use
`[k_1, k_2, ..., k_n]` para acessar o elemento com índices
$ k_1, k_2, \cdots, k_n $, respectivamente.

__Exercício:__ Construa um array identidade $ 3D $ $ M $ de formato $ (5, 5, 5) $ primeiro
preenchendo-o com zeros, depois definindo todos os elementos cujos índices
têm a forma $ (i, i, i) $ como $ 1 $ das seguintes duas maneiras: 

(a) Usando um loop `for`.

(b) Com uma única chamada `fill_diagonal(M, 1)`.

In [None]:
# Preencha M com zeros:
# M = ...

# Defina os elementos diagonais como 1:
# ...

# Imprima o resultado:
# print(M)


Assim como as listas Python, os arrays NumPy suportam indexação negativa. O índice $ -1 $
refere-se ao último elemento, $ -2 $ ao penúltimo, e assim por diante:

__Exercício:__ Modifique a última coordenada do vetor
$ \mathbf{v} \in \mathbb{R}^6 $ abaixo para que seu comprimento se torne $ 3 $. _Dica:_
Lembre-se que a norma (comprimento) de um vetor $ \mathbf{v} = (v_1, v_2, \cdots, v_n) $
em $ \mathbb{R}^n $ é dada por $ \sqrt{v_1^2 + v_2^2 + \cdots + v_n^2} $.

In [None]:
v = np.array([1, 1, 1, 1, 1, 1])

print(f"Vetor: {v}")
print(f"Norma de v = {np.linalg.norm(v):.3f}")

A indexação negativa também funciona com arrays multidimensionais:

In [None]:
A = np.array([[1, 2, 3],
              [4, 5, 6],
              [7, 8, 9]])

print(A[-1, -1])  # Elemento inferior direito (valor: 9)
print(A[-2, -3])  # Elemento na penúltima linha, antepenúltima coluna (valor: 4)

__Exercício:__ Dado o array $ 3D $ abaixo, acesse e imprima:

(a) O elemento na posição $ (0, 1, 1) $.

(b) O último elemento de todo o array.

(c) O elemento na linha $ 0 $, coluna $ 1 $ da "camada" $ 2 $.

In [None]:
B = np.array([[[1, 2], [3, 4]], 
              [[5, 6], [7, 8]], 
              [[9, 10], [11, 12]]])
print(B)
# (a)

# (b)

# (c)

## $ \S 2 $ Fatiando arrays $ 1D $

__Fatiamento__ é uma operação que nos permite extrair um subarray de um array.
A sintaxe para arrays $ 1D $ é exatamente a mesma que para fatias de listas Python,
ou seja, `a[start:stop:step]`, onde `a` denota um array e:

* `start` é o índice onde a fatia começa (incluído).
* `stop` é o índice onde a fatia termina (excluído).
* `step` é o tamanho do passo entre elementos.

Se qualquer um desses for omitido, eles assumem seus limites naturais (início do
array, fim do array e tamanho do passo $ 1 $).

__Exercício:__ Seja $ \mathbf a = (0, 1, \cdots, 10) $.

(a) Instancie este array usando `arange` ou com `linspace` junto com a instrução `a.astype(int)`.

(b) Faça uma fatia de $ \mathbf a $ resultando em $ (0, 1, \cdots, 4) $.

(c) Faça uma fatia de $ \mathbf a $ para obter o array $ (5, 6, \cdots, 10) $.

(d) Construa uma fatia para recuperar o subarray $ (3, 5, 7, 9) $.

(e) Obtenha um novo array consistindo de todos os elementos de $ \mathbf a $ em ordem inversa.

(f) Faça uma fatia completa de $ \mathbf a $, chame-a de $ \mathbf b $, e modifique seu elemento $ 0
$. $ \mathbf a $ é afetado?

Como visto no exercício anterior, _fatiar um array apenas cria uma visão do
array original, não uma cópia_. Uma __visão__ é um novo objeto array que se refere
aos mesmos dados do array original. Isso significa que:
* Mudanças feitas através da visão afetam o array original, e vice-versa.
* Nenhuma duplicação de memória ocorre ao criar uma visão.

Este comportamento é intencional, por razões de eficiência.

In [None]:
a = np.array([1, 2, 3, 4, 5])
b = a[1:4]  # Isso cria uma visão, não uma cópia
print("Original a:", a)
print("Visão b:      ", b)

b[0] = 8  # Modificando a visão
print("Depois de modificar b, a se torna:", a)

📝 Para criar uma cópia em vez de uma visão no NumPy, use o método `copy()`:

In [None]:
a = np.array([1, 2, 3, 4, 5])
c = a.copy()  # Isso cria uma cópia explícita
c[1] = 8

print("Cópia c:    ", c)
print("Original a:", a)  # Permanece inalterado

__Exercício:__ Crie um vetor $ \mathbf{a} = (1, 2, 3) $ e uma fatia completa $
\mathbf{b} $ de $ \mathbf{a} $. Verifique se $ \mathbf{a} $ e
$ \mathbf{b} $ apontam para os mesmos dados com `np.shares_memory(a, b)`.

⚠️⚡ Note que, em contraste, fatias de listas ou tuplas Python _são_ cópias
independentes de seus originais. No entanto, estas são cópias _rasas_: apenas
os contêineres em si são cópias, não seus elementos. Isso pode levar a
comportamentos inesperados, como no exemplo a seguir:

In [None]:
original = [[1, 2, 3], [4, 5, 6]]
shallow_1 = original[:]
shallow_2 = original[:]

shallow_1[0] = [-1, -2, -3]
print(original)  # original não é afetado

shallow_2[0][0] = 8
print(original)  # original é afetado!

## $ \S 3 $ Fatiando arrays gerais

O fatiamento se torna mais interessante com arrays de dimensões superiores. Para um array $ 2D $,
em princípio precisamos especificar fatias para ambas as dimensões, separadas por
uma vírgula. Se usarmos uma única fatia, então estamos indexando linhas completas.

In [None]:
M = np.array([[1, 2, 3],
              [4, 5, 6],
              [7, 8, 9]])
print(M, '\n')

# Acessando uma linha específica:
print(M[1, :], '\n')  # "Primeira" linha

# Acessando uma coluna específica:
print(M[:, 2], '\n')  # "Segunda" coluna

# Fatiamento de sub-array:
print(M[0:2, 1:3], '\n')  # Sub-array 2x2 superior direito

# Se usarmos apenas uma fatia, então linhas inteiras são extraídas:
print(M[0:2])  # Primeiras 2 linhas

__Exercício:__ 
Dada a matriz $ 3 \times 4 $ abaixo, use fatiamento para extrair:


<img src="notebook_2_slicing.png" alt="Exercício de fatiamento" width="870" height="174">

(a) As duas primeiras linhas.

(b) As duas últimas colunas.

(c) Uma submatriz $ 2 \times 2 $ contendo os elementos na interseção das
    duas últimas linhas e das duas primeiras colunas.

In [None]:
M = np.array([[1, 2, 3, 4],
              [5, 6, 7, 8],
              [9, 10, 11, 12]])
# (a)

# (b)

# (c)

Todos os princípios que vimos se estendem a arrays de dimensões superiores.

__Exercício:__ Considere um array $ 3D $ representando uma imagem RGB de formato
$ (3, \text{altura}, \text{largura}) $. Escreva fatias para:

(a) Extrair apenas o canal verde (índice $ 1 $ na dimensão $ 0 $).

(b) Extrair a parte central da imagem (um retângulo com metade da altura e
    metade da largura da imagem original). _Dica:_ Use o intervalo
    $$ \texttt{[altura // 4 : (3 * altura) // 4]} $$
    para fatiar a dimensão da altura e similarmente para a largura.

(c) Reduzir a amostragem da imagem pegando cada segundo pixel em ambas as dimensões de altura e
    largura, como no exemplo (exagerado) abaixo.

<p align="center">
  <img src="notebook_2_panda_hi.JPG" width="40%" />
  <img src="notebook_2_panda_lo.JPG" width="40%" />
</p>

In [None]:
# Vamos criar uma imagem aleatória com 3 canais (R, G e B)
# com 8 bits = 256 valores por canal (intensidades de cor entre 0 e 255):
image = rng.integers(0, 256, size=(3, 1280, 720))
# (a)

# (b)

# (c)

## $ \S 4 $ Outros tipos de indexação

Vamos agora considerar alguns mecanismos adicionais de indexação que permitem
seleções e manipulações mais flexíveis de arrays.

### $ 4.1 $ Indexação por array de inteiros

__Indexação por array de inteiros__ (também conhecida como __indexação sofisticada__) é muito simples
apesar de seu nome; permite-nos usar arrays de índices para
selecionar elementos:

In [None]:
a = np.array([0, 10, 20, 30, 40])
indices = np.array([0, 2, 3])  # Selecionar elementos nos índices 0, 2 e 3
print(a[indices])

Também podemos fornecer os índices a serem selecionados na forma de listas ou tuplas
(em vez de arrays). Além disso, para arrays multidimensionais, podemos selecionar
combinações específicas de linhas e colunas. No exemplo a seguir
ilustramos ambos os pontos:

In [None]:
A = np.array([[1, 2, 3],
              [4, 5, 6],
              [7, 8, 9]])

# Selecionar elementos diagonais:
rows = [0, 1, 2]  # aqui estamos usando uma _lista_ (não array) de índices
cols = (0, 1, 2)  # aqui usamos uma _tupla_ de índices
print(A[rows, cols])  # elementos diagonais de A

Observe como os índices para as linhas e colunas são emparelhados em ordem, em vez de
serem combinados de todas as formas possíveis.

__Exercício:__ Para a mesma matriz $ A $ acima, use indexação por array de inteiros
para selecionar os elementos na anti-diagonal.

In [None]:
# Selecionar elementos (0,2), (1,1), (2,0) (a anti-diagonal):
rows = # ...
cols = # ...
print(A[rows, cols])

__Exercício:__ Dada a matriz $ 4 \times 4 $ abaixo, use indexação por array de inteiros
para:

(a) Extrair os quatro elementos dos cantos.

(b) Extrair os elementos em ambas as diagonais (diagonal principal e anti-diagonal).

In [None]:
M = np.array([[1, 2, 3, 4],
              [5, 6, 7, 8],
              [9, 10, 11, 12],
              [13, 14, 15, 16]])
print(M)
# (a)

# (b)

### $ 4.2 $ Combinando diferentes tipos de índices

Podemos misturar diferentes tipos de índices (fatias, inteiros, arrays) para criar
seleções mais complexas. Considere a seguinte matriz $ M $:

In [None]:
M = np.array([[1, 2, 3, 4],
              [5, 6, 7, 8],
              [9, 10, 11, 12],
              [13, 14, 15, 16]])
print(M)

Uma alternativa é especificar uma lista dos índices que queremos indexar
para algumas das dimensões. Isso nos permite capturar conjuntos de índices que não
seguem o padrão de uma fatia.

In [None]:
# Selecionar linhas 0, 1 e 3, todas as colunas:
print(M[[0, 1, 3], :])

In [None]:
# Selecionar todas as linhas, colunas 1 e 3:
print(M[:, [1, 3]])

Se em vez de usar uma fatia ou lista de índices, especificarmos um único índice para
alguma dimensão, então essa dimensão "colapsa". Em particular, o array resultante
terá um posto menor. Isso é ilustrado pelo seguinte exemplo:

In [None]:
# Extraindo a linha 1 através de uma fatia dupla:
print(M[1:2, :])  # O resultado ainda é um array 2D

# Extraindo a linha 1 indexando-a diretamente:
print(M[1, :])  # O resultado é um array 1D

__Exercício:__ Crie um array $ 2D $ de formato $ (4, 4) $ preenchido com
inteiros aleatórios e imprima-o como referência.

(a) Extraia a última linha para produzir um array $ 1D $.

(b) Extraia a última coluna, como um array $ 2D $.

(c) Extraia um sub-array $ 2\times 2 $ do centro deste array.

(d) Extraia o canto inferior esquerdo $ 3 \times 2 $ do array.

(e) Extraia o subarray consistindo de colunas indexadas por $ 1 $ e $ 3 $
    de duas maneiras: usando uma fatia com tamanho de passo $ 2 $ e usando uma lista de
    índices.

## $ \S 5 $ Indexação booleana

### $ 5.1 $ Criando máscaras booleanas e filtrando arrays com máscaras

__Indexação booleana__ é um recurso poderoso que nos permite selecionar elementos
de um array com base em _condições_ em vez de índices.
* Primeiro criamos uma __máscara booleana__, ou seja, um array de valores `True` e `False`,
  tendo o mesmo formato que o array original.
* Então usamos essa máscara para filtrar aqueles elementos do nosso array onde a máscara
  é `True`.

Aqui está um exemplo onde desejamos extrair todos os componentes de um array que
são maiores que $ 2 $:

<img src="notebook_2_boolean_indexing.png" alt="Indexação booleana" width="796" height="131">

In [None]:
v = np.array([5, 1, 3, 2, 4])
print("Array original:", v)

# Criar uma máscara booleana:
mask = v > 2
print("Filtro: ", mask)

# Usar indexação booleana para filtrar os elementos maiores que 2:
selected_elements = v[mask]
print("Elementos selecionados:", selected_elements)

📝 No NumPy, e em Python em geral, `True` é tratado como
equivalente a $ 1 $ em contextos numéricos e `False` é equivalente a
$ 0 $. Assim, no exemplo anterior, podemos calcular o número de elementos
maiores que $ 2 $ tomando a soma das entradas na máscara (voltaremos
à função `np.sum` mais tarde):

In [None]:
print("# de elementos maiores que dois:", np.sum(filter))

A indexação booleana é particularmente útil para limpeza de dados. Também podemos filtrar
elementos em uma única etapa; esta sintaxe é muito comum no ecossistema NumPy,
embora possa parecer um pouco estranha quando a encontramos pela primeira vez:

In [None]:
u = np.array([-3, 3, -2, 2, -1, 1, 0])
result = u[u <= 0]
print(result)

__Exercício:__ Considere a matriz $ A $ dada abaixo.

(a) Extraia seus elementos que são $ \ge 2 $ usando indexação booleana.

(b) Qual é o formato da sua máscara? Qual é o formato do array resultante? Em
    que ordem os elementos são filtrados?

In [None]:
A = rng.integers(0, 5, size=(3, 4))
print(A)

📝 Ao usar indexação booleana em um array multidimensional, o resultado é
sempre um array $ 1D $ contendo os elementos onde a máscara é verdadeira.

⚠️ A indexação booleana sempre gera um novo array, mesmo quando o resultado é idêntico ao array original. Portanto, deve ser usada com cautela em dados muito grandes.

In [None]:
v = np.array([1, 2, 3, 4, 5])
u = v[v > 0]  # Filtra os elementos de v > 0, que acontece de ser todo o v

# Verificando os endereços de memória de u e v para ver se coincidem:
print(id(u))
print(id(v))

### $ 5.2 $ Combinando operações booleanas

Podemos criar máscaras mais complexas usando os operadores booleanos familiares
__negação__, __e__, __ou__ e __ou exclusivo__ (__xor__). No entanto, as versões em Python
dos três primeiros, `not`, `and`, `or`, respectivamente, não funcionam com
arrays booleanos. Em vez disso, devemos usar `~`, `&` e `|`, respectivamente. O
operador xor é denotado por `^`. Suas tabelas-verdade são dadas abaixo.

<img src="notebook_2_truth_tables.png" alt="Tabelas de verdade" width="752" height="168">

In [None]:
a = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9])

# Selecionar elementos maiores que 2 E menores que 7:
print(a[(a > 2) & (a < 7)])  # Resultado: [3, 4, 5, 6]

# Selecionar elementos menores que 3 OU maiores que 7:
print(a[(a < 3) | (a > 7)])  # Resultado: [1, 2, 8, 9]

# Negar uma condição com ~:
print(a[~(a % 3 == 0)])  # Selecionar números NÃO divisíveis por 3: [1, 2, 4, 5, 7, 8]

# Extrair todos os números que são múltiplos de 2 OU 3, mas NÃO múltiplos de 6:
print(a[(a % 2 == 0) ^ (a % 3 == 0)])

📝 Certifique-se de colocar parênteses em torno de cada condição ao combiná-las.

__Exercício:__ Dado o array abaixo, use indexação booleana para extrair:

(a) Números que são positivos e pares.

(b) Números que são negativos ou maiores que $ 20 $.

(c) Números que são divisíveis por $ 3 $ ou positivos, mas não ambos.

In [None]:
data = np.array([15, 23, -10, 0, 42, -7, 8, 12, -25, 30])
# (a)

# (b)

# (c)

### $ 5.3 $ A função `where`

A função `np.where` serve a dois propósitos principais. Quando chamada com um
único argumento como `np.where(condition)`, o resultado consiste nos
_índices_ onde essa condição é verdadeira. Isso fornece uma maneira poderosa de localizar
elementos de interesse dentro de um array.

In [None]:
A = np.array([[1, 2, 4], 
              [5, -3, 9],
              [-7, 6, -8]])

negative_indices = np.where(A < 0)
print("Indices of negative elements:", negative_indices)

Indices of negative elements: (array([1, 2, 2]), array([1, 0, 2]))


Neste exemplo, observe que o primeiro array na tupla fornece os índices das linhas e
o segundo os índices das colunas dos elementos negativos em $ A $. Quando
pareamos esses índices em ordem, obtemos as coordenadas desses elementos dentro de
$ A $, por exemplo, a entrada `A[2, 0]` é $ -7 $. Se quisermos os próprios elementos
para os quais a condição é válida, podemos então usar esses índices exatamente como em $ \S 4.1 $:

In [9]:
print("Negative elements in A: ", A[negative_indices])

Negative elements in A:  [-5 -7 -9]


📝 Na versão de parâmetro único do `where`, o argumento deve ser um array booleano, e o resultado
serão simplesmente as posições (índices) dos elementos que são `True`.

__Exercício:__ Referindo-se à mesma matriz $ A $ acima:

(a) Determine os índices de linha e coluna dos elementos em $ A $
que deixam um resto de $ 1 $ quando divididos por $ 3 $.

(b) Use os índices obtidos em (a) para construir um array consistindo dos
elementos de $ A $ que satisfazem a condição estabelecida.

Para ilustrar o segundo uso da função `where`, considere o seguinte array simples.

In [2]:
numbers = np.array([1, 2, -3, 4, -5, 6, -7, 8])
print(numbers)

[ 1  2 -3  4 -5  6 -7  8]


Suponha que queremos substituir por $ 0 $ aqueles elementos em `numbers` que são negativos.
Podemos fazer isso da seguinte forma:

In [4]:
# Substitui valores negativos por zeros, mantém valores positivos:
result = np.where(numbers > 0, numbers, 0)
print("After replacing negatives with zeros:", result)

After replacing negatives with zeros: [1 2 0 4 0 6 0 8]


Assim, na forma `np.where(condition, x, y)`, esta função pode funcionar como um
operador ternário vetorizado (semelhante ao `? :` em C), permitindo-nos fazer
escolhas elemento a elemento entre dois arrays com base em uma condição.

__Exercício:__ Suponha que estamos construindo um aplicativo de previsão do tempo. Precisamos
ser capazes de exibir as temperaturas em graus Fahrenheit ou Celsius
de acordo com o usuário ser dos EUA ou não. Use `where` para realizar
isso para o seguinte conjunto de $ 10 $ temperaturas:

In [None]:
# Array de temperaturas em Celsius:
celsius = np.array([20, 25, 30, 35, 40, 15, 10, 5, 0, -5])
# Array correspondente de temperaturas em Fahrenheit (F = C * 9/5 + 32):
fahrenheit = celsius * 9/5 + 32
# Máscara booleana que indica se o usuário é dos EUA (True) ou não (False):
is_us_visitor = np.array([True, True, False, False, True, False, True, True, False, True])

# Use np.where para exibir temperaturas em unidades apropriadas baseado na localização do visitante:
# display_temps = ???

print("Temperatures to display (F for US, C for others):\n", np.round(display_temps))

Temperatures to display (F for US, C for others):
 [ 68.  77.  30.  35. 104.  15.  50.  41.   0.  23.]
