In [None]:
import numpy as np

# Acessando e manipulando arrays

No notebook anterior, exploramos a cria√ß√£o de arrays NumPy. Agora vamos
aprender como acessar e manipular elementos dentro de arrays, e tamb√©m
como extrair elementos espec√≠ficos de arrays.

## $ \S 1 $ Acessando e modificando elementos individuais de arrays

Lembre-se que listas em Python s√£o __mut√°veis__, o que significa que podemos modificar
os elementos individuais de uma lista:

In [None]:
primes = [199, 1_999, 19_999]
primes[2] = 19
print(primes)

Em contraste, uma tupla em Python √© __imut√°vel__. Ainda podemos acessar seus
elementos atrav√©s de `[]`, mas n√£o podemos modific√°-los:

In [None]:
fruits = ('üçé', 'üçä', 'üçç')
print(fruits[0])

In [None]:
fruits[0] = 'üçâ'

Arrays NumPy tamb√©m s√£o mut√°veis, como listas. Considere o seguinte vetor $ \mathbf{a} $:

In [None]:
a = np.array([1, 2, 3])
print(a)

Para acessar ou modificar o elemento $ 0 $ de $ \mathbf a $ (lembre-se que sempre
contamos a partir de $ 0 $ em Python), usamos a mesma sintaxe que usar√≠amos se fosse uma
lista:

In [None]:
print(a[0])  # Acessa o elemento 0 de `a`
a[0] = -1    # Modifica este elemento
print(a)     # Imprime o resultado

Se estamos lidando com um array $ 2D $, usamos `[i, j]` para acessar sua entrada $ (i, j)
$, ou seja, o elemento na linha $ i $ e coluna $ j $.

__Exerc√≠cio:__ Modifique os elementos fora da diagonal na seguinte matriz $ A $ para
transform√°-la na matriz identidade $ 2 \times 2 $.

In [None]:
A = np.ones((2, 2))
print("Antes das modifica√ß√µes:")
print(A, '\n')

# ...
# ...
print("Depois das modifica√ß√µes:")
print(A)

Em geral, ao lidar com um array de $ n $ dimens√µes, use
`[k_1, k_2, ..., k_n]` para acessar o elemento com √≠ndices
$ k_1, k_2, \cdots, k_n $, respectivamente.

__Exerc√≠cio:__ Construa um array identidade $ 3D $ $ M $ de formato $ (5, 5, 5) $ primeiro
preenchendo-o com zeros, depois definindo todos os elementos cujos √≠ndices
t√™m a forma $ (i, i, i) $ como $ 1 $ das seguintes duas maneiras: 

(a) Usando um loop `for`.

(b) Com uma √∫nica chamada `fill_diagonal(M, 1)`.

In [None]:
# Preencha M com zeros:
# M = ...

# Defina os elementos diagonais como 1:
# ...

# Imprima o resultado:
# print(M)


Assim como as listas Python, os arrays NumPy suportam indexa√ß√£o negativa. O √≠ndice $ -1 $
refere-se ao √∫ltimo elemento, $ -2 $ ao pen√∫ltimo, e assim por diante:

__Exerc√≠cio:__ Modifique a √∫ltima coordenada do vetor
$ \mathbf{v} \in \mathbb{R}^6 $ abaixo para que seu comprimento se torne $ 3 $. _Dica:_
Lembre-se que a norma (comprimento) de um vetor $ \mathbf{v} = (v_1, v_2, \cdots, v_n) $
em $ \mathbb{R}^n $ √© dada por $ \sqrt{v_1^2 + v_2^2 + \cdots + v_n^2} $.

In [None]:
v = np.array([1, 1, 1, 1, 1, 1])

print(f"Vetor: {v}")
print(f"Norma de v = {np.linalg.norm(v):.3f}")

A indexa√ß√£o negativa tamb√©m funciona com arrays multidimensionais:

In [None]:
A = np.array([[1, 2, 3],
              [4, 5, 6],
              [7, 8, 9]])

print(A[-1, -1])  # Elemento inferior direito (valor: 9)
print(A[-2, -3])  # Elemento na pen√∫ltima linha, antepen√∫ltima coluna (valor: 4)

__Exerc√≠cio:__ Dado o array $ 3D $ abaixo, acesse e imprima:

(a) O elemento na posi√ß√£o $ (0, 1, 1) $.

(b) O √∫ltimo elemento de todo o array.

(c) O elemento na linha $ 0 $, coluna $ 1 $ da "camada" $ 2 $.

In [None]:
B = np.array([[[1, 2], [3, 4]], 
              [[5, 6], [7, 8]], 
              [[9, 10], [11, 12]]])
print(B)
# (a)

# (b)

# (c)

## $ \S 2 $ Fatiando arrays $ 1D $

__Fatiamento__ √© uma opera√ß√£o que nos permite extrair um subarray de um array.
A sintaxe para arrays $ 1D $ √© exatamente a mesma que para fatias de listas Python,
ou seja, `a[start:stop:step]`, onde `a` denota um array e:

* `start` √© o √≠ndice onde a fatia come√ßa (inclu√≠do).
* `stop` √© o √≠ndice onde a fatia termina (exclu√≠do).
* `step` √© o tamanho do passo entre elementos.

Se qualquer um desses for omitido, eles assumem seus limites naturais (in√≠cio do
array, fim do array e tamanho do passo $ 1 $).

__Exerc√≠cio:__ Seja $ \mathbf a = (0, 1, \cdots, 10) $.

(a) Instancie este array usando `arange` ou com `linspace` junto com a instru√ß√£o `a.astype(int)`.

(b) Fa√ßa uma fatia de $ \mathbf a $ resultando em $ (0, 1, \cdots, 4) $.

(c) Fa√ßa uma fatia de $ \mathbf a $ para obter o array $ (5, 6, \cdots, 10) $.

(d) Construa uma fatia para recuperar o subarray $ (3, 5, 7, 9) $.

(e) Obtenha um novo array consistindo de todos os elementos de $ \mathbf a $ em ordem inversa.

(f) Fa√ßa uma fatia completa de $ \mathbf a $, chame-a de $ \mathbf b $, e modifique seu elemento $ 0
$. $ \mathbf a $ √© afetado?

Como visto no exerc√≠cio anterior, _fatiar um array apenas cria uma vis√£o do
array original, n√£o uma c√≥pia_. Uma __vis√£o__ √© um novo objeto array que se refere
aos mesmos dados do array original. Isso significa que:
* Mudan√ßas feitas atrav√©s da vis√£o afetam o array original, e vice-versa.
* Nenhuma duplica√ß√£o de mem√≥ria ocorre ao criar uma vis√£o.

Este comportamento √© intencional, por raz√µes de efici√™ncia.

In [None]:
a = np.array([1, 2, 3, 4, 5])
b = a[1:4]  # Isso cria uma vis√£o, n√£o uma c√≥pia
print("Original a:", a)
print("Vis√£o b:      ", b)

b[0] = 8  # Modificando a vis√£o
print("Depois de modificar b, a se torna:", a)

üìù Para criar uma c√≥pia em vez de uma vis√£o no NumPy, use o m√©todo `copy()`:

In [None]:
a = np.array([1, 2, 3, 4, 5])
c = a.copy()  # Isso cria uma c√≥pia expl√≠cita
c[1] = 8

print("C√≥pia c:    ", c)
print("Original a:", a)  # Permanece inalterado

__Exerc√≠cio:__ Crie um vetor $ \mathbf{a} = (1, 2, 3) $ e uma fatia completa $
\mathbf{b} $ de $ \mathbf{a} $. Verifique se $ \mathbf{a} $ e
$ \mathbf{b} $ apontam para os mesmos dados com `np.shares_memory(a, b)`.

‚ö†Ô∏è‚ö° Note que, em contraste, fatias de listas ou tuplas Python _s√£o_ c√≥pias
independentes de seus originais. No entanto, estas s√£o c√≥pias _rasas_: apenas
os cont√™ineres em si s√£o c√≥pias, n√£o seus elementos. Isso pode levar a
comportamentos inesperados, como no exemplo a seguir:

In [None]:
original = [[1, 2, 3], [4, 5, 6]]
shallow_1 = original[:]
shallow_2 = original[:]

shallow_1[0] = [-1, -2, -3]
print(original)  # original n√£o √© afetado

shallow_2[0][0] = 8
print(original)  # original √© afetado!

## $ \S 3 $ Fatiando arrays gerais

O fatiamento se torna mais interessante com arrays de dimens√µes superiores. Para um array $ 2D $,
em princ√≠pio precisamos especificar fatias para ambas as dimens√µes, separadas por
uma v√≠rgula. Se usarmos uma √∫nica fatia, ent√£o estamos indexando linhas completas.

In [None]:
M = np.array([[1, 2, 3],
              [4, 5, 6],
              [7, 8, 9]])
print(M, '\n')

# Acessando uma linha espec√≠fica:
print(M[1, :], '\n')  # "Primeira" linha

# Acessando uma coluna espec√≠fica:
print(M[:, 2], '\n')  # "Segunda" coluna

# Fatiamento de sub-array:
print(M[0:2, 1:3], '\n')  # Sub-array 2x2 superior direito

# Se usarmos apenas uma fatia, ent√£o linhas inteiras s√£o extra√≠das:
print(M[0:2])  # Primeiras 2 linhas

__Exerc√≠cio:__ 
Dada a matriz $ 3 \times 4 $ abaixo, use fatiamento para extrair:


<img src="notebook_2_slicing.png" alt="Exerc√≠cio de fatiamento" width="870" height="174">

(a) As duas primeiras linhas.

(b) As duas √∫ltimas colunas.

(c) Uma submatriz $ 2 \times 2 $ contendo os elementos na interse√ß√£o das
    duas √∫ltimas linhas e das duas primeiras colunas.

In [None]:
M = np.array([[1, 2, 3, 4],
              [5, 6, 7, 8],
              [9, 10, 11, 12]])
# (a)

# (b)

# (c)

Todos os princ√≠pios que vimos se estendem a arrays de dimens√µes superiores.

__Exerc√≠cio:__ Considere um array $ 3D $ representando uma imagem RGB de formato
$ (3, \text{altura}, \text{largura}) $. Escreva fatias para:

(a) Extrair apenas o canal verde (√≠ndice $ 1 $ na dimens√£o $ 0 $).

(b) Extrair a parte central da imagem (um ret√¢ngulo com metade da altura e
    metade da largura da imagem original). _Dica:_ Use o intervalo
    $$ \texttt{[altura // 4 : (3 * altura) // 4]} $$
    para fatiar a dimens√£o da altura e similarmente para a largura.

(c) Reduzir a amostragem da imagem pegando cada segundo pixel em ambas as dimens√µes de altura e
    largura, como no exemplo (exagerado) abaixo.

<p align="center">
  <img src="notebook_2_panda_hi.JPG" width="40%" />
  <img src="notebook_2_panda_lo.JPG" width="40%" />
</p>

In [None]:
# Vamos criar uma imagem aleat√≥ria com 3 canais (R, G e B)
# com 8 bits = 256 valores por canal (intensidades de cor entre 0 e 255):
image = rng.integers(0, 256, size=(3, 1280, 720))
# (a)

# (b)

# (c)

## $ \S 4 $ Outros tipos de indexa√ß√£o

Vamos agora considerar alguns mecanismos adicionais de indexa√ß√£o que permitem
sele√ß√µes e manipula√ß√µes mais flex√≠veis de arrays.

### $ 4.1 $ Indexa√ß√£o por array de inteiros

__Indexa√ß√£o por array de inteiros__ (tamb√©m conhecida como __indexa√ß√£o sofisticada__) √© muito simples
apesar de seu nome; permite-nos usar arrays de √≠ndices para
selecionar elementos:

In [None]:
a = np.array([0, 10, 20, 30, 40])
indices = np.array([0, 2, 3])  # Selecionar elementos nos √≠ndices 0, 2 e 3
print(a[indices])

Tamb√©m podemos fornecer os √≠ndices a serem selecionados na forma de listas ou tuplas
(em vez de arrays). Al√©m disso, para arrays multidimensionais, podemos selecionar
combina√ß√µes espec√≠ficas de linhas e colunas. No exemplo a seguir
ilustramos ambos os pontos:

In [None]:
A = np.array([[1, 2, 3],
              [4, 5, 6],
              [7, 8, 9]])

# Selecionar elementos diagonais:
rows = [0, 1, 2]  # aqui estamos usando uma _lista_ (n√£o array) de √≠ndices
cols = (0, 1, 2)  # aqui usamos uma _tupla_ de √≠ndices
print(A[rows, cols])  # elementos diagonais de A

Observe como os √≠ndices para as linhas e colunas s√£o emparelhados em ordem, em vez de
serem combinados de todas as formas poss√≠veis.

__Exerc√≠cio:__ Para a mesma matriz $ A $ acima, use indexa√ß√£o por array de inteiros
para selecionar os elementos na anti-diagonal.

In [None]:
# Selecionar elementos (0,2), (1,1), (2,0) (a anti-diagonal):
rows = # ...
cols = # ...
print(A[rows, cols])

__Exerc√≠cio:__ Dada a matriz $ 4 \times 4 $ abaixo, use indexa√ß√£o por array de inteiros
para:

(a) Extrair os quatro elementos dos cantos.

(b) Extrair os elementos em ambas as diagonais (diagonal principal e anti-diagonal).

In [None]:
M = np.array([[1, 2, 3, 4],
              [5, 6, 7, 8],
              [9, 10, 11, 12],
              [13, 14, 15, 16]])
print(M)
# (a)

# (b)

### $ 4.2 $ Combinando diferentes tipos de √≠ndices

Podemos misturar diferentes tipos de √≠ndices (fatias, inteiros, arrays) para criar
sele√ß√µes mais complexas. Considere a seguinte matriz $ M $:

In [None]:
M = np.array([[1, 2, 3, 4],
              [5, 6, 7, 8],
              [9, 10, 11, 12],
              [13, 14, 15, 16]])
print(M)

Uma alternativa √© especificar uma lista dos √≠ndices que queremos indexar
para algumas das dimens√µes. Isso nos permite capturar conjuntos de √≠ndices que n√£o
seguem o padr√£o de uma fatia.

In [None]:
# Selecionar linhas 0, 1 e 3, todas as colunas:
print(M[[0, 1, 3], :])

In [None]:
# Selecionar todas as linhas, colunas 1 e 3:
print(M[:, [1, 3]])

Se em vez de usar uma fatia ou lista de √≠ndices, especificarmos um √∫nico √≠ndice para
alguma dimens√£o, ent√£o essa dimens√£o "colapsa". Em particular, o array resultante
ter√° um posto menor. Isso √© ilustrado pelo seguinte exemplo:

In [None]:
# Extraindo a linha 1 atrav√©s de uma fatia dupla:
print(M[1:2, :])  # O resultado ainda √© um array 2D

# Extraindo a linha 1 indexando-a diretamente:
print(M[1, :])  # O resultado √© um array 1D

__Exerc√≠cio:__ Crie um array $ 2D $ de formato $ (4, 4) $ preenchido com
inteiros aleat√≥rios e imprima-o como refer√™ncia.

(a) Extraia a √∫ltima linha para produzir um array $ 1D $.

(b) Extraia a √∫ltima coluna, como um array $ 2D $.

(c) Extraia um sub-array $ 2\times 2 $ do centro deste array.

(d) Extraia o canto inferior esquerdo $ 3 \times 2 $ do array.

(e) Extraia o subarray consistindo de colunas indexadas por $ 1 $ e $ 3 $
    de duas maneiras: usando uma fatia com tamanho de passo $ 2 $ e usando uma lista de
    √≠ndices.

## $ \S 5 $ Indexa√ß√£o booleana

### $ 5.1 $ Criando m√°scaras booleanas e filtrando arrays com m√°scaras

__Indexa√ß√£o booleana__ √© um recurso poderoso que nos permite selecionar elementos
de um array com base em _condi√ß√µes_ em vez de √≠ndices.
* Primeiro criamos uma __m√°scara booleana__, ou seja, um array de valores `True` e `False`,
  tendo o mesmo formato que o array original.
* Ent√£o usamos essa m√°scara para filtrar aqueles elementos do nosso array onde a m√°scara
  √© `True`.

Aqui est√° um exemplo onde desejamos extrair todos os componentes de um array que
s√£o maiores que $ 2 $:

<img src="notebook_2_boolean_indexing.png" alt="Indexa√ß√£o booleana" width="796" height="131">

In [None]:
v = np.array([5, 1, 3, 2, 4])
print("Array original:", v)

# Criar uma m√°scara booleana:
mask = v > 2
print("Filtro: ", mask)

# Usar indexa√ß√£o booleana para filtrar os elementos maiores que 2:
selected_elements = v[mask]
print("Elementos selecionados:", selected_elements)

üìù No NumPy, e em Python em geral, `True` √© tratado como
equivalente a $ 1 $ em contextos num√©ricos e `False` √© equivalente a
$ 0 $. Assim, no exemplo anterior, podemos calcular o n√∫mero de elementos
maiores que $ 2 $ tomando a soma das entradas na m√°scara (voltaremos
√† fun√ß√£o `np.sum` mais tarde):

In [None]:
print("# de elementos maiores que dois:", np.sum(filter))

A indexa√ß√£o booleana √© particularmente √∫til para limpeza de dados. Tamb√©m podemos filtrar
elementos em uma √∫nica etapa; esta sintaxe √© muito comum no ecossistema NumPy,
embora possa parecer um pouco estranha quando a encontramos pela primeira vez:

In [None]:
u = np.array([-3, 3, -2, 2, -1, 1, 0])
result = u[u <= 0]
print(result)

__Exerc√≠cio:__ Considere a matriz $ A $ dada abaixo.

(a) Extraia seus elementos que s√£o $ \ge 2 $ usando indexa√ß√£o booleana.

(b) Qual √© o formato da sua m√°scara? Qual √© o formato do array resultante? Em
    que ordem os elementos s√£o filtrados?

In [None]:
A = rng.integers(0, 5, size=(3, 4))
print(A)

üìù Ao usar indexa√ß√£o booleana em um array multidimensional, o resultado √©
sempre um array $ 1D $ contendo os elementos onde a m√°scara √© verdadeira.

‚ö†Ô∏è A indexa√ß√£o booleana sempre gera um novo array, mesmo quando o resultado √© id√™ntico ao array original. Portanto, deve ser usada com cautela em dados muito grandes.

In [None]:
v = np.array([1, 2, 3, 4, 5])
u = v[v > 0]  # Filtra os elementos de v > 0, que acontece de ser todo o v

# Verificando os endere√ßos de mem√≥ria de u e v para ver se coincidem:
print(id(u))
print(id(v))

### $ 5.2 $ Combinando opera√ß√µes booleanas

Podemos criar m√°scaras mais complexas usando os operadores booleanos familiares
__nega√ß√£o__, __e__, __ou__ e __ou exclusivo__ (__xor__). No entanto, as vers√µes em Python
dos tr√™s primeiros, `not`, `and`, `or`, respectivamente, n√£o funcionam com
arrays booleanos. Em vez disso, devemos usar `~`, `&` e `|`, respectivamente. O
operador xor √© denotado por `^`. Suas tabelas-verdade s√£o dadas abaixo.

<img src="notebook_2_truth_tables.png" alt="Tabelas de verdade" width="752" height="168">

In [None]:
a = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9])

# Selecionar elementos maiores que 2 E menores que 7:
print(a[(a > 2) & (a < 7)])  # Resultado: [3, 4, 5, 6]

# Selecionar elementos menores que 3 OU maiores que 7:
print(a[(a < 3) | (a > 7)])  # Resultado: [1, 2, 8, 9]

# Negar uma condi√ß√£o com ~:
print(a[~(a % 3 == 0)])  # Selecionar n√∫meros N√ÉO divis√≠veis por 3: [1, 2, 4, 5, 7, 8]

# Extrair todos os n√∫meros que s√£o m√∫ltiplos de 2 OU 3, mas N√ÉO m√∫ltiplos de 6:
print(a[(a % 2 == 0) ^ (a % 3 == 0)])

üìù Certifique-se de colocar par√™nteses em torno de cada condi√ß√£o ao combin√°-las.

__Exerc√≠cio:__ Dado o array abaixo, use indexa√ß√£o booleana para extrair:

(a) N√∫meros que s√£o positivos e pares.

(b) N√∫meros que s√£o negativos ou maiores que $ 20 $.

(c) N√∫meros que s√£o divis√≠veis por $ 3 $ ou positivos, mas n√£o ambos.

In [None]:
data = np.array([15, 23, -10, 0, 42, -7, 8, 12, -25, 30])
# (a)

# (b)

# (c)

### $ 5.3 $ A fun√ß√£o `where`

A fun√ß√£o `np.where` serve a dois prop√≥sitos principais. Quando chamada com um
√∫nico argumento como `np.where(condition)`, o resultado consiste nos
_√≠ndices_ onde essa condi√ß√£o √© verdadeira. Isso fornece uma maneira poderosa de localizar
elementos de interesse dentro de um array.

In [None]:
A = np.array([[1, 2, 4], 
              [5, -3, 9],
              [-7, 6, -8]])

negative_indices = np.where(A < 0)
print("Indices of negative elements:", negative_indices)

Indices of negative elements: (array([1, 2, 2]), array([1, 0, 2]))


Neste exemplo, observe que o primeiro array na tupla fornece os √≠ndices das linhas e
o segundo os √≠ndices das colunas dos elementos negativos em $ A $. Quando
pareamos esses √≠ndices em ordem, obtemos as coordenadas desses elementos dentro de
$ A $, por exemplo, a entrada `A[2, 0]` √© $ -7 $. Se quisermos os pr√≥prios elementos
para os quais a condi√ß√£o √© v√°lida, podemos ent√£o usar esses √≠ndices exatamente como em $ \S 4.1 $:

In [9]:
print("Negative elements in A: ", A[negative_indices])

Negative elements in A:  [-5 -7 -9]


üìù Na vers√£o de par√¢metro √∫nico do `where`, o argumento deve ser um array booleano, e o resultado
ser√£o simplesmente as posi√ß√µes (√≠ndices) dos elementos que s√£o `True`.

__Exerc√≠cio:__ Referindo-se √† mesma matriz $ A $ acima:

(a) Determine os √≠ndices de linha e coluna dos elementos em $ A $
que deixam um resto de $ 1 $ quando divididos por $ 3 $.

(b) Use os √≠ndices obtidos em (a) para construir um array consistindo dos
elementos de $ A $ que satisfazem a condi√ß√£o estabelecida.

Para ilustrar o segundo uso da fun√ß√£o `where`, considere o seguinte array simples.

In [2]:
numbers = np.array([1, 2, -3, 4, -5, 6, -7, 8])
print(numbers)

[ 1  2 -3  4 -5  6 -7  8]


Suponha que queremos substituir por $ 0 $ aqueles elementos em `numbers` que s√£o negativos.
Podemos fazer isso da seguinte forma:

In [4]:
# Substitui valores negativos por zeros, mant√©m valores positivos:
result = np.where(numbers > 0, numbers, 0)
print("After replacing negatives with zeros:", result)

After replacing negatives with zeros: [1 2 0 4 0 6 0 8]


Assim, na forma `np.where(condition, x, y)`, esta fun√ß√£o pode funcionar como um
operador tern√°rio vetorizado (semelhante ao `? :` em C), permitindo-nos fazer
escolhas elemento a elemento entre dois arrays com base em uma condi√ß√£o.

__Exerc√≠cio:__ Suponha que estamos construindo um aplicativo de previs√£o do tempo. Precisamos
ser capazes de exibir as temperaturas em graus Fahrenheit ou Celsius
de acordo com o usu√°rio ser dos EUA ou n√£o. Use `where` para realizar
isso para o seguinte conjunto de $ 10 $ temperaturas:

In [None]:
# Array de temperaturas em Celsius:
celsius = np.array([20, 25, 30, 35, 40, 15, 10, 5, 0, -5])
# Array correspondente de temperaturas em Fahrenheit (F = C * 9/5 + 32):
fahrenheit = celsius * 9/5 + 32
# M√°scara booleana que indica se o usu√°rio √© dos EUA (True) ou n√£o (False):
is_us_visitor = np.array([True, True, False, False, True, False, True, True, False, True])

# Use np.where para exibir temperaturas em unidades apropriadas baseado na localiza√ß√£o do visitante:
# display_temps = ???

print("Temperatures to display (F for US, C for others):\n", np.round(display_temps))

Temperatures to display (F for US, C for others):
 [ 68.  77.  30.  35. 104.  15.  50.  41.   0.  23.]
