In [1]:
import numpy as np

# Atributos e m√©todos de arrays

Neste notebook, estudaremos os _atributos_ e _m√©todos_ fundamentais dos
arrays NumPy. Compreender as propriedades (_atributos_) dos arrays nos permitir√°
manipular dados com mais precis√£o, enquanto dominar as opera√ß√µes e
transforma√ß√µes (_m√©todos_) que podemos aplicar aos arrays nos permitir√°
analisar e reestruturar nossos dados com eleg√¢ncia.

## $ \S 1 $ Atributos de arrays

### $ 1.1 $ Forma e n√∫mero de dimens√µes

O __n√∫mero de dimens√µes__, tamb√©m conhecido como __rank__, de um array √© armazenado
em seu atributo `ndim`. Por exemplo, a seguinte matriz tem rank $ 2 $, porque
possui dois __eixos__, um correspondente √†s suas linhas e outro √†s suas colunas:

<img src="array.svg" width="500" alt="Exemplo de um array A">

In [11]:
A = np.array([[1, 2,  3,  4],
              [1, 4,  9, 16],
              [1, 8, 27, 64]])
print(A, '\n')

print(f"Number of dimensions (rank) of A: {A.ndim}")

[[ 1  2  3  4]
 [ 1  4  9 16]
 [ 1  8 27 64]] 

Number of dimensions (rank) of A: 2


Talvez a propriedade mais importante de um array seja sua **forma** (shape), que √© a
contagem de elementos ao longo de cada um de seus eixos. Referindo-se ao exemplo anterior, a
forma da nossa matriz $ A $ √© $ (3, 4) $, ou $ 3 \times 4 $, j√° que possui tr√™s
linhas e quatro colunas:

In [5]:
print(A.shape)

(3, 4)


üìù O n√∫mero de dimens√µes de um array √© um inteiro positivo, enquanto sua forma √© sempre uma tupla, mesmo quando o array √© unidimensional:

In [3]:
a = np.array([11, 13, 17])
print(a.shape)

print("Note that the shape is not '3', but rather the tuple '(3, )'")
print(type(a.shape))

(3,)
Note that the shape is not '3', but rather the tuple '(3, )'
<class 'tuple'>


O __tamanho__ (size) de um array √© simplesmente o n√∫mero total de elementos nele:

In [4]:
print(a.size)

3


__Exerc√≠cio:__ 

(a) Qual √© o tamanho da matriz $ A $ de forma $ (3, 4) $ que consideramos
acima?

(b) Quais s√£o o rank, a forma e o tamanho de um array $ 1D $ vazio? E de um
array $ 2D $ vazio?

__Exerc√≠cio:__ Se um array tem forma $ (2, 3, 4) $, qual √© seu tamanho? De forma mais geral, qual √© o tamanho de um array de forma $ (n_1, n_2, \cdots, n_d) $?

__Exerc√≠cio:__ Uma _matriz quadrada_ tem o mesmo n√∫mero de linhas e colunas.

(a) Escreva uma fun√ß√£o `is_square(A)` que aceite um array $ 2D $ como seu
argumento e retorne `True` ou `False` dependendo se a matriz dada √©
quadrada ou n√£o. _Dica:_ Use a forma para decidir isso.

(b) Como voc√™ generalizaria para arrays multidimensionais? Por exemplo, qual
seria uma defini√ß√£o razo√°vel de um array c√∫bico $ 3D $ e como poder√≠amos verificar isso?

### $ 1.2 $ Atributos e terminologia relacionada

Uma inst√¢ncia, ou __objeto__, de uma classe espec√≠fica, como o array $ A $ do tipo
`ndarray`, √© equipada com um conjunto de **atributos** predefinidos. Atributos s√£o 
_propriedades inerentes a cada inst√¢ncia da classe_.
O **estado** de um objeto √© _o conjunto de valores atuais de todos
os seus atributos._

üìù Para acessar um atributo `a` de um objeto `x`, a sintaxe √© sempre `x.a`.

Por exemplo, suponha que queremos projetar uma classe Python para representar carros.
Uma inst√¢ncia dessa classe corresponderia ent√£o a um carro espec√≠fico
no mundo real. Alguns atributos plaus√≠veis dessa classe poderiam ser:
* Sua cor (digamos, `color`, do tipo `str`).
* O ano em que foi fabricado (digamos, `year`, do tipo `int`).
* Se √© el√©trico ou n√£o (digamos, `electric`, do tipo `boolean`).
* A efici√™ncia de combust√≠vel do carro (digamos, `kilometers_per_liter`, do tipo `float`).

E assim por diante para qualquer outra propriedade relevante dos carros que possamos querer incluir
em nosso modelo. Observe que os valores desses atributos para diferentes inst√¢ncias de carro
ir√£o variar, em geral. No entanto, a partir deste exemplo, podemos facilmente imaginar
uma situa√ß√£o em que dois carros t√™m exatamente o mesmo estado, definido por seu
conjunto de valores de atributos, e ainda assim s√£o objetos distintos, ou seja, t√™m diferentes
_identidades_.

### $ 1.3 $ Os principais atributos de arrays

Embora os arrays venham com v√°rios atributos, a maioria deles est√° relacionada √† representa√ß√£o
interna do array ou a utilidades de baixo n√≠vel. Os cinco mais frequentemente usados e
conceitualmente importantes s√£o:

| Atributo    | Descri√ß√£o                                      | Tipo      |
|-------------|------------------------------------------------|-----------|
| `ndim`      | N√∫mero de dimens√µes (rank) do array        | `int`   |
| `shape`     | N√∫mero de elementos em cada eixo            | `tuple`     |
| `size`      | N√∫mero total de elementos no array         | `int`   |
| `dtype`     | Tipo de dados dos _elementos_ do array       | `dtype`  |
| `T`         | Transposta do array                       | `ndarray`    |


__Exerc√≠cio:__ Para os seguintes arrays $ A $, $ B $ e $ \mathbf v $:

(a) Verifique seus atributos. O tipo de dados de $ \mathbf v $ √© o que voc√™ esperava?

(b) Verifique se o tipo de cada atributo corresponde ao descrito na √∫ltima
coluna da tabela usando a fun√ß√£o embutida `type` do Python.

In [6]:
A = np.array([[1, 2, 3],
              [4, 5, 6],
              [7, 8, 9]])

In [None]:
B = np.array([[True, False, True],
              [False, True, False]])

In [None]:
v = np.array([1, 2, 3.])

### $ 1.4 $ O tipo de dados de um array

Os arrays NumPy s√£o projetados para armazenar elementos de um √∫nico tipo de dados, e _esses
tipos de dados s√£o espec√≠ficos do NumPy_. Muitos deles s√£o baseados nos tipos nativos do C.
Isso garante alto desempenho e uma pegada de mem√≥ria mais leve. Como exemplo, o
tipo de dados da matriz $ A $ acima √© `int64`, que representa inteiros usando $
64 $ bits. Em contraste, o tipo embutido do Python `int` pode conter inteiros
arbitrariamente grandes.

Tamb√©m √© poss√≠vel trabalhar
com arrays de objetos Python arbitr√°rios usando o tipo de dados `object`. Como
neste caso o que √© armazenado no array √© apenas uma refer√™ncia a cada objeto (n√£o
o pr√≥prio objeto), as entradas nem precisam ter o mesmo tipo Python:

In [13]:
complex_array = np.array(["pandas",  [1, 2, 3], {"name": "Alice"}], dtype=object)

for i, item in enumerate(complex_array):
    print(f"Item {i}: {item} (type: {type(item)})")

Para criar um array NumPy com um tipo de dados especificado, podemos usar o par√¢metro `dtype`
em qualquer fun√ß√£o de cria√ß√£o de array. Por exemplo:

In [5]:
v = np.array([1, 2, 3, 4], dtype="float32")
print(f"Datatype of v: {v.dtype}")
print(v, '\n')

U = np.ones((2, 3), dtype="bool")
print(f"Datatype of U: {U.dtype}")
print(U)

Datatype of v: float32
[1. 2. 3. 4.] 

Datatype of U: bool
[[ True  True  True]
 [ True  True  True]]


__Exerc√≠cio:__

(a) Crie um array $ 1D $ $ \mathbf{a} $ de tamanho $ 10 $ preenchido com zeros e tendo tipo de dados
    `int32`. _Dica:_ Use a fun√ß√£o `zeros`.

(b) Instancie $ \mathbf b = (2, 3, 4, 5) $ do tipo `uint32` (inteiro n√£o assinado de $ 32
$-bits) usando `linspace`.

(c) Construa um array $ 2D $ $ C $ de forma $ (4, 2) $ no qual todas as entradas s√£o
iguais a $ 1 + i $, do tipo `complex`. _Dica:_ Use `full` e lembre-se que
a unidade imagin√°ria em Python √© denotada por `j`.

### $ 1.5 $ A transposta

O atributo `T` em arrays NumPy fornece uma _vis√£o_ (n√£o uma c√≥pia independente) do
array transposto. Para arrays $ 2D $, a __transposta__ √© obtida pela 
troca de linhas e colunas.  

__Exerc√≠cio:__ 

(a) O que √© a transposta de um array $ 1D $? E quanto a arrays $ 3D $? Teste suas conjecturas em alguns exemplos.

(b) De forma mais geral, qual seria a defini√ß√£o mais razo√°vel da transposta de um array $ n $-dimensional?

Para arrays de dimens√µes superiores, `T` inverte a ordem de todos os eixos, enquanto
a transposta de um array $ 1D $ √© o pr√≥prio array. A transposta aparece
frequentemente em √Ålgebra Linear e suas aplica√ß√µes em estat√≠stica e aprendizado
de m√°quina.

<div style="
    background-color: #fff3cd; 
    border: 1px solid #ffeeba; 
    border-left: 5px solid #ffc107; 
    border-radius: 4px; 
    color: #856404; 
    margin: 10px 0px; 
    padding: 15px;">
    <span style="font-size: 24px; margin-right: 10px; vertical-align: middle;">‚ö†Ô∏è</span>
    Quando aplicado a dois arrays da mesma forma, o operador <code>==</code> realiza uma
    compara√ß√£o elemento a elemento e retorna um array booleano da mesma forma. 
    Para verificar se dois arrays <i>A</i> e <i>B</i> t√™m a mesma
    forma e elementos, use <code>np.array_equal(A, B)</code> em vez disso.
</div>

In [7]:
a = np.array([1, 2, 3])
b = np.array([1, 2, 3])

print(a == b)  # Compara√ß√£o elemento a elemento
print(np.array_equal(a, b))  # Igualdade geral do array

[ True  True  True]
True


__Exerc√≠cio:__ Escreva uma fun√ß√£o Python para determinar se uma dada matriz $ A $ √©
_sim√©trica_ (ou seja, se $ A^T = A $), _antissim√©trica_ ($ A^T = -A $) ou nenhuma das duas.
Sua fun√ß√£o funciona corretamente quando $ A $ n√£o √© quadrada?

In [None]:
def matrix_symmetry(A):
    # complete

## $ \S 2 $ M√©todos de redu√ß√£o e acumula√ß√£o

### $ 2.1 $ M√©todos e terminologia relacionada

Enquanto os atributos descrevem as propriedades de um objeto, os **m√©todos** definem o que
um objeto pode fazer: s√£o fun√ß√µes vinculadas ao objeto e que podem
acessar ou modificar seu estado. M√©todos encapsulam comportamentos apropriados para
a classe de objetos a que pertencem, assim como os atributos encapsulam o estado.

üìù Para invocar um m√©todo `m` em um objeto `x`, a sintaxe √© `x.m(<argumentos>)`.

Continuando o exemplo da se√ß√£o $ \S 1.2 $, poder√≠amos pensar em implementar
os seguintes m√©todos para nossa classe que representa carros:
* Ligar o motor (digamos, `start_engine()`, que n√£o retorna nada, mas muda o estado do carro).
* Verificar se √© necess√°ria manuten√ß√£o (digamos, `needs_maintenance()`, que retorna um `boolean`).
* Reabastecer o carro com certa quantidade de combust√≠vel (digamos, `refuel(amount)`, que retorna o novo n√≠vel de combust√≠vel como um `float`).

No contexto de arrays NumPy, m√©todos como `sum()` realizam c√°lculos nos
dados do array e retornam resultados, enquanto m√©todos como `sort()` modificam o array no
local, sem retornar nada.

In [19]:
v = np.array([2, 3, 1])
print(f"v = {v}")
print(f"Sum of the values in v: {v.sum()}")

v.sort()  # Ordena C no local ao longo de seu √∫ltimo eixo
print(f"v after sorting: {v}")

v = [2 3 1]
Sum of the values in v: 6
v after sorting: [1 2 3]


### $ 2.2 $ Principais m√©todos de redu√ß√£o e acumula√ß√£o

Os arrays NumPy t√™m v√°rios m√©todos de _redu√ß√£o_ que transformam dados
em formas mais simples. Por exemplo, os m√©todos `min` e `max` produzem os elementos
m√≠nimo e m√°ximo de um array. Da mesma forma, `argmin` e `argmax` retornam o
_√≠ndice_ dos elementos m√≠nimo e m√°ximo. Aqui est√° uma ilustra√ß√£o no
caso de um array $ 1D $ `a`:

<img src="max_min.svg" width="1400" height="300" alt="M√©todos Max e min">

üìù Quando o valor m√≠nimo ocorre v√°rias vezes, `argmin` retorna o √≠ndice da
primeira ocorr√™ncia. Quando chamado em um array multidimensional, ele retorna
o √≠ndice do elemento m√≠nimo da vers√£o _achatada_ ($ 1D $) do array:

In [14]:
arr = np.array([[3, 2, 4], 
                [1, 4, 1]])
print(arr)

idx = arr.argmin()
print(f"Argmin: {idx}")
print(type(idx))

[[3 2 4]
 [1 4 1]]
Argmin: 3
<class 'numpy.int64'>


O resultado neste caso √© $ 3 $ porque esse √© o primeiro √≠ndice de um elemento
tendo o valor m√≠nimo $ 1 $ no array achatado $ (3, 2, 4, 1, 4, 1) $.
Claro, coment√°rios semelhantes se aplicam a `argmax`.

__Exerc√≠cio:__ Calcule `min`, `max`, `argmin` e `argmax` do seguinte array $ 2D $.
Explique os resultados dos dois √∫ltimos m√©todos.

In [15]:
A = np.array([[2, 0, 3],
              [3, 1, 0],
              [1, 2, 0]])
print(A, '\n')

[[2 0 3]
 [3 1 0]
 [1 2 0]] 



Os m√©todos `sum` e `prod` s√£o outros m√©todos de redu√ß√£o que calculam a soma e o produto de
todos os elementos em um array, respectivamente. Os m√©todos `cumsum` e `cumprod` s√£o
m√©todos de _acumula√ß√£o_. Em vez de retornar um √∫nico n√∫mero, eles produzem um
array da mesma forma que o original, obtido calculando a soma e o produto _cumulativos_
das entradas no array, respectivamente:

<img src="sum_prod.svg" width="1400" height="300" alt="M√©todos de soma e produto">

__Exerc√≠cio:__ Verifique os resultados no exemplo anterior usando NumPy e diretamente a partir
das defini√ß√µes dos m√©todos.

__Exerc√≠cio:__ Crie uma fun√ß√£o que calcule juros compostos usando
`cumprod`. Dado um valor principal e um array de taxas de juros mensais
(como valores decimais), retorne o saldo da conta ap√≥s cada m√™s.
Teste-o nos valores abaixo. _Dica:_ Os fatores de crescimento s√£o dados por
$ 1 + \text{taxas mensais} $. Os saldos ser√£o o produto do
valor principal pelo produto cumulativo dos fatores de crescimento.

In [None]:
principal = 1000
monthly_rates = np.array([0.01, 0.012, 0.008, 0.011, 0.009, 0.013])
# balances = ???

üìù Nenhum dos m√©todos de redu√ß√£o e acumula√ß√£o realiza transforma√ß√µes
no local. Em vez disso, eles retornam novos arrays (ou n√∫meros) com os resultados
calculados, deixando o array original inalterado.

Os m√©todos de redu√ß√£o `mean`, `median`, `var` e `std` fornecem opera√ß√µes
estat√≠sticas b√°sicas essenciais para an√°lise de dados, ou seja,
eles calculam a m√©dia (aritm√©tica), mediana, vari√¢ncia e desvio padr√£o
do conjunto de elementos no array, respectivamente. Por exemplo:

<img src="mean_median.svg" width="1400" height="300" alt="M√©todos de redu√ß√£o estat√≠stica">

Lembre-se que a __vari√¢ncia__ de uma cole√ß√£o de n√∫meros $ x_i $ √© a m√©dia
do quadrado dos desvios da m√©dia; ela mede o qu√£o dispersos est√£o os valores.
O __desvio padr√£o__ √© simplesmente a raiz quadrada da vari√¢ncia.
Em s√≠mbolos, se 
$$
\mu = \frac{1}{n} \sum_{i=1}^{n} x_i
$$
denota a m√©dia, ent√£o
$$
\sigma^2 = \text{Var} = \frac{1}{n} \sum_{i=1}^{n} (x_i - \mu)^2 \qquad
\text{e} \qquad 
\sigma = \text{Std} = \sqrt{\text{Var}} = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (x_i - \mu)^2}
$$
Como acima, o desvio padr√£o √© frequentemente denotado por $ \sigma $.

__Exerc√≠cio:__ Verifique usando as defini√ß√µes que os valores na ilustra√ß√£o
anterior est√£o corretos.

__Exerc√≠cio:__ Quais s√£o a m√©dia, mediana, vari√¢ncia e desvio padr√£o de um
array cujos elementos t√™m todos o mesmo valor?

__Exerc√≠cio:__ Dado o array $ 1D $ abaixo, calcule a mediana e o desvio
padr√£o de todos os n√∫meros que s√£o maiores que $ 50 $. _Dica:_ Use uma
m√°scara booleana para filtrar os valores $ > 50 $.

In [3]:
rng = np.random.default_rng(0)
v = rng.integers(1, 101, size=100)
# Primeiros 20 elementos:
print(v[:20], "...")

# Sua solu√ß√£o aqui:
# print(f"\nMean of values greater than 50: {...:.2f}")

[86 64 52 27 31  5  8  2 18 82 65 92 51 61 98 73 64 55 56 94] ...


### $ 2.3 $ Aplicando m√©todos de redu√ß√£o e acumula√ß√£o ao longo de um eixo

Como argumento opcional para qualquer desses m√©todos, podemos designar um eixo
_ao longo do qual_ a soma deve ocorrer. Como sempre em Python, a indexa√ß√£o √©
baseada em zero, o que significa que para a matriz $ C $ abaixo, as linhas est√£o ao longo do eixo $ 0
$ e as colunas ao longo do eixo $ 1 $.

In [None]:
C = np.array([[2, 1, 3],
              [3, 2, 1]])
print(C.sum(axis=0))  # Soma ao longo do eixo 0 (soma por coluna)

Se pensarmos em $ C $ como a matriz $ C = (c_{ij}) $, onde $ i $ √© o √≠ndice
para o eixo $ 0 $ (ou seja, o √≠ndice das linhas), ent√£o tomar a soma _ao longo_ deste eixo
significa que, para cada $ j $, o NumPy calcula
$$ \sum_{i} c_{ij}
$$
resultando no vetor anterior, j√° que $ C $ tem tr√™s colunas. Para colocar de
outra forma, _o eixo especificado como argumento para `sum` √© aquele que √©
colapsado_, neste caso pela soma.

__Exerc√≠cio:__ Entender como o par√¢metro de eixo funciona √© crucial;
este exerc√≠cio ajudar√° voc√™ a dominar isso.
Dada a matriz $ A $ na c√©lula de c√≥digo abaixo:

(a) Encontre o valor m√°ximo em cada linha (ou seja, ao longo das colunas).

(b) Calcule a m√©dia (m√©dia aritm√©tica) de cada coluna (ou seja, ao longo das linhas).

(c) Determine o √≠ndice do elemento m√°ximo em cada linha (ou seja, ao longo das colunas).

(d) Calcule o desvio padr√£o dos valores em cada linha.

(e) Encontre as somas cumulativas para cada linha usando o m√©todo `cumsum`. 

In [12]:
A = np.array([[1, 2, 3, 4],
              [3, 3, 3, 3]])
print(A)

[[1 2 3 4]
 [3 3 3 3]]


üìù √â poss√≠vel aplicar os m√©todos ao longo de m√∫ltiplos eixos passando uma tupla de
eixos para o par√¢metro `axis`. Isso realiza a opera√ß√£o atrav√©s das dimens√µes especificadas
simultaneamente.

__Exerc√≠cio:__ Aplique `sum` ao longo dos eixos $ 1 $ e $ 2 $ do seguinte array $ 3D $
e explique o resultado.

In [10]:
M = np.arange(-12, 12).reshape(2, 3, 4)
print(M)

[[[-12 -11 -10  -9]
  [ -8  -7  -6  -5]
  [ -4  -3  -2  -1]]

 [[  0   1   2   3]
  [  4   5   6   7]
  [  8   9  10  11]]]


### $ 2.4 $ Outros m√©todos de redu√ß√£o e acumula√ß√£o

Os arrays t√™m v√°rios outros m√©todos al√©m dos discutidos acima. Para obter uma listagem
de todos os atributos e m√©todos associados a um objeto `a` (n√£o necessariamente um
array), voc√™ pode executar o comando Python `dir(a)`. Al√©m disso, em notebooks Jupyter,
digitar `?` antes ou depois do nome de um objeto ou fun√ß√£o (por exemplo, `A?` ou
`?np.array`) exibe documenta√ß√£o detalhada sobre ele:

In [32]:
A.sum?

Aqui mencionaremos apenas dois m√©todos adicionais muito √∫teis: `any` e `all`, que s√£o
m√©todos de redu√ß√£o booleana:

* `any` retorna `True` se e somente se pelo menos um elemento no array for verdadeiro (ou n√£o-zero).
   √â equivalente a uma opera√ß√£o OR entre os elementos.
* `all` retorna `True` se e somente se todos os elementos no array forem verdadeiros (ou n√£o-zero). √â
   equivalente a uma opera√ß√£o AND entre os elementos.

Ambos aceitam um argumento de eixo para aplicar a opera√ß√£o ao longo de dimens√µes espec√≠ficas,
e ambos lidam com arrays n√£o-booleanos tratando valores n√£o-zero como
True.

__Exerc√≠cio:__ Voc√™ tem leituras de sensores de v√°rios dispositivos coletados
ao longo do dia (fornecidos abaixo). Crie uma fun√ß√£o que verifique se algum
sensor relatou um valor cr√≠tico (acima de $ 95 $) e se todos os sensores permaneceram
operacionais (acima de $ 0 $).

In [7]:
# Cada linha dos dados representa um intervalo de tempo e cada coluna um sensor diferente:
sensor_data = np.array([
    [45, 62, 78, 81, 56],  # Hora 0
    [47, 65, 76, 82, 58],  # Hora 1
    [52, 68, 81, 85, 61],  # Hora 2
    [56, 72, 85, 88, 65],  # Hora 3
    [62, 78, 92, 93, 71],  # Hora 4
    [68, 83, 96, 91, 75],  # Hora 5 - Valor cr√≠tico
    [65, 81, 93, 87, 72],  # Hora 6
    [60, 76, 88, 84, 69],  # Hora 7
    [54, 71, 82, 80, 63],  # Hora 8
    [51, 67, 78, 78, 59],  # Hora 9
    [48, 65, 75, 75, 57],  # Hora 10
    [46, 63, 73, 74, 54],  # Hora 11
    [42, 59, 69, 70, 51],  # Hora 12
    [39, 55, 65, 68, 48],  # Hora 13
    [36, 53, 61, 65, 45],  # Hora 14
    [32, 48, 58, 61, 41],  # Hora 15
    [29, 43, 54, 58, 37],  # Hora 16
    [25, 38, 49, 53, 33],  # Hora 17
    [22, 35, 44, 49, 29],  # Hora 18
    [18, 30, 40, 46, 25],  # Hora 19
    [15, 28, 37, 42, 21],  # Hora 20
    [13, 0, 35, 39, 18],   # Hora 21 - Falha do sensor (valor 0)
    [11, 0, 32, 36, 15],   # Hora 22 - Falha do sensor (valor 0)
    [10, 22, 30, 35, 13],  # Hora 23
])

def validate_sensor_data(data, critical_threshold=95, operational_threshold=0):
    critical_readings = sensor_data > critical_threshold
    operational_sensors = sensor_data > operational_threshold
    # complete ...

__Exerc√≠cio:__ Dado um array $ 2D $ `data` de forma $ 100 \times 5 $ representando um
conjunto de dados onde cada linha √© uma entrada e cada coluna corresponde a uma vari√°vel diferente:

(a) Calcule a m√©dia e o desvio padr√£o de cada vari√°vel.

(b) Usando `argmin`, identifique a vari√°vel com a menor vari√¢ncia, sugerindo que ela tem a
menor dispers√£o.

In [None]:
data = rng.normal(size=(100, 5))

print(data[:5])  # Exibir as primeiras cinco linhas da tabela

# (a) M√©dia e desvio padr√£o de cada vari√°vel (coluna):

# (b) Encontre a vari√°vel com a menor vari√¢ncia:

[[ 1.29289305  0.45367126 -1.69015994 -0.72819503  1.2323034 ]
 [ 0.29833525 -0.00985894  0.44120059  0.72104895 -0.70846524]
 [-0.29040008  0.14291365 -0.54395772 -0.13345156  1.29787176]
 [-0.96781986  1.92666271  1.87934438 -1.71343944 -0.14102267]
 [ 0.34269157 -0.76087109 -0.7410805  -0.2374157   0.73917809]]


## $ \S 3 $ Remodelagem e transforma√ß√£o de arrays

### $ 3.1 $ Alterando o tipo de dados

Lembre-se que o atributo `dtype` de um array armazena seu tipo de dados. Podemos criar
um novo array com um tipo de dados diferente a partir de um dado array usando o m√©todo
`astype`, desde que a convers√£o de tipo de dados fa√ßa sentido:

In [None]:
# Vamos come√ßar criando um array de strings:
A = np.array([["1", "-2"],
              ["3", "-4"]])
print(A, '\n')

# Converter o tipo de dados para n√∫meros de ponto flutuante de precis√£o dupla (64 bits):
A_double = A.astype("float64")
print(A_double.dtype, '\n', A_double)

[['1' '-2']
 ['3' '-4']] 

float64 
 [[ 1. -2.]
 [ 3. -4.]]


üìù Observe que o tipo de dados √© passado como uma string. Na verdade, esses s√£o apenas
aliases convenientes para os verdadeiros nomes de tipos (do NumPy), como `np.float64` e
`np.bool_`, que tamb√©m podem ser passados diretamente.


__Exerc√≠cio:__ O que acontece se voc√™ tentar converter um array num√©rico para um cujo
tipo de dados √© `bool`? E quanto ao contr√°rio, ou seja, de `bool` para, digamos, `int32`?

In [14]:
numbers = np.array([-2, -1, 0, 1, 2])

bool_vals = np.array([True, False, True, True])

üìù Embora tenhamos falado sobre a "convers√£o" de um tipo para outro,
`astype` n√£o modifica realmente o array original; em vez disso, sempre cria uma
_nova c√≥pia_ do array original com o tipo de dados prescrito. Isso ocorre
mesmo quando o tipo de dados alvo √© o mesmo que o original.

__Exerc√≠cio:__ Prove que os dois arrays $ \mathbf{u} $ e $ \mathbf{v} $ abaixo
s√£o independentes modificando um deles e verificando que o outro
n√£o √© afetado.

In [15]:
u = np.array([1, 2, 3])
print(f"Original u: {u} of type {u.dtype}")

v = u.astype("int64")
print(f"Original v: {v} of type {v.dtype} \n")

# Modifique v e verifique se u √© afetado:

Original u: [1 2 3] of type int64
Original v: [1 2 3] of type int64 



### $ 3.2 $ Modificando a forma dos arrays

Remodelar arrays √© uma opera√ß√£o comum e fundamental no NumPy. Existe tanto
uma fun√ß√£o quanto um m√©todo chamado `reshape` que podem realizar isso:

In [62]:
a = np.array([1, 2, 3, 4, 5, 6])
print(a, end='\n\n')

A = np.reshape(a, (3, 2))  # Aqui usamos a _fun√ß√£o_ `reshape`

B = a.reshape((2, 3))   # Aqui usamos o _m√©todo_ `reshape`

print(A, end="\n\n")  # Aqui a foi remodelado em uma matriz 3 por 2
print(B, end="\n\n")  # Aqui a foi remodelado em uma matriz 2 por 3

Note que quando remodelamos um array, a nova forma deve ser compat√≠vel com o
tamanho do array original, no sentido de que o tamanho (n√∫mero total de
elementos) deve permanecer o mesmo. Por exemplo, o seguinte resulta em um erro:

In [None]:
C = np.reshape(a, (2, 2))

Ao remodelar, tamb√©m podemos especificar $ -1 $ em uma dimens√£o para instruir
o NumPy a inferir o n√∫mero de elementos ao longo dessa dimens√£o a partir do tamanho do
array e das dimens√µes restantes. Isso √© especialmente √∫til quando um
array √© passado para n√≥s pelo usu√°rio como argumento em uma chamada de fun√ß√£o, mas n√≥s
n√£o sabemos com anteced√™ncia quantas entradas ele tem:

In [None]:
a = np.array([[1, 2],
              [3, 4]])
A = a.reshape((-1, 1))  # Remodelar em um vetor coluna
print(A)

Neste exemplo, quer√≠amos remodelar nosso array para que o resultado tivesse
uma coluna, mas n√£o quer√≠amos calcular quantas linhas ele deveria ter para
que isso acontecesse. Aqui est√° outro exemplo, no qual remodelamos um array $ 1D $ em uma
matriz e depois em um vetor linha:

In [8]:
x = np.arange(1, 13)
X = x.reshape((3, -1))
x_row = X.reshape((1, -1))

print(x, end='\n\n')
print(X, end='\n\n')
print(x_row, end='\n\n')

[ 1  2  3  4  5  6  7  8  9 10 11 12]

[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]]

[[ 1  2  3  4  5  6  7  8  9 10 11 12]]



üìù N√£o h√° diferen√ßa essencial entre as vers√µes de fun√ß√£o e m√©todo
de `reshape`. Em ambos os casos, o NumPy retorna um _novo_ array, enquanto o array original
permanece inalterado. No entanto, essas opera√ß√µes fornecem uma vis√£o dos
_dados_ do array original sempre que poss√≠vel, o que significa que elas n√£o copiam os
_dados_ do array a menos que seja necess√°rio. Assim, modifica√ß√µes nos dados do array remodelado
podem afetar o array original e vice-versa. Vamos usar o exemplo
anterior para ilustrar isso:

In [None]:
X[0, 0] = -23  # Modifica o elemento superior esquerdo de X
print(x)  # O elemento 0 de x tamb√©m foi afetado!

Para criar uma c√≥pia independente e profunda de um array NumPy, podemos usar o m√©todo `copy`.
Este m√©todo gera um novo objeto array com os mesmos dados que o array original,
mas armazenado em um local de mem√≥ria separado.

In [None]:
y = np.arange(3)  # y √© o array 1D com entradas 0, 1, 2
Y = y.copy().reshape((1, -1))  # Remodelar y em um vetor linha 2D independente
y[0] = 10  # Modificar o elemento 0 de y

print(y)
print(Y)  # O elemento 0 de Y n√£o √© afetado, j√° que Y √© uma c√≥pia independente

__Exerc√≠cio:__ Dado um array $ 1D $ de $ 100 $ elementos, remoldele-o em uma matriz $ 10
\times 10 $. Em seguida, normalize a matriz para que todos os valores sejam escalados para
estar entre $ 0 $ e $ 1 $ (inclusive). _Dica:_ Determine o m√°ximo $ M $ e
m√≠nimo $ m $ de todas as entradas, escreva uma fun√ß√£o linear $ f $ que leve $ [m, M] $ para $ [0, 1] $
e ent√£o aplique-a ao array inteiro.

In [None]:
# Gerar array aleat√≥rio de 100 elementos
data = rng.integers(0, 1000, size=100)
print(data)

[400 787 316 239 791 876  79  58 671 336 573 150 860 450 894 796 705 230
 767  52 570 404 996 198 946  90 623 580 898 298 902 671 890 199 758 942
  48 365 636 105 510 629 763 927 409 440 474 954 195 499  49 425 945 620
 349 995 603 948  16 460 834 757 407 497 420 529 230 785  77 414 281 734
 749 711 924 932 184 114 132 729 970 927 668 967 871  14 119 863  82 981
 827 957 360 148 516 972 367 889 383 822]


### $ 3.3 $ Os m√©todos `ravel` e `flatten`

O m√©todo `flatten` pega um array multidimensional e retorna um novo
array _unidimensional_ independente contendo todos os elementos do array original. 

In [16]:
A = np.array([[1, 2],
              [3, 4]])
a = A.flatten()  # Cria um novo array 1D com uma c√≥pia dos dados
print(a)

# Vamos verificar que √© uma c√≥pia:
a[0] = 99
print(f"\nAfter modifying a[0]:\n{A}")
print(f"a = {a}")

[1 2 3 4]

After modifying a[0]:
[[1 2]
 [3 4]]
a = [99  2  3  4]


A ordem em que os elementos s√£o colocados no array achatado √© baseada na
ordena√ß√£o lexicogr√°fica de seus √≠ndices no array original. Por exemplo,
se estamos lidando com um array $ 3D $, ent√£o a entrada na posi√ß√£o $ (0, 0, 2) $
vem antes da entrada em $ (0, 1, 0) $, que ser√° colocada antes da entrada
em $ (1, 0, 0) $.

In [11]:
A = np.arange(6).reshape((2, 3))
print(A)

a = A.flatten()
a[0] = 10

print(a)
print(A)

[[0 1 2]
 [3 4 5]]
[10  1  2  3  4  5]
[[0 1 2]
 [3 4 5]]


O NumPy fornece outro m√©todo chamado `ravel` que √© semelhante a `flatten`, mas
com uma diferen√ßa importante: enquanto `flatten` sempre retorna uma c√≥pia profunda dos
dados, `ravel` retorna uma vis√£o quando poss√≠vel, o que o torna mais
eficiente em termos de mem√≥ria.

__Exerc√≠cio:__ Aplique `ravel` e `flatten` √† matriz $ A $ abaixo para obter
dois vetores $ \mathbf{r} $ e $ \mathbf{f} $. Verifique se as altera√ß√µes em
$ A $ afetam algum dos vetores.

In [14]:
A = np.array([[1, 2],
              [3, 4]])
print(A)

[[1 2]
 [3 4]]


### $ 3.4 $ Usando o m√©todo e fun√ß√£o `resize`

Diferentemente de `reshape`, que requer que o n√∫mero total de elementos permane√ßa o mesmo,
`resize` pode alterar o tamanho total de um array. O m√©todo `resize` modifica o
array no local, enquanto a fun√ß√£o `np.resize` retorna um novo array. Se o
novo tamanho for maior que o antigo, ent√£o o _m√©todo_ preenche as entradas ausentes
com zeros, enquanto a _fun√ß√£o_ percorre os elementos do array original:

In [18]:
# Usando m√©todo resize (modifica no local), preenche com 0 se necess√°rio:
a = np.array([1, 2, 3, 4])
print(f"Original a: {a}")

a.resize(6)  # Redimensiona no local para comprimento 6
print(f"After a.resize(6): {a}")

Original a: [1 2 3 4]
After a.resize(6): [1 2 3 4 0 0]


In [22]:
# Usando fun√ß√£o resize (retorna novo array)
b = np.array([1, 2, 3, 4])
C = np.resize(b, (2, 3))

print(f"\nOriginal b: {b}")
print(f"After np.resize(b, (2, 3)):\n{C}")


Original b: [1 2 3 4]
After np.resize(b, (2, 3)):
[[1 2 3]
 [4 1 2]]


### $ 3.5 $ Combinando arrays com `hstack` e `vstack`

O NumPy fornece v√°rias fun√ß√µes para empilhar arrays juntos. As mais comumente usadas s√£o `hstack` (empilhamento horizontal) e `vstack` (empilhamento vertical).

In [24]:
# Criando arrays de exemplo
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])

# Empilhamento horizontal (lado a lado):
h_stacked = np.hstack((a, b))
print(f"Horizontal stack of a and b: {h_stacked}")

# Empilhamento vertical (um acima do outro):
v_stacked = np.vstack((a, b))
print(f"Vertical stack of a and b:\n{v_stacked}")

Horizontal stack of a and b: [1 2 3 4 5 6]
Vertical stack of a and b:
[[1 2 3]
 [4 5 6]]


__Exerc√≠cio:__ Empilhe as duas matrizes $ A $ e $ B $ abaixo, horizontal e verticalmente.

In [25]:
A = np.array([[1, 2], [3, 4]])
B = np.array([[5, 6], [7, 8]])

### $ 3.6 $ Encontrando elementos √∫nicos com `np.unique`

A fun√ß√£o `np.unique` retorna os elementos √∫nicos ordenados de um array. Ela tamb√©m pode retornar contagens de cada valor √∫nico quando o par√¢metro `return_counts` √© definido como `True`.

In [34]:
data = np.array([3, 1, 4, 1, 5, 9, 2, 6, 5, 3, 5])
print(f"Original array: {data}")

# Obter elementos √∫nicos:
unique_elements = np.unique(data)
print(f"\nUnique elements: {unique_elements}")

# Obter elementos √∫nicos e suas contagens:
unique_elements, counts = np.unique(data, return_counts=True)
print(f"\nUnique elements: {unique_elements}")
print(f"Counts: {str(counts):>24}")

Original array: [3 1 4 1 5 9 2 6 5 3 5]

Unique elements: [1 2 3 4 5 6 9]

Unique elements: [1 2 3 4 5 6 9]
Counts:          [2 1 2 1 3 1 1]


__Exerc√≠cio:__ Use `argmax` para encontrar o elemento mais comum no array `data` do exemplo anterior.

In [11]:
A = np.arange(6).reshape((2, 3))
print(A)

a = A.flatten()
a[0] = 10

print(a)
print(A)

[[0 1 2]
 [3 4 5]]
[10  1  2  3  4  5]
[[0 1 2]
 [3 4 5]]


O NumPy fornece outro m√©todo chamado `ravel` que √© semelhante a `flatten`, mas
com uma diferen√ßa importante: enquanto `flatten` sempre retorna uma c√≥pia profunda dos
dados, `ravel` retorna uma vis√£o quando poss√≠vel, o que o torna mais
eficiente em termos de mem√≥ria.

__Exerc√≠cio:__ Aplique `ravel` e `flatten` √† matriz $ A $ abaixo para obter
dois vetores $ \mathbf{r} $ e $ \mathbf{f} $. Verifique se as altera√ß√µes em
$ A $ afetam algum dos vetores.

In [14]:
A = np.array([[1, 2],
              [3, 4]])
print(A)

[[1 2]
 [3 4]]


### $ 3.4 $ Usando o m√©todo e fun√ß√£o `resize`

Diferentemente de `reshape`, que requer que o n√∫mero total de elementos permane√ßa o mesmo,
`resize` pode alterar o tamanho total de um array. O m√©todo `resize` modifica o
array no local, enquanto a fun√ß√£o `np.resize` retorna um novo array. Se o
novo tamanho for maior que o antigo, ent√£o o _m√©todo_ preenche as entradas ausentes
com zeros, enquanto a _fun√ß√£o_ percorre os elementos do array original:

In [18]:
# Usando m√©todo resize (modifica no local), preenche com 0 se necess√°rio:
a = np.array([1, 2, 3, 4])
print(f"Original a: {a}")

a.resize(6)  # Redimensiona no local para comprimento 6
print(f"After a.resize(6): {a}")

Original a: [1 2 3 4]
After a.resize(6): [1 2 3 4 0 0]


In [22]:
# Usando fun√ß√£o resize (retorna novo array)
b = np.array([1, 2, 3, 4])
C = np.resize(b, (2, 3))

print(f"\nOriginal b: {b}")
print(f"After np.resize(b, (2, 3)):\n{C}")


Original b: [1 2 3 4]
After np.resize(b, (2, 3)):
[[1 2 3]
 [4 1 2]]


### $ 3.5 $ Combinando arrays com `hstack` e `vstack`

O NumPy fornece v√°rias fun√ß√µes para empilhar arrays juntos. As mais comumente usadas s√£o `hstack` (empilhamento horizontal) e `vstack` (empilhamento vertical).

In [24]:
# Criando arrays de exemplo
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])

# Empilhamento horizontal (lado a lado):
h_stacked = np.hstack((a, b))
print(f"Horizontal stack of a and b: {h_stacked}")

# Empilhamento vertical (um acima do outro):
v_stacked = np.vstack((a, b))
print(f"Vertical stack of a and b:\n{v_stacked}")

Horizontal stack of a and b: [1 2 3 4 5 6]
Vertical stack of a and b:
[[1 2 3]
 [4 5 6]]


__Exerc√≠cio:__ Empilhe as duas matrizes $ A $ e $ B $ abaixo, horizontal e verticalmente.

In [25]:
A = np.array([[1, 2], [3, 4]])
B = np.array([[5, 6], [7, 8]])

### $ 3.6 $ Encontrando elementos √∫nicos com `np.unique`

A fun√ß√£o `np.unique` retorna os elementos √∫nicos ordenados de um array. Ela tamb√©m pode retornar contagens de cada valor √∫nico quando o par√¢metro `return_counts` √© definido como `True`.

In [34]:
data = np.array([3, 1, 4, 1, 5, 9, 2, 6, 5, 3, 5])
print(f"Original array: {data}")

# Obter elementos √∫nicos:
unique_elements = np.unique(data)
print(f"\nUnique elements: {unique_elements}")

# Obter elementos √∫nicos e suas contagens:
unique_elements, counts = np.unique(data, return_counts=True)
print(f"\nUnique elements: {unique_elements}")
print(f"Counts: {str(counts):>24}")

Original array: [3 1 4 1 5 9 2 6 5 3 5]

Unique elements: [1 2 3 4 5 6 9]

Unique elements: [1 2 3 4 5 6 9]
Counts:          [2 1 2 1 3 1 1]


__Exerc√≠cio:__ Use `argmax` para encontrar o elemento mais comum no array `data` do exemplo anterior.

### $ 3.7 $ Invertendo arrays com `np.flip`

A fun√ß√£o `np.flip` inverte a ordem dos elementos em um array ao longo de um eixo especificado. Ela sempre
retorna um novo array independente, n√£o uma vis√£o do original.

In [None]:
# Criar um array 1D:
a = np.array([1, 2, 3, 4, 5])
print(f"Original array: {a}")
print(f"Flipped array: {np.flip(a)}")

__Exerc√≠cio:__ Dado o array $ 2D $ $ A $ abaixo:

(a) Inverta $ A $ ao longo de seu eixo $ 0 $ usando `flip` com o argumento `axis=0`.

(b) Inverta as colunas de $ A $.

(c) Inverta ambos os eixos de $ A $ usando `flip` sem fornecer um argumento `axis`.

(d) Voc√™ pode conseguir os mesmos resultados usando fatias do tipo `::-1`? Qual √© a diferen√ßa?
_Dica:_ O que acontece se voc√™ modificar o array invertido, o original √© afetado?

In [40]:
# Criar um array 2D
A = np.array([[1, 2, 3],
              [4, 5, 6],
              [7, 8, 9]])

print(f"\nOriginal 2D array:\n{A}")

# (a) Inverter ao longo do eixo 0 (linhas):

# (b) Inverter ao longo do eixo 1 (colunas):

# (c) Inverter ao longo de ambos os eixos:


Original 2D array:
[[1 2 3]
 [4 5 6]
 [7 8 9]]


__Exerc√≠cio:__ O array $ 2D $ de forma $ 28 \times 28 $ na c√©lula de c√≥digo abaixo
representa uma imagem em escala de cinza. Escreva uma fun√ß√£o para rotacionar esta imagem $ 90 $ graus
no sentido hor√°rio.

_Dica_: Isso pode ser realizado primeiro transpondo o array e depois
invertendo-o verticalmente (ou seja, revertendo a ordem das entradas ao longo de cada
coluna) com uma fatia apropriada ou usando `flip`. Isso √© ilustrado no
exemplo $ 3 \times 3 $ abaixo, mas a mesma ideia funciona em qualquer dimens√£o.
$$
\begin{bmatrix}
a & b & c \\
d & e & f \\
g & h & i \\
\end{bmatrix}
\overset{\text{transpor}}{\longrightarrow}
\begin{bmatrix}
a & d & g \\
b & e & h \\
c & f & i \\
\end{bmatrix}
\overset{\text{inverter vert.}}{\longrightarrow}
\begin{bmatrix}
g & d & a \\
h & e & b \\
i & f & c \\
\end{bmatrix}
$$

In [13]:
image = np.array(rng.integers(0, 256, size=(28, 28)))
print(image[:5, :5])

def rotate_90_clockwise(img):
    """ Rotaciona um array 2D 90 graus no sentido hor√°rio.  """

[[209 215 215 107 109]
 [139 143 115 203  34]
 [180 127  65  62 170]
 [  5 237  66 204  48]
 [206 217  69 153  58]]


### $ 3.8 $ O m√©todo `squeeze`

O m√©todo `squeeze` remove entradas unidimensionais (eixos com comprimento $ 1 $)
da forma de um array. Por exemplo, um array de forma $ (1, 3, 1) $ se torna
$ (3,) $ ap√≥s a compress√£o. 

In [None]:
# Criar array com forma (1, 3, 1, 2):
A = np.array([[[[1, 2]], [[3, 4]], [[5, 6]]]])
print(A.shape)  # (1, 3, 1, 2)

# Remover eixos unidimensionais:
B = A.squeeze()
print(B.shape)  # (3, 2)

Algumas caracter√≠sticas principais do `squeeze`:
* Ele retorna uma vis√£o do array de entrada, n√£o uma c√≥pia.
* Sem argumentos, ele remove todos os eixos unidimensionais.
* Com o par√¢metro axis, ele pode remover apenas eixos unidimensionais espec√≠ficos.
* Gera um `ValueError` se voc√™ tentar comprimir um eixo de tamanho $ > 1 $.

__Exerc√≠cio:__ Comprima o eixo $ 2 $ do array $ A $ no exemplo anterior para obter
um array $ C $. Em seguida, modifique um elemento de $ C $ e verifique se $ A $ √© afetado.