# Introdu√ß√£o aos arrays NumPy

## $ \S 1 $ Motiva√ß√£o

Suponha que desejamos representar vetores como $ \mathbf{u}
= (1, 2, 3) $ ou $ \mathbf{v} = (-1, 0, 1) $ em Python. √â natural pensar
que listas ou tuplas podem ser uma boa escolha para esta tarefa.

In [None]:
u = [1, 2, 3]   # Criar uma lista cujos elementos s√£o 1, 2, 3
v = [-1, 0, 1]

No entanto, em algum momento provavelmente vamos querer n√£o apenas armazenar, mas manipular
esses vetores. Por exemplo, como podemos adicionar $ \mathbf u $ e $ \mathbf v $ ou
pegar um m√∫ltiplo de $ \mathbf v $? √â razo√°vel tentar o seguinte c√≥digo:

In [None]:
s = u + v
multiple = 3 * v

print(s)
print(multiple)

Esses resultados inesperados podem ser explicados lembrando que tanto para listas quanto para
tuplas (ou strings), o operador `+` denota _concatena√ß√£o_, n√£o adi√ß√£o; e
consequentemente, `*` denota _repeti√ß√£o_, n√£o multiplica√ß√£o. Esse comportamento n√£o √©
t√£o estranho se levarmos em conta que listas e tuplas s√£o tipos sequenciais
_gen√©ricos_, capazes de conter objetos de tipos arbitr√°rios, para os quais
adi√ß√£o e multiplica√ß√£o podem n√£o fazer sentido.

__Exerc√≠cio:__ O que acontece se voc√™ representar $ \mathbf u $ e $ \mathbf v $ como
tuplas e tentar calcular a diferen√ßa $ \mathbf u - \mathbf v $? E se elas
forem representadas como listas?

Vetores e matrizes s√£o objetos fundamentais em engenharia, ci√™ncia
e aprendizado de m√°quina. Portanto, existe uma clara necessidade de uma biblioteca que
estenda o Python fornecendo maneiras eficientes de operar com esses objetos.

## $ \S 2 $ Arrays

<img src="NumPy.png" width="105" height="38" alt="NumPy">, que significa _Numerical Python_, √© um pacote fundamental
para computa√ß√£o cient√≠fica em Python. √â quase universalmente importado com o
alias `np`, da seguinte forma:

In [None]:
import numpy as np

Tamb√©m poder√≠amos importar todos os objetos/fun√ß√µes do NumPy com:

In [None]:
from numpy import *

Assim, evitar√≠amos ter que digitar o prefixo `np.` toda vez. No entanto,
isso n√£o √© recomendado, pois pode levar a conflitos com nomes no Python puro
(por exemplo, `max` e `min`) ou aqueles usados por outros m√≥dulos (como
`exp` e `sqrt` do m√≥dulo Math).

O recurso central do NumPy √© uma nova estrutura de dados chamada **ndarray** (uma
abrevia√ß√£o de array $n$-dimensional), ou simplesmente **array**. Um array √©
essencialmente uma tabela multidimensional. Por exemplo, um array $1$-dimensional √©
outra vers√£o de uma lista; √© apenas uma linha de dados. Um array $2$-dimensional pode ser
visto como uma planilha ou matriz. E arrays $3$-dimensionais s√£o pilhas de
tabelas, por exemplo, tendo a forma de um cubo.

Um ndarray √© uma grade de valores _do mesmo tipo de dados_; em outras palavras, arrays
devem ser **homog√™neos**. Na maioria das aplica√ß√µes, esse tipo de dados √© num√©rico (ou seja,
os elementos do array s√£o todos inteiros ou todos n√∫meros de ponto flutuante). No entanto,
tamb√©m √© poss√≠vel criar um array cujos elementos s√£o booleanos ou strings,
por exemplo.

Um array $1$-dimensional num√©rico √© semelhante a um vetor no sentido da
√Ålgebra Linear, como na discuss√£o no $ \S 1 $. Arrays podem ser instanciados
com a fun√ß√£o `array`:

In [None]:
u = np.array([1, 2, 3])     # Chamando `array` na lista [1, 2, 3]
print(u)
print(f"O tipo de um array como u √©: {type(u)}")

Observe a aus√™ncia de v√≠rgulas separando as entradas do array quando ele √© exibido
(em contraste com as listas).

__Exerc√≠cio:__ Imprima a lista `primes = [2, 3, 5, 7]` e seu tipo. Em seguida, gere
um array `primes_arr` a partir desta lista e imprima-o, junto com seu tipo.

__Exerc√≠cio:__ Defina o vetor
$ \mathbf a = \frac{1}{2} \big(1, 1, 1, 1 \big) \in \mathbb R^4 $ como um array NumPy.
Qual √© o comprimento (norma) de $ \mathbf a $?

__Exerc√≠cio:__ Imprima e determine os tipos dos seguintes arrays.

In [None]:
b = np.array([True, False, True, False])
s = np.array(list("test"))

üìù Recapitulando, `ndarray` √© o nome oficial do tipo de dados fornecido pelo NumPy, e `array` √© tanto
o nome informal deste tipo de dados quanto o nome da fun√ß√£o que podemos usar
para criar ndarrays.

O argumento da fun√ß√£o `array` pode ser uma lista, uma tupla, um range, outro
array ou qualquer objeto semelhante a um array.

In [None]:
v = np.array((-1, 0, 1))    # O argumento de `array` tamb√©m pode ser uma tupla
print(v)

__Exerc√≠cio:__ √â poss√≠vel converter uma string como "hello" diretamente para um array de caracteres com `array`? Tente isso abaixo.

Observe que o tipo de um array como um todo √© sempre o mesmo (`numpy.ndarray`)
e n√£o deve ser confundido com seu __tipo de dados__, que √© o tipo dos
_elementos_ que ele cont√©m. Podemos determinar o tipo de dados de um array $ \mathbf a $ atrav√©s de `a.dtype`:

In [None]:
v.dtype

Como podemos ver, o array $ \mathbf v = (-1, 0, 1) $ definido acima cont√©m inteiros de $ 64 $ bits.

__Exerc√≠cio:__ Determine o tipo de dados dos arrays $ \mathbf b $ e
$ \mathbf c $ definidos abaixo.

In [None]:
b = np.array([True, False, True, False])
c = np.array((1, 2, 3.))

Tamb√©m podemos converter uma lista, tupla ou range _existente_ em um
array:

In [None]:
odds = range(1, 11, 2)  # Criar um range contendo n√∫meros √≠mpares de 1 a 9
print(np.array(odds))   # Criar um array a partir de `odds` e imprimi-lo

## $ \S 3 $ Arrays multidimensionais

O n√∫mero de dimens√µes de um array tamb√©m √© chamado de seu
**posto** (ingl√™s: _rank_). Um array $ 2 $-dimensional, ou array de posto $ 2 $ pode ser visto
como uma tabela ou matriz. 

In [None]:
A = np.array([[1, 1, 1, 1],   # primeira linha da matriz A
              [2, 2, 2, 2],   # segunda linha
              [3, 3, 3, 3]])  # terceira linha
print(A)
print(type(A))  # Imprimir o tipo do objeto A

Observe o uso de colchetes _duplos_ aqui: o primeiro colchete de abertura `[` serve
para delimitar o pr√≥prio array, enquanto o segundo est√° sendo usado para delimitar os elementos
da primeira linha. As linhas s√£o separadas por v√≠rgulas, assim como os elementos dentro de cada linha.

üìù No c√≥digo do exemplo anterior, cada linha da matriz aparece
separadamente em uma linha para melhorar a legibilidade, mas os caracteres de nova linha n√£o
delimitam as linhas (as v√≠rgulas e colchetes fazem isso).
Portanto, o seguinte produz o mesmo resultado:

In [None]:
A = np.array([[1, 1, 1, 1], [2, 2, 2, 2], [3, 3, 3, 3]])
print(A)

__Exerc√≠cio:__ Crie e exiba a matriz
$$
    T = \begin{bmatrix}
    \phantom{-}0 & \phantom{-}1 & \phantom{-}0 \\
    -1 & \phantom{-}0 & \phantom{-}1 \\
    \phantom{-}0 & -1 & \phantom{-}0
    \end{bmatrix}
$$

__Exerc√≠cio:__ Crie um array $ 3\times 3 $ para representar um tabuleiro de jogo da velha.
Use a string `' '` (um espa√ßo em branco) para uma c√©lula vazia, e as strings
`'X'` e `'O'` para as pe√ßas colocadas por cada um dos dois jogadores.
Configure o tabuleiro para o seguinte estado de jogo:

<img src="tic_tac_toe.png" width="200">

In [None]:
game_board = np.array(...)

print(game_board)

‚ö° Arrays n√£o precisam ser retangulares; eles tamb√©m podem ser
_irregulares_ (significando que as linhas podem ter comprimentos diferentes), como no exemplo
abaixo. No entanto, arrays irregulares perdem muitos dos benef√≠cios de desempenho do NumPy, que
dependem de formas consistentes para efici√™ncia.

In [None]:
jagged = np.array([
    [1, 2, 3],
    [4, 5],
    [6, 7, 8, 9]
], dtype=object)
print(jagged)

Observe que este array est√° armazenando listas Python, em vez de um
bloco cont√≠guo de mem√≥ria com inteiros.

A __forma__ de um array √© uma _tupla_ de inteiros indicando o tamanho de cada uma de
suas dimens√µes. O array $ A $ abaixo tem forma $ (3, 4) $ pois tem tr√™s
linhas e quatro colunas.

In [None]:
A = np.array([[42, 17, 99, 3], [-2, -3, -5, -7], [0, 0, 0, 0]])
print(A)
print(A.shape)  # Imprimir a forma de A

__Exerc√≠cio:__ Qual √© a forma de um array unidimensional, por exemplo o
array $ \mathbf b $ abaixo? Voc√™ pode explicar o resultado de `b.shape` (por que h√°
uma v√≠rgula quando voc√™ o imprime)?

In [None]:
b = np.array([True, False, False, True, False])

__Exerc√≠cio:__ Como voc√™ criaria a matriz
$$
\mathbf B = \begin{equation*}
\left[ \begin{array}{cc}
b_{11} & b_{12} \\
b_{21} & b_{22} \\
b_{31} & b_{32} \\
b_{41} & b_{42}
\end{array} \right]
\end{equation*}
$$
onde $ b_{ij} = i \cdot j $?

‚ö° __Exerc√≠cio:__ Lembre-se da matriz $ \mathbf{B} = \big(b_{ij}\big) = (i \cdot j) $ do
exerc√≠cio anterior. Use uma compreens√£o de lista dupla para gerar os $ b_{ij} $
como uma lista de listas e depois converta isso para um array. _Dica:_ Voc√™ precisar√° de uma
compreens√£o dupla, da forma `[[... for j in ...] for i in ...]`. 

Um array $ 3D $ est√° para uma matriz assim como um bloco s√≥lido est√° para um ret√¢ngulo. Em outras palavras,
um array de posto $ 3 $ √© aquele que tem tr√™s eixos em vez de apenas dois.

<img src="array_3D.png" alt="drawing" width="400"/>

__Exerc√≠cio:__ Qual √© o posto e a forma do array ilustrado acima?

Aqui est√° um exemplo concreto de um array $ 3D $ de forma $ 2 \times 2 \times 2 $.
Pense nele como um array com $ 2 $ "hiper-linhas",
cada uma sendo uma matriz $ 2 \times 2 $.

In [None]:
A = np.array([[[1, 2],   # A primeira "hiper-linha" √© uma matriz 2x2
               [3, 4]], 

              [[5, 6],   # A segunda "hiper-linha" tamb√©m √© uma matriz 2x2
               [7, 8]]])
print(A)

__Exerc√≠cio:__ O que acontece se voc√™ excluir a linha em branco dentro da defini√ß√£o de $ A $ acima?
O que acontece se voc√™ inserir uma linha em branco adicional?

Observe que um array $ 3D $ n√£o precisa ser um cubo (ou seja, ter as tr√™s dimens√µes
do mesmo comprimento) como no exemplo anterior.

__Exerc√≠cio:__ Construa um array de posto tr√™s com forma $ (2, 3, 4) $. 
_Dica:_ Pense nisso como um par de matrizes $ 3 \times 4 $.

N√£o h√° limite para o n√∫mero de dimens√µes que um array pode ter, embora
para a maioria das aplica√ß√µes, arrays de posto maior que $ 4 $ raramente s√£o usados.

## $ \S 4 $ Outras maneiras de criar arrays

### $ 4.1 $ Preenchendo arrays automaticamente

Existem outras formas de criar arrays que geralmente s√£o mais convenientes do que usar a fun√ß√£o `array`. Por exemplo,
para instanciar um array de uma forma desejada preenchido com $ 0\text{s} $, podemos usar a fun√ß√£o `zeros`:

In [None]:
Z = np.zeros((2, 5))  # O argumento de `zeros` √© a forma que voc√™ deseja
print(Z)

üìù Observe os par√™nteses duplos necess√°rios nesta chamada. O par mais externo
delimita os argumentos da fun√ß√£o `array` e o par mais interno
especifica a forma, que √© sempre uma tupla. No entanto, h√° uma exce√ß√£o para 
arrays $ 1D $. Se quisermos um vetor com, digamos, $ 10 $ coordenadas iguais a
$ 0 $, ent√£o podemos usar `np.zeros((10,))` ou `np.zeros(10)`.

In [None]:
origin = np.zeros(3)
print(origin)

Observe que, por padr√£o, o array resultante tem tipo de dados de ponto flutuante.

__Exerc√≠cio:__ Crie e imprima um array $ 3D $ de forma $ (3, 4, 5) $ preenchido com zeros.

Arrays tamb√©m podem ser automaticamente preenchidos com $ 1\text{s} $ por meio da fun√ß√£o `ones`: 

In [None]:
U = np.ones((2, 3))
print(U)

Generalizando `zeros` e `ones`, a fun√ß√£o `full` cria um array de uma
forma especificada, preenchido inteiramente com um valor prescrito:

In [None]:
# Criar um array 3x5 onde cada elemento √© igual a 3.14:
P = np.full((3, 5), 3.14)
print(P)

__Exerc√≠cio:__ Crie um array $ 1D $ com $ 50 $ coordenadas, todas iguais a $ 1 $, de duas maneiras diferentes.

Finalmente, podemos criar um novo array _da mesma forma e tipo de dados_ que um
array $ A $ dado, mas preenchido com zeros, uns ou algum outro valor especificado com as
fun√ß√µes `zeros_like`, `ones_like` e `full_like`, respectivamente:

In [None]:
A = np.array([[1, 2, 3],
              [4, 5, 6]])

Z = np.zeros_like(A)
print(Z, '\n')

T = np.full_like(A, 3)
print(T)

### $ 4.2 $ Gerando sequ√™ncias com `arange` e `linspace`

A fun√ß√£o `arange` √© muito parecida com a fun√ß√£o integrada `range` do Python, mas retorna um array:

In [None]:
digits = np.arange(10)
print(type(digits), digits)


A sintaxe completa √© `arange(<in√≠cio>, <fim>, <passo>)`. Observe que o valor inicial
est√° inclu√≠do, mas o valor final n√£o est√° (exatamente como no `range` normal).

In [None]:
y = np.arange(4, 10, 2)
print(y)

Uma vantagem do `arange` sobre o `range` √© que _ele aceita argumentos do tipo float_. Por exemplo:

In [None]:
x = np.arange(0.1, 1, 0.1)
print(x)

No entanto, esse recurso deve ser usado com cautela, pois √†s vezes erros de arredondamento
podem levar a resultados inesperados, como no seguinte exemplo:

In [None]:
print(np.arange(1, 1.3, 0.1))
print("Observe que o valor 1.3 foi inclu√≠do!")

__Exerc√≠cio:__ Para cada item, crie um array $ 1D $ contendo os elementos descritos:

(a) A sequ√™ncia de n√∫meros pares entre $ 2 $ e $ 19 $.

(b) Todos os inteiros de $ 10 $ at√© $ 1 $.

(c) Todos os inteiros de $ 5 $ a $ 15 $ (inclusive), mas representados como
n√∫meros de ponto flutuante.


(d) Todos os n√∫meros de $ -3.14 $ a $ 2.86 = -3.14 + 6 $, com um passo de $ 2 $.

Alternativamente, com `linspace` podemos construir um array contendo valores igualmente espa√ßados
dentro de um intervalo especificado. A sintaxe √© semelhante √† do `arange`,
exceto que _o valor final no segundo argumento est√° inclu√≠do_ no resultado, e
_o terceiro argumento fornece o n√∫mero de valores a serem gerados_, em vez do
tamanho do passo:

In [None]:
z = np.linspace(0, 10, 11)
print(z, '\n')

w = np.linspace(0, 10, 10)
print(w)

__Exerc√≠cio:__ Dividindo o intervalo $ [0, 1] $ em tr√™s partes iguais, obtemos tr√™s subintervalos de comprimento $ \frac{1}{3} $. Quantos pontos de subdivis√£o s√£o necess√°rios? Use `linspace` para obt√™-los.

__Exerc√≠cio:__ Quantos intervalos limitados s√£o determinados por $ n + 1 $ pontos igualmente espa√ßados em uma linha?

Recapitulando, a sintaxe √© `linspace(<in√≠cio>, <fim (inclusive)>, <# 
elementos>)`. Podemos excluir o valor final em `linspace` para faz√™-lo se comportar
de forma mais semelhante ao `arange` usando `endpoint=False`:

In [None]:
print(np.linspace(0, 10, 10, endpoint=False))

__Exerc√≠cio:__ O que acontece com o resultado de `linspace` se o valor inicial for maior que o valor final? E se eles forem iguais? E se o terceiro argumento for zero ou negativo? 

## $ \S 5 $ Acessando e modificando elementos individuais de arrays

Lembre-se que listas em Python s√£o __mut√°veis__, o que significa que podemos modificar
elementos individuais de uma lista:

In [None]:
primes = [199, 1_999, 19_999]
primes[2] = 19

Em contraste, uma tupla √© __imut√°vel__. Ainda podemos acessar seus
elementos atrav√©s de `[]`, mas n√£o podemos modific√°-los:

In [None]:
fruits = ('üçé', 'üçä', 'üçç')
print(fruits[0])

In [None]:
fruits[0] = 'üçâ'

Arrays NumPy tamb√©m s√£o mut√°veis, como listas. Considere o seguinte vetor $ \mathbf{a} $:

In [None]:
a = np.array([1, 2, 3])
print(a)

Para acessar ou modificar o elemento $ 0 $-√©simo de $ \mathbf a $ (lembre-se que sempre
contamos a partir de $ 0 $ em Python), usamos a mesma sintaxe que usar√≠amos se fosse uma
lista:

In [None]:
print(a[0])  # Acessar o elemento 0-√©simo de `a`
a[0] = -1    # Modificar este elemento
print(a)     # Imprimir o resultado

Se estamos lidando com um array $ 2D $, usamos `[i, j]` para acessar sua entrada $ (i, j) $-√©sima, ou seja, o elemento na linha $ i $ e coluna $ j $:

In [None]:
A = np.ones((2, 2))
print("Antes das modifica√ß√µes:")
print(A, '\n')

A[0, 1] = 0
A[1, 0] = 0 
print("Depois das modifica√ß√µes:")
print(A)

Em geral, ao lidar com um array $ n $-dimensional, use `[k_1, k_2, ..., k_n]` para acessar seu elemento com √≠ndices $ k_1, k_2, \cdots, k_n $, respectivamente.

__Exerc√≠cio:__ Construa um "array identidade $ 3D $" $ M $ de forma $ (5, 5, 5) $
primeiro preenchendo-o com zeros, depois definindo todos os elementos com √≠ndices
da forma $ (i, i, i) $ iguais a $ 1 $ das seguintes duas maneiras: 

(a) Usando um loop `for`.

(b) Com a chamada √∫nica `fill_diagonal(M, 1)`.

In [None]:
# Preencher M com zeros:
# M = ...

# Definir elementos diagonais iguais a 1:
# ...

# Imprimir o resultado:
# print(M)


## $ \S 6 $ Outros recursos do NumPy

Como veremos mais tarde, arrays s√£o muito mais eficientes e convenientes para computa√ß√£o
num√©rica do que os tipos de dados integrados do Python, como listas, tanto em mem√≥ria quanto
em custos computacionais. O NumPy √© usado em an√°lise de dados, aprendizado de m√°quina,
engenharia e qualquer outro campo que requer computa√ß√£o num√©rica intensiva.
Tamb√©m serve como base para bibliotecas de n√≠vel superior
como SciPy, pandas e scikit-learn. Outros recursos
fornecidos pelo NumPy incluem (mas n√£o se limitam a):
* Opera√ß√µes estat√≠sticas b√°sicas;
* Gera√ß√£o de n√∫meros aleat√≥rios a partir de v√°rias distribui√ß√µes de probabilidade;
* Transformadas de Fourier e processamento de sinais;
* Integra√ß√£o com v√°rios tipos de bancos de dados e formatos de arquivos para importa√ß√£o/exporta√ß√£o de dados.

Encontraremos e usaremos alguns desses em outros notebooks.