# Introdução ao Numpy

O principal objeto NumPy é um array multi-dimensional homogeneo (**ndarray**). É uma tabela de elementos (usualmente números), no qual todos os elementos possuem o mesmo tipo indexados por uma tupla de inteiros não negativos. Em numpy, as dimensões são chamadas de **axis**

In [None]:
!pip install numpy

In [1]:
import numpy as np

## 1. Criando Arrays

* np.array()
* np.zeros()
* np.ones()
* np.empty()
* np.eye()
* np.asarray()
* np.arange()
* np.linspace()

### 1.1 np.array()

In [6]:
a = np.array([1,2,3,4,5,6]) #cria um ndaaray de uma dimensão
print(f'Array de uma dimensão: \n{a}')

Array de uma dimensão: 
[1 2 3 4 5 6]


In [5]:
#cria um array de 2 dimensões
b = np.array([[1, 2, 3], 
             [4, 5, 6]])
print(f'Array com multiplas dimensões: \n {b}')

Array com multiplas dimensões: 
 [[1 2 3]
 [4 5 6]]


### 1.2 np.zeros(), np.ones(), np.empty()

Esses métodos são utilizados para criação de arrays como **placeholders** (i.e., que serão prenchidos). Para isso, precisamos informar apenas o formato desejado. Este métodos evita a necessidade de aumentar as dimensões dos arrays de forma dinâmica, a qual é uma operação custosa.

Portanto, **np.zeros(shape=(m,n))** cria um array de mxn preenchidos com 0, enquanto **np.ones()** preenche o array com 1. Por fim, **np.empty()** preenche o array com valores aleatórios. É importante destacar que o dtype padrão é float64.

In [7]:
c = np.zeros((2, 2))
print(f"Array preenchidos com zeros: \n {c}")

Array preenchidos com zeros: 
 [[0. 0.]
 [0. 0.]]


In [8]:
d = np.ones((2, 2))
print(f"Array preenchidos com zeros: \n {d}")

Array preenchidos com zeros: 
 [[1. 1.]
 [1. 1.]]


In [10]:
e = np.empty((2, 2))
print(f"Array preenchidos com zeros: \n {e}")

Array preenchidos com zeros: 
 [[1. 1.]
 [1. 1.]]


### 1.3 np.eye()

Cria um ndarray com 1s apenas na diagonal principal

In [13]:
np.eye(5)

array([[1., 0., 0., 0., 0.],
       [0., 1., 0., 0., 0.],
       [0., 0., 1., 0., 0.],
       [0., 0., 0., 1., 0.],
       [0., 0., 0., 0., 1.]])

### 1.4 np.asarray()
Converte a entrada em um ndarray

In [14]:
f = np.asarray([1, 2, 3, 4, 5, 6])
print(f'Array de uma dimensão: \n{f}')

Array de uma dimensão: 
[1 2 3 4 5 6]


### 1.5 diferença entre np.array() e np.asarray()

A diferença principal é que o np.array() por padrão cria uma cópia do objeto, enquanto o np.asarray() não cria está cópia.

In [23]:
a = np.array([1, 2], dtype=np.float32)

print(f"Dados não alterados {np.array(a, dtype=np.float32) is a}")
print(f"Dados alterados {np.array(a, dtype=np.float64) is a}")
print(f"Dados não alterados {np.asarray(a, dtype=np.float32) is a}")
print(f"Dados alterados {np.asarray(a, dtype=np.float64) is a}")

Dados não alterados False
Dados alterados False
Dados não alterados True
Dados alterados False


### 1.6 np.arange()

Este métodos é utilizado para criar ndarrays com valores dentro de um intervalo definido:
* np.arange(start, stop, step)
    * **start**: valor inicial do intervalo
    * **stop**: valor final do intervalo
    * **step**: espaçamento entre os valores do intervalo

In [26]:
g = np.arange(10, 20, 2)
print(f'O array criado foi: \n{g}')

O array criado foi: 
[10 12 14 16 18]


### 1.7 np.linspace()

retorna uma sequencia igualmente espaçada baseado em um intervalo
* np.linspace(start, stop, num=50)

In [27]:
h = np.linspace(0, 99, 10)
print(f'O array criado foi: \n{h}')

O array criado foi: 
[ 0. 11. 22. 33. 44. 55. 66. 77. 88. 99.]


## 2. Atributos Importantes de um ndarray

* ndarray.dim
    * representa o número de dimensões do array
* ndarray.shape
    * representa o formato do array
* ndarray.size
    * representa a quantidade total de elementos no array
* ndarray.dtype
    * representa o tipo dos elementos do array
* ndarray.itemsize
    * representa o tamanho em bytes dos elementos do array
* ndarray.data
    * representa os elementos do array.

In [28]:
a = np.array([[1, 2],
              [3, 4],
              [5, 6]
            ])
a.shape

(3, 2)

In [29]:
a.size

6

In [30]:
a.ndim

2

In [31]:
a.dtype

dtype('int32')

## 3. Indexando, Fatiando e Iterando arrays

ndarrays podem ser indexados, fatiados (i.e., slicing) e iterados, da mesma forma que as listas em python

### 3.1 Indexando arrays

In [33]:
a = np.array([[1, 2],
              [3, 4]
             ])

b = a[0][1]
print(f'a: \n{a}')
print(f'b: \n{b}')

a: 
[[1 2]
 [3 4]]
b: 
2


### 3.2 Fatiando arrays (Slicing)

In [35]:
a = np.arange(20)
print(a[2:10:2])
print(a[2:10])
print(a[2])
print(a[2:])

[2 4 6 8]
[2 3 4 5 6 7 8 9]
2
[ 2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19]


## 4. Alterando o Formato do Array (reshaping)

altera o formato (i.e., shape) do array sem alterar os dados
* np.reshape(a, newshape)

In [36]:
a = np.arange(6)
b = a.reshape(2,3)
print(f'a: \n{a}')
print(f'b: \n{b}')

a: 
[0 1 2 3 4 5]
b: 
[[0 1 2]
 [3 4 5]]


## 5. Broadcasting

O termo *broadcasting* descreve como o NumPy trata arrays com formas diferentes durante operações aritméticas. Sujeito a certas restrições, a matriz menor é “transmitida” pela matriz maior para que tenham formas compatíveis. Broadcasting fornece um meio de vetorizar operações de matriz para que o loop ocorra em C em vez de Python. Ele faz isso sem fazer cópias desnecessárias de dados e geralmente leva a implementações de algoritmo eficientes. Há, no entanto, casos em que a transmissão é uma má ideia porque leva ao uso ineficiente da memória que retarda a computação.

As operações NumPy geralmente são feitas em pares de arrays elemento por elemento. No caso mais simples, os dois arrays devem ter exatamente a mesma forma, como no exemplo a seguir:

In [37]:
a = np.array([1.0, 2.0, 3.0])
b = np.array([2.0, 2.0, 2.0])
a * b

array([2., 4., 6.])

A regra de transmissão do NumPy relaxa essa restrição quando as formas das matrizes atendem a certas restrições. O exemplo de transmissão mais simples ocorre quando uma matriz e um valor escalar são combinados em uma operação:

In [38]:
a = np.array([1.0, 2.0, 3.0])
b = 2.0
a * b

array([2., 4., 6.])

![image.png](attachment:image.png)

Ao operar em dois arrays, o NumPy compara suas formas elementarmente. Ele começa com a dimensão à direita (ou seja, mais à direita) e segue para a esquerda. Duas dimensões são compatíveis quando

* são iguais ou
* um deles é 1.

Se essas condições não forem atendidas, uma exceção **ValueError: os operandos não puderam ser transmitidos será lançada, indicando que as matrizes têm formas incompatíveis.**

os arrays de entrada não precisam ter o mesmo número de dimensões. O arrays resultante terá o mesmo número de dimensões que o array de entrada com o maior número de dimensões, onde o tamanho de cada dimensão é o maior tamanho da dimensão correspondente entre os arrays de entrada. Observe que as dimensões ausentes são consideradas de tamanho um.

In [39]:
a = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
b = np.array([1, 2, 3])
print(a.shape)
print(b.shape)

(3, 3)
(3,)


In [40]:
#Exemplo stretch
np.array([b, b, b])

array([[1, 2, 3],
       [1, 2, 3],
       [1, 2, 3]])

In [41]:
c = a + b
print(f'a: \n {a}')
print(f'broadcasting c: \n {c}')

a: 
 [[1 2 3]
 [4 5 6]
 [7 8 9]]
broadcasting c: 
 [[ 2  4  6]
 [ 5  7  9]
 [ 8 10 12]]


## 6. Funções comuns do NumPy

### 6.1 ndarray.flat()

utilizado para "vetorizar" um array de múltiplas dimensões

In [42]:
a = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(f'a: \n {a}')
print(f'a flat: \n {a.flat[:]}')

a: 
 [[1 2 3]
 [4 5 6]
 [7 8 9]]
a flat: 
 [1 2 3 4 5 6 7 8 9]


### 6.2 ndarray.transpose()

faz a transposição dos eixos do array

In [45]:
a = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
a

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

In [46]:
np.transpose(a)

array([[1, 4, 7],
       [2, 5, 8],
       [3, 6, 9]])

In [44]:
a.T

array([[1, 4, 7],
       [2, 5, 8],
       [3, 6, 9]])

### 6.3 np.concatenate(a1, a2, axis)

Concatena uma sequencia de arrays baseado no axis especificado

In [48]:
a = np.arange(6).reshape(2, 3)
b = np.arange(7, 13).reshape(2, 3)
print(f'a: \n{a}')
print(f'b: \n{b}')

a: 
[[0 1 2]
 [3 4 5]]
b: 
[[ 7  8  9]
 [10 11 12]]


In [49]:
np.concatenate((a, b), axis=0)

array([[ 0,  1,  2],
       [ 3,  4,  5],
       [ 7,  8,  9],
       [10, 11, 12]])

In [50]:
np.concatenate((a, b), axis=1)

array([[ 0,  1,  2,  7,  8,  9],
       [ 3,  4,  5, 10, 11, 12]])

### 6.4 np.append()

Adiciona valores no final do array, como o .append() das listas em python

In [51]:
a = np.array([[1,2,3] , [4, 5, 6]])
b = np.append(a, [[7, 8, 9]], axis=0) #axis especifica em qual dimensão
c = np.append(a, [[7, 8, 9]])

print(f'b: \n {b}')
print(f'c: \n {c}')

b: 
 [[1 2 3]
 [4 5 6]
 [7 8 9]]
c: 
 [1 2 3 4 5 6 7 8 9]


### 6.5 np.insert()

Podemos inserir valores baseado em um axis e um indice
* np.insert(arr, idx, values, axis)

In [56]:
a = np.arange(6).reshape(2, 3)
a

array([[0, 1, 2],
       [3, 4, 5]])

In [57]:
np.insert(a, 2, [7, 8])

array([0, 1, 7, 8, 2, 3, 4, 5])

In [61]:
np.insert(a, 2, [7, 8], axis=1)

array([[0, 1, 7, 2],
       [3, 4, 8, 5]])

### 6.6 np.delete()

retorna um novo array sem a linha ou a coluna informada

In [62]:
a

array([[0, 1, 2],
       [3, 4, 5]])

In [63]:
np.delete(a, 0, axis=1)

array([[1, 2],
       [4, 5]])

In [64]:
np.delete(a, 0, axis=0)

array([[3, 4, 5]])

## 7. Operações Aritméticas

* soma
* subtração
* multiplicação
* divisão
* soma acumulada (cumsum)
* dot (multiplicação de matrizes)


In [70]:
a = np.arange(6).reshape(2, 3)
a

array([[0, 1, 2],
       [3, 4, 5]])

In [71]:
b = np.arange(10, 16).reshape(2, 3)
b

array([[10, 11, 12],
       [13, 14, 15]])

### 7.1 Soma

In [116]:
print(np.add(a, b))
print(f' np.add(a, b) == a + b: \n {np.add(a, b) == a + b}')

[[10 12 14]
 [16 18 20]]
 np.add(a, b) == a + b: 
[[ True  True  True]
 [ True  True  True]]


### 7.2 Subtração

In [105]:
a - b

array([[-10, -10, -10],
       [-10, -10, -10]])

### 7.3 Multiplicação

In [106]:
a * b

array([[ 0, 11, 24],
       [39, 56, 75]])

### 7.4 Divisão

In [107]:
a / b

array([[0.        , 0.09090909, 0.16666667],
       [0.23076923, 0.28571429, 0.33333333]])

### 7.5 Dot

In [108]:
np.dot(a, b)

ValueError: shapes (2,3) and (2,3) not aligned: 3 (dim 1) != 2 (dim 0)

In [109]:
np.dot(a, b.T)

array([[ 35,  44],
       [134, 170]])

In [110]:
a@b.T

array([[ 35,  44],
       [134, 170]])

## 8. Operações de Agregação

* np.sum()
* np.mean()
* np.std()
* np.var()

In [82]:
array_gigante = np.random.randint(0, 1000, size=1_000_000)

In [83]:
%timeit sum(array_gigante)
%timeit np.sum(array_gigante)

83.5 ms ± 201 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)
302 µs ± 1.74 µs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)


### 8.1 np.sum()

In [84]:
np.sum(array_gigante)

498773807

### 8.2 np.mean()

In [86]:
np.mean(array_gigante)

498.773807

### 8.3 np.std()

In [87]:
np.std(array_gigante)

288.5979353975471

### 8.4 np.var()

In [88]:
np.var(array_gigante)

83288.76831572675

### 8.5 np.max()

In [103]:
np.max(array_gigante)

999

### 8.6 np.min()

In [104]:
np.min(array_gigante)

0

## 9. Agregação com múltiplas dimensões

podemos utilizar o axis para fazer diferentes agregações

![image-3.png](attachment:image-3.png)

In [99]:
a = np.arange(6).reshape(2, 3)
a

array([[0, 1, 2],
       [3, 4, 5]])

### 9.1 sem axis

In [100]:
np.sum(a)

15

### 9.2 axis=0

In [101]:
np.sum(a, axis=0)

array([3, 5, 7])

### 9.3 axis=1

In [102]:
np.sum(a, axis=1)

array([ 3, 12])

array([1, 3, 6], dtype=int32)