### BIBLIOTECAS

In [1]:
import pandas as pd
import numpy as np

## ASPECTOS BÁSICOS DO NUMPY

### ARRAY

Um array é uma estrutura de dados que armazena uma coleção de elementos, organizados em uma sequência indexada.
São utilizados em programação para armazenar e manipular conjuntos de dados.

In [2]:
### Mais velociade em executar o código com arrays numpy

arr = np.arange(1000)
lis = list(range(1000))

In [3]:
%timeit tempo_arr = arr * 2

1.83 µs ± 8.76 ns per loop (mean ± std. dev. of 7 runs, 1,000,000 loops each)


In [4]:
%timeit tempo_lis = [x * 2 for x in lis]

22.9 µs ± 512 ns per loop (mean ± std. dev. of 7 runs, 10,000 loops each)


### NDARRAY

#### Objetos array n-dimensionais

In [5]:
### Os dados devem ser do mesmo tipo
dados = np.array([[1.5, -0.1, 4], 
                  [0, -3, 6.5]])
dados

array([[ 1.5, -0.1,  4. ],
       [ 0. , -3. ,  6.5]])

##### Operações simples com o ndarray

In [6]:
dados * 10

array([[ 15.,  -1.,  40.],
       [  0., -30.,  65.]])

In [7]:
dados + dados

array([[ 3. , -0.2,  8. ],
       [ 0. , -6. , 13. ]])

In [8]:
### Tamanho da dimensão de um ndarray
dados.shape

(2, 3)

In [9]:
dados.dtype

dtype('float64')

##### Criando NDARRAYS

In [10]:
# Com lista / uma dimensão
data = [6, 7.5, 8, 0, 1]

arr1 = np.array(data)

In [11]:
### Com listas de listas
data2 = [[1, 2, 3, 4],
        [5, 6, 7, 8]]
arr2 = np.array(data2)
arr2

array([[1, 2, 3, 4],
       [5, 6, 7, 8]])

In [12]:
### .ndim | ver a dimensão do ndarray
arr2.ndim

2

In [13]:
arr2.shape

(2, 4)

##### Criando arrays com 0's

In [14]:
np.zeros(10)

array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])

In [15]:
np.zeros((3,3))

array([[0., 0., 0.],
       [0., 0., 0.],
       [0., 0., 0.]])

##### np.arange

In [16]:
### Versão com função interna do Python
np.arange(11)

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

In [19]:
### ndarray de um quadrado perfeito com 0's e 1's
np.eye(2)

array([[1., 0.],
       [0., 1.]])

##### Especificar o tipo do ndarray

In [23]:
arr3 = np.array([1,2,3], dtype = float)
arr3.dtype

dtype('float64')

In [26]:
### Mudando o tipo de um array
int_arr = arr3.astype(int)
int_arr.dtype

dtype('int64')

##### Aritimética com arrays

In [32]:
arr2

array([[1, 2, 3, 4],
       [5, 6, 7, 8]])

In [30]:
arr2 * arr2

array([[ 1,  4,  9, 16],
       [25, 36, 49, 64]])

In [31]:
arr2 - arr2

array([[0, 0, 0, 0],
       [0, 0, 0, 0]])

In [33]:
1 / arr2

array([[1.        , 0.5       , 0.33333333, 0.25      ],
       [0.2       , 0.16666667, 0.14285714, 0.125     ]])

In [38]:
### Comparar arrays simétricos gera arrays booleanos
arr2 > arr2

array([[False, False, False, False],
       [False, False, False, False]])

##### Indexação e fatiamentos básicos

Unidimensional

In [44]:
arr = np.arange(10)
arr

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [46]:
arr[4]

4

In [47]:
arr[5:8]

array([5, 6, 7])

In [49]:
arr[5:7] = 10
arr

array([ 0,  1,  2,  3,  4, 10, 10,  7,  8,  9])

n-dimensional

In [51]:
arr2d = np.array([[1, 2, 3],
                [4, 5, 6],
                [7, 8, 9]])
arr2d

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

In [52]:
### Fatia linha
arr2d[2]

array([7, 8, 9])

In [54]:
### Elementos individuais | array[linha][coluna]
arr2d[1][2]

6

##### Indexação booleana

In [62]:
names = np.array(['Davy', 'Gaby', 'John', 'Gaby', 'John', 'Davy', 'Davy'])
data = np.array([[4,7], [0, 2], [-5, 6], [0, 0],
               [1, 2], [-12, -4], [3, 4]])
names

array(['Davy', 'Gaby', 'John', 'Gaby', 'John', 'Davy', 'Davy'],
      dtype='<U4')

In [63]:
data

array([[  4,   7],
       [  0,   2],
       [ -5,   6],
       [  0,   0],
       [  1,   2],
       [-12,  -4],
       [  3,   4]])

In [64]:
names == 'Davy'

array([ True, False, False, False, False,  True,  True])

In [65]:
data[names == 'Davy']

array([[  4,   7],
       [-12,  -4],
       [  3,   4]])

In [66]:
data[names == 'Davy', 1:]

array([[ 7],
       [-4],
       [ 4]])

In [67]:
data[names == 'Davy', 1]

array([ 7, -4,  4])

In [69]:
data[names != 'Davy']

array([[ 0,  2],
       [-5,  6],
       [ 0,  0],
       [ 1,  2]])

In [70]:
### Combinando com operadores lógicos & (and) | (or)
mask = (names == 'Davy') | (names == 'Gaby')
mask

array([ True,  True, False,  True, False,  True,  True])

In [71]:
data[mask]

array([[  4,   7],
       [  0,   2],
       [  0,   0],
       [-12,  -4],
       [  3,   4]])

In [72]:
### removendo os negativos
data[data < 0] = 0

In [73]:
data

array([[4, 7],
       [0, 2],
       [0, 6],
       [0, 0],
       [1, 2],
       [0, 0],
       [3, 4]])

##### Indexação sofisticada

indexação com arrays inteiros

In [75]:
arr = np.zeros((8,4))
arr

array([[0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.]])

In [80]:
for x in range(8):
    arr[x] = x

In [81]:
arr

array([[0., 0., 0., 0.],
       [1., 1., 1., 1.],
       [2., 2., 2., 2.],
       [3., 3., 3., 3.],
       [4., 4., 4., 4.],
       [5., 5., 5., 5.],
       [6., 6., 6., 6.],
       [7., 7., 7., 7.]])

In [82]:
arr[[4, 3, 0, 6]]

array([[4., 4., 4., 4.],
       [3., 3., 3., 3.],
       [0., 0., 0., 0.],
       [6., 6., 6., 6.]])

###### reshape

In [86]:
arr = np.arange(32).reshape((8, 4))
arr

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11],
       [12, 13, 14, 15],
       [16, 17, 18, 19],
       [20, 21, 22, 23],
       [24, 25, 26, 27],
       [28, 29, 30, 31]])