# Tutorial da Biblioteca Numpy

O Numpy é uma biblioteca poderosa bastante utilizada em Ciência de Dados, uma vez que possibilita operações com elementos denominados de ndarrays. Os ndarrays são os elementos básicos da biblioteca e podem formar vetores e matrizes n-dimensionais.

## Este tutorial compreende:

- Criação de vetores e matrizes 
- Tamanho e dimensões
- Indexação
- Transmissão
- Operações com arrays
- Principais atributos

**Importando a biblioteca**

In [29]:
import numpy as np

### Criação de vetores e matrizes

In [30]:
vet = np.array([1,2,3,4,5,6,7])
vet

array([1, 2, 3, 4, 5, 6, 7])

In [31]:
matrix = np.array([[1,2,3,4,5,6,7],
                   [2,3,4,5,6,7,8],
                   [7,6,5,4,3,2,1]])
matrix

array([[1, 2, 3, 4, 5, 6, 7],
       [2, 3, 4, 5, 6, 7, 8],
       [7, 6, 5, 4, 3, 2, 1]])

Por default o tipo do ndrray é int32

In [28]:
vet.dtype

dtype('int32')

**Existem outras duas principais formas de criar um ndarray**

In [6]:
np.arange(0,10)

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [11]:
np.linspace(0,10,3)

array([ 0.,  5., 10.])

**Funções especiais para criação de matrizes**

In [14]:
np.zeros((3,3))

array([[0., 0., 0.],
       [0., 0., 0.],
       [0., 0., 0.]])

In [16]:
np.ones((2,2))

array([[1., 1.],
       [1., 1.]])

In [19]:
np.eye(3) #Matriz identidade

array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])

**É possível tambem criar ndarrays a partir de listas python**

In [10]:
my_list = [2,3,4,5]
np.array(my_list)

array([2, 3, 4, 5])

**Arrays Randômicos**

- rand()
- randn()
- randint()

In [21]:
#Valores aleatórios em uma matriz 3x3
np.random.rand(3,3)

array([[0.1320111 , 0.60559767, 0.6747612 ],
       [0.8017495 , 0.59157309, 0.25884799],
       [0.23632828, 0.09860011, 0.08315871]])

In [23]:
# Valores aleatórios em uma distribuição normal
np.random.randn(3,3)

array([[ 1.23421333,  0.64624781, -0.60326794],
       [-0.43988985, -1.96508982, -0.7679    ],
       [-1.23569318, -1.19082378,  0.9199593 ]])

In [26]:
#Valores aleatórios inteiros menores que 100
np.random.randint(100, size=(3,3))

array([[21, 78, 24],
       [64, 17, 91],
       [ 9, 74, 10]])

### Tamanho e Dimensões

É possível verificar o tamanho e dimensão dos ndarrays através dos atributos:

- .itemsize
- .size
- .shape
- .ndim

O tributo **.itemsize** retorna o tamanho em bits de cada elemento no array.
Neste caso o tamanho é 4, pois o array é do tipo 'int32'

In [32]:
matrix.itemsize

4

O atributo **.size** retorna a quantidade de elementos no array

In [33]:
matrix.size

21

O atributo **.shape** retorna uma tupla com a quantidade de linhas e colunas, respectivamente

In [34]:
matrix.shape

(3, 7)

O atributo **.ndim** retorna a quantidade de dimensões do array

In [36]:
matrix.ndim

2

### Indexação

A Indexação de vetores é feita entre colchetes. É inserido o número do índice do elemento. A contagem inicia a partir do zero.

In [37]:
vet[1]

2

**Na matriz a indexação pode ser feita de diferentes maneiras.** 

Seleção de um único elemento da matriz

In [38]:
matrix[0][4]

5

Seleção de um subconjunto da matriz

In [39]:
matrix[0:3,1:4]

array([[2, 3, 4],
       [3, 4, 5],
       [6, 5, 4]])

Para selecionar todas as linhas e as duas primeiras colunas

In [40]:
matrix[:,0:2]

array([[1, 2],
       [2, 3],
       [7, 6]])

Para selecionar apenas as duas primeiras linhas e todas as colunas 

In [41]:
matrix[:2,:]

array([[1, 2, 3, 4, 5, 6, 7],
       [2, 3, 4, 5, 6, 7, 8]])

Para que as operações realizadas com o subconjunto da matriz não afetem a matriz original, recomenda-se a utilização do método **copy()**

In [42]:
slice_ = matrix[:,:3]

In [43]:
slice_[:] = 100

In [44]:
slice_

array([[100, 100, 100],
       [100, 100, 100],
       [100, 100, 100]])

In [45]:
matrix

array([[100, 100, 100,   4,   5,   6,   7],
       [100, 100, 100,   5,   6,   7,   8],
       [100, 100, 100,   4,   3,   2,   1]])

In [46]:
slice_2 = matrix[:2,:3].copy()

In [47]:
slice_2

array([[100, 100, 100],
       [100, 100, 100]])

In [48]:
slice_2[:] = 50

In [49]:
matrix

array([[100, 100, 100,   4,   5,   6,   7],
       [100, 100, 100,   5,   6,   7,   8],
       [100, 100, 100,   4,   3,   2,   1]])