# NumPy 

![numpy](https://cdn-images-1.medium.com/max/1200/1*00pL0zLnfI7y8d5G1aQrHA.jpeg)

* Biblioteca de Álgebra linear, que serve como base pra Data Science

* Usamos elas pra criar e manipular vetores e matrizes.

* Outras Bibliotecas (como o Pandas) que veremos mais adiante são criadas em cima dessa

    E por que não utilizarmos listas para a mesma função?

 Escalabilidade -> Tempo de execução muito menor e mais recuros prontos
(http://stackoverflow.com/questions/993984/why-numpy-instead-of-python-lists)

Além disso, Numpy contempla uma série de outras funcionalidades.
Vamos cobrir algumas delas

(https://docs.scipy.org/doc/numpy-1.10.1/genindex.html) - para mais info

### Importando Numpy

In [1]:
import numpy as np
# np é a forma mais comum de referenciar a biblioteca Numpy, provavelmente você vai se deparar com isso diversas vezes

### Criando Vetores (Ou Arrays) e Matrizes

In [3]:
# Criando um vetor de uma lista
lista = ['a', 'b', 'c']
np.array(lista)

array(['a', 'b', 'c'], dtype='<U1')

In [5]:
# Criando uma matriz de uma lista de listas
matriz = [[1,2,3],[4,5,6],[7,8,9]]
np.array(matriz)

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

In [15]:
# arrange(inicio, fim, passo)
print(
    np.arange(0,10)
)
print(
    np.arange(0,10,2)
)

[0 1 2 3 4 5 6 7 8 9]
[0 2 4 6 8]


In [22]:
# linspace(inicio, fim, "qtd de numeros igualmente espaçados")
print(
    np.linspace(1,10,25)
)

[ 1.     1.375  1.75   2.125  2.5    2.875  3.25   3.625  4.     4.375
  4.75   5.125  5.5    5.875  6.25   6.625  7.     7.375  7.75   8.125
  8.5    8.875  9.25   9.625 10.   ]


### Matrizes famosas

In [11]:
#Matriz de Zeros
np.zeros((3,4))

array([[0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.]])

In [12]:
#Matriz de um's
np.ones((4,3))

array([[1., 1., 1.],
       [1., 1., 1.],
       [1., 1., 1.],
       [1., 1., 1.]])

In [13]:
#Matriz Identidade
np.eye(3)

array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])

In [33]:
# Matriz Aleatória de 0 até 1
print(
    np.random.rand(5,6)
)

[[0.41164017 0.26546662 0.67442022 0.06602336 0.26649616 0.1398955 ]
 [0.77018797 0.82192521 0.40722567 0.70429221 0.99750501 0.01129763]
 [0.84930711 0.59699868 0.24187802 0.74689848 0.31232606 0.6789554 ]
 [0.48777978 0.39766859 0.03749199 0.23203012 0.88997093 0.13873982]
 [0.47362459 0.11165663 0.65291658 0.7239522  0.18357688 0.5566733 ]]


In [34]:
# Matriz Aleatória de distribuição normal
print(
    np.random.randn(5,6)
)

[[-0.04962265  0.44069349 -0.8803076   0.53969514  0.26901578 -0.4148044 ]
 [ 1.35039066  0.31636356  0.28796744 -0.0228297   1.97661537 -1.44590582]
 [-0.4974347   1.23031864 -1.70185061 -0.20051645  1.74526704  0.49199054]
 [ 1.01610923  0.44524004 -0.57174753  0.84874673  0.15078178 -1.09826454]
 [ 0.78863721  0.49157027  1.02132643  0.6303067  -0.38432792 -0.99159984]]


In [39]:
# Matriz Aleatória de valores inteiros(menor possibilidade, maior possibilidade, (tamanho da matriz))
print(
    np.random.randint(1,10,(5,10))
)

[[2 7 8 7 1 9 4 8 8 2]
 [3 5 4 9 5 7 5 4 4 6]
 [5 5 7 5 1 2 7 5 9 4]
 [1 6 9 8 5 1 5 6 7 3]
 [8 4 9 4 6 5 2 7 9 3]]


## Principais Atributos

In [134]:
x = np.random.randint(1,10,9)
x

array([3, 5, 3, 8, 9, 9, 7, 4, 5])

In [135]:
x.shape

(9,)

In [136]:
print(x.max())
print(x.argmax())
print(x.min())
print(x.argmin())

9
4
3
0


In [137]:
x = x.reshape(3,3)
print(x)

[[3 5 3]
 [8 9 9]
 [7 4 5]]


In [138]:
x.shape

(3, 3)

## Operações

In [139]:
print(x)

[[3 5 3]
 [8 9 9]
 [7 4 5]]


In [140]:
x + x

array([[ 6, 10,  6],
       [16, 18, 18],
       [14,  8, 10]])

In [141]:
x - x.max()

array([[-6, -4, -6],
       [-1,  0,  0],
       [-2, -5, -4]])

In [142]:
print(
    x / ( x - x.max() )
)

[[-0.5  -1.25 -0.5 ]
 [-8.     inf   inf]
 [-3.5  -0.8  -1.25]]


  


In [143]:
print(
    (x - x.max()) / ( x - x.max() )
)

[[ 1.  1.  1.]
 [ 1. nan nan]
 [ 1.  1.  1.]]


  


In [144]:
x * x

array([[ 9, 25,  9],
       [64, 81, 81],
       [49, 16, 25]])

In [145]:
np.sqrt(x)

array([[1.73205081, 2.23606798, 1.73205081],
       [2.82842712, 3.        , 3.        ],
       [2.64575131, 2.        , 2.23606798]])

In [146]:
np.exp(x)

array([[  20.08553692,  148.4131591 ,   20.08553692],
       [2980.95798704, 8103.08392758, 8103.08392758],
       [1096.63315843,   54.59815003,  148.4131591 ]])

In [147]:
np.log(x)

array([[1.09861229, 1.60943791, 1.09861229],
       [2.07944154, 2.19722458, 2.19722458],
       [1.94591015, 1.38629436, 1.60943791]])

In [148]:
a = [0, 1]
b = [0, 0]
c = [0, 0]
y = np.array((a,b,c))

np.dot(x,y)

array([[0, 3],
       [0, 8],
       [0, 7]])

In [149]:
x @ y

array([[0, 3],
       [0, 8],
       [0, 7]])

In [150]:
x.sum()

53

In [151]:
x.sum(axis=0)

array([18, 18, 17])

In [152]:
x.sum(axis=1)

array([11, 26, 16])

In [154]:
x.std()

2.282515398241571

In [155]:
x.std(axis=1)

array([0.94280904, 0.47140452, 1.24721913])

In [156]:
x.mean()

5.888888888888889

In [157]:
x.mean(axis=0)

array([6.        , 6.        , 5.66666667])

## Indexação

In [109]:
print(x)
print('')
print(x[1])
print('')
print(x[1][2])

[[6 7 6]
 [6 4 5]
 [1 7 6]]

[6 4 5]

5


In [121]:
#Indexação por linhas inteiras (permite fora de ordem)
x[[1, 2, 0, 1]]

array([[6, 4, 5],
       [1, 7, 6],
       [6, 7, 6],
       [6, 4, 5]])

In [130]:
#Indexação usando True / False
x = np.arange(1,10)
x

array([1, 2, 3, 4, 5, 6, 7, 8, 9])

In [131]:
x >= 5

array([False, False, False, False,  True,  True,  True,  True,  True])

In [128]:
x[x>=5]

array([5, 6, 7, 8, 9])