# Python para Big Data - <span style="color:green">NumPy</span>

- Numpy é uma biblioteca fundamental para computação científica com Python. Suas principais funcionalidades:
    - Array de n-dimensões
    - Funções sofisticadas para trabalhar com esses arrays
    - Ferramentas para integrar código C/C++ e Fortran
    - Útil para álgebra linear, transformada de Fourier e capacidade de gerar números aleatórios

- Foi desenvolvido em 2005 e hoje é a base de outras bibliotecas como Pandas e Scikit-learn.

## Arrays

Um array Numpy é um conjunto de valores, todos de um mesmo tipo e indexados por um tupla de inteiros não negativos. O número de dimensões é o grau do array. A forma (shape) de um array é uma tupla de inteiros dado o tamanho de um array ao longo de cada dimensão.

Podemos criar um array NumPy de listas aninhada e acessar elementos utilizando colchetes.

In [None]:
import numpy as np

In [None]:
a = np.array([1, 2, 3]) # Cria um array de 1D

In [None]:
print(type(a)) # Imprime o tipo do array

In [None]:
print(a.shape) # Imprime a forma do array

In [None]:
print(a[0], a[1], a[2]) # Imprime os elementos do array

In [None]:
a[0] = 5 # Altera o elemento da posição de um array

In [None]:
print(a)

In [None]:
b = np.array([[1,2,3],[4,5,6]]) # Cria um array de 2D

In [None]:
print(b.shape) # Imprime a forma do array

In [None]:
print(b[0,0], b[0][1], b[0,2]) # São maneiras de imprimir os elementos do primeiro array

NumPy também fornece diversas funções para criar arrays.

In [None]:
a = np.zeros((2,2))   # Cria um array de 0s
print(a)              

In [None]:
b = np.ones((1,2))    # Cria um array de 1s
print(b)

In [None]:
c = np.full((2,2), 42)  # Cria um array com uma constante
print(c)

In [None]:
d = np.eye(2)         # Cria uma matrix de identidade 2x2
print(d)

In [None]:
e = np.random.random((2,2))  # Cria um array preenchido com números aleatórios
print(e)

<div class="alert alert-block alert-info">
Outros métodos para criar array pode ser visualizado na documentação: https://docs.scipy.org/doc/numpy/user/basics.creation.html#arrays-creation

## Indexando Array

Numpy oferece diversas maneiras de index arrays.

Indexar (Slice) array NumPy é similar a listas do Python. Como os arrays podem ser multidimensionais, deve-se especificar qual a dimensão que se deseja indexar.

In [None]:
import numpy as np

In [None]:
a = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]]) # Cria um array 2D no formato (3,4)

In [None]:
print(a.shape)

In [None]:
print(a)

Utilizando a indexação para extrair um subarray que consiste das duas primeiras linhas e a coluna 1 e 2 para criar um novo array, chamado b, no formato (2,2).

In [None]:
b = a[:2, 1:3]
print(b)

Uma indexação (slice) de um array é uma visão do mesmo conjunto de dados, portanto, se modifica-lo, irá modificar o array original.

In [None]:
print(a[0,1]) # Note que estamos imprimindo o valor do array original (a).

In [None]:
b[0,0] = 77 # Note que estamos modificando o subarray criado (b).
            # b[0, 0] é o mesmo pedação de dado do a[0,0]

In [None]:
print(b)

In [None]:
print(a[0,1]) # Note que estamos imprimindo o valor do array original (a).

<div class="alert alert-block alert-danger">
A criação de subarray ainda mantém o mesmo link para o array original. Ou seja, a alteração em qualquer um, irá refletir em ambos (conforme ilustrado acima)

Também é possível misturar diferentes indexadores. Entretando, o array novo terá um tamanho menor que o array original. Note que isso é um pouco diferente do jeito que o MATLAB lida com a indexação de arrays:

In [None]:
a = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]])

In [None]:
# Duas formas de acessar o dados no meio da linha de um array.
linha_l1 = a[1, :]
linha_l2 = a[1:2, :]

In [None]:
print(linha_l1, linha_l1.shape)
print("")
print(linha_l2, linha_l2.shape)

In [None]:
# Também é possível fazer a mesma distinção quando acessar as colunas de um array
coluna_l1 = a[:, 1]
coluna_l2 = a[:, 1:2]

print(coluna_l1, coluna_l1.shape)
print("")
print(coluna_l2, coluna_l2.shape)

<div class="alert alert-block alert-info">
Mais detalhes sobre indexação consulte a documentação: http://docs.scipy.org/doc/numpy/reference/arrays.indexing.html

## Datatypes

Todo array numpy é um conjunto de elementos de um mesmo tipo. NumPy fornece um grande conjunto de tipos de dados numéricos que podem ser utilizados para construir arrays numpy. Normalmente, o numpy tenta adivinhar o tipo de dado quando um array é criado, porém as funções que constroem os arrays, normalmente incluem uma opção que é definida por parâmetro para explicitamente especificar o tipo de dado. Segue um exemplo:

In [None]:
import numpy as np

In [None]:
x = np.array([1,2])
print(x.dtype)

In [None]:
x = np.array([1.0, 2.0])
print(x.dtype)

In [None]:
x = np.array([1, 2], dtype=np.int64)
print(x.dtype)

<div class="alert alert-block alert-info">
Mais informações sobre os tipos de dados pode ser visualizado na documentação: http://docs.scipy.org/doc/numpy/reference/arrays.dtypes.html

## Matemática com Arrays

Função básicas de matemática operam em cada elemento do array, e estão disponíveis como operador e como função no módulo numpy.

In [None]:
import numpy as np

x = np.array([[1,2],[3,4]], dtype=np.float64)
y = np.array([[5,6],[7,8]], dtype=np.float64)
print(x)
print("")
print(y)

In [None]:
# Soma por elemento
print(x + y)
print("")
print(np.add(x, y))

In [None]:
# Produto por elemento
print(x * y)
print("")
print(np.multiply(x, y))

In [None]:
# Divisão por elemento
print(x / y)
print("")
print(np.divide(x, y))

In [None]:
# Raiz quadrado por elemento
print(np.sqrt(x))

<div class="alert alert-block alert-danger">
Note que diferentemente do MATLAB, * é utilizado para multiplicação dos elementos, não a multiplicação de matrizes. Para isso utiliza-se a função ```dot``` para computer produtos de vetores por um matriz e multiplicar matrizes. 

In [None]:
import numpy as np

x = np.array([[1,2],[3,4]])
y = np.array([[5,6],[7,8]])

v = np.array([9,10])
w = np.array([11, 12])


In [None]:
# Multiplicação dos elementos dos vetores
print(v.dot(w))
print("")
print(np.dot(v, w))

In [None]:
# Produto da Matriz / Vetor
print(x.dot(v))
print("")
print(np.dot(x, v))

In [None]:
# Produto da Matriz / Matriz}
print(x.dot(y))
print("")
print(np.dot(x, y))

Numpy fornece diversas funções para realizar computações em arrays, como por exemplo ```sum```:

In [None]:
import numpy as np

x = np.array([[1,2],[3,4]])

print(np.sum(x)) # Computa a soma de todos os elementos
print(np.sum(x, axis=0))  # Computa a soma de cada coluna
print(np.sum(x, axis=1))  # Computa asoma de cada linha

<div class="alert alert-block alert-info">
Outras informações sobre funções matemáticas podem ser visualizadas na documentação: http://docs.scipy.org/doc/numpy/reference/routines.math.html ou http://docs.scipy.org/doc/numpy/reference/routines.array-manipulation.html

## Exercícios

**```1 - Crie o array abaixo (sem ter que digitar explicitamente os valores).```**

    ex1 = [1,3,5,7,9,11]

**```2 - Crie um array 2x2 elementos aletatórios. Os valores gerados devem ficar entre 0 e 1. Utilize o np.random para resolver esse exercício```**

## Documentação NumPy

Neste notebook foram apresentados alguns exemplos dessa biblioteca, verifique a documentação de referencia do numpy para encontrar mais sobre o numpy.

http://docs.scipy.org/doc/numpy/reference/

## Referências

* https://docs.scipy.org/doc/numpy/user/basics.creation.html#arrays-creation
* http://cs231n.github.io/python-numpy-tutorial/#numpy
* http://scipy.github.io/old-wiki/pages/NumPy_for_Matlab_Users
* https://www.dataquest.io/blog/numpy-tutorial-python/