# Parte 1:  Numpy

 - Site da biblioteca (e documentação) : http://www.numpy.org/ 

 - Referências sobre numpy array: https://docs.scipy.org/doc/numpy/reference/arrays.html
 
 Para instalar a biblioteca devemos usar o pip:
 > `pip install numpy`<br>
 
 ou
 
 > `pip3 install numpy`.

## Anaconda

Anaconda é uma distribuição de bibliotecas para computação científica em Python e em R. Com uma instalação somente você já terá todas as bibliotecas e ferramentas (tais como o Jupyter) que usaremos no curso e muitas outras.

## Jupyter Notebooks

Para análise de dados e *data science*, precisamos de uma ferramenta mais dinâmica e amigável para programar. Em vez de usarmos o Sublime-text ou outros editores de texto e compilarmos o código após teminarmos, usaremos o __Jupyter Notebook__. Essa ferramenta permite rodar pedaços de código de maneira dinâmica e interativa, de sorte que pode-se editar e compilar os comando sem precisar mudar de página. Mais ainda, o Jupyter consegue exibir *dataframes* e *gráficos* na própria página, de forma a facilitar as análises. O Jupyter ainda permite edição do tipo *markdown*, com apoio a fórmulas $\LaTeX$ tais como

$$\zeta(s) = \sum_{n = 1}^{\infty}\frac{1}{n^s}.$$

## Overview:

- importando a biblioteca;
- cirando listas do numpy;
- operações com listas do numpy;
- recortes de listas; e
- máscaras.

##  Importando a biblioteca Numpy
Sempre comece importando a biblioteca para o funcionamento correto dos comandos do numpy:

In [None]:
import numpy as np

## Listas do Numpy vs listas do Pyhton 
As listas do numpy são diferentes das listas do python. As principais diferenças são:
 - __memória usada:__ uma lista do tipo `list` com 1 milhão de itens ocupa em torno de 20 MB de memória, ao passo que uma lista do tipo `np.ndarray` do mesmo comprimento irá ocupar em torno de 4 MB; e
 - __Otimização:__ a estrutura `np.array` está otimizada para cálculos númericos tanto em questão de performace quanto nas operações que são possíveis com as np.ndarray.

## Rotina  de criação de listas Numpy 

### 1. Listas a partir de outras listas

Uma lista numpy pode ser criada especificando os elementos, especificando intervalos numéricos ou através da importação de dados de arquivos externos. A maneira mais simples de se criar uma lista numpy é com a função `np.array()`, que vai receber um *array* e devolver uma `np.ndarray` cujas entradas são as mesmas do lista original.

In [None]:
lista = [1,2,3,4,5] # cria uma lista comum do python.
listaNumpy = np.array(lista) # a função np.array() cria uma lista do tipo np.ndarray
listaNumpy

In [None]:
type(listaNumpy)

Os tipos de estruturas da `lista`e `listaNumpy` são diferentes:

In [None]:
lista = [1,2,3,4,5] # cria uma lista comum do python.
listaNumpy = np.array(lista) # a função np.array() cria uma lista do tipo np.ndarray
print(type(lista)) # a função type() retorna o tipo de objeto
print(type(listaNumpy))

Outras formas são possiveis de criar listas `np.ndarray` é criar uma lista de um determinado tamanho cujos elementos são todos `0`ou `1`.

In [None]:
#Criando array de zeros de tamanho 10:
zeros = np.zeros(10)
zeros

In [None]:
np.fives(10)

In [None]:
#Criando array de uns de tamanho 10:
uns = np.ones(10)
print(5*uns)
print(uns)

A biblioteca `numpy` possui constantes famosas como $\pi$ ou o número de Euler $e= 2.718281828...$

In [None]:
#Criando array de tamanho 10 na qual todas as entradas são iguais a pi:
np.pi

In [None]:
#Criando array de tamanho 10 na qual todas as entradas são iguais ao número de Euler:
Euler = np.ones(10) * np.e
print(Euler)

## Exercícios

__Exercício 1:__ Crie uma lista numpy de 100 elementos todos iguais à constante $\pi$.

__Exercício 2:__ Crie uma lista numpy de todos os inteiros de 1 até 100.

__Exercício 3:__ Crie uma lista numpy de 100 elementos cujo primeiro elemento é 0 e a diferença entre sucessivos elementos dessa lista é 0.01.

__Exercício 4:__ Crie uma lista numpy com os quadrados de todos os elementos da lista numpy do exercício anterior.

In [2]:
import numpy as np

In [3]:
# ex. 1
np.pi*np.ones(100)

array([3.14159265, 3.14159265, 3.14159265, 3.14159265, 3.14159265,
       3.14159265, 3.14159265, 3.14159265, 3.14159265, 3.14159265,
       3.14159265, 3.14159265, 3.14159265, 3.14159265, 3.14159265,
       3.14159265, 3.14159265, 3.14159265, 3.14159265, 3.14159265,
       3.14159265, 3.14159265, 3.14159265, 3.14159265, 3.14159265,
       3.14159265, 3.14159265, 3.14159265, 3.14159265, 3.14159265,
       3.14159265, 3.14159265, 3.14159265, 3.14159265, 3.14159265,
       3.14159265, 3.14159265, 3.14159265, 3.14159265, 3.14159265,
       3.14159265, 3.14159265, 3.14159265, 3.14159265, 3.14159265,
       3.14159265, 3.14159265, 3.14159265, 3.14159265, 3.14159265,
       3.14159265, 3.14159265, 3.14159265, 3.14159265, 3.14159265,
       3.14159265, 3.14159265, 3.14159265, 3.14159265, 3.14159265,
       3.14159265, 3.14159265, 3.14159265, 3.14159265, 3.14159265,
       3.14159265, 3.14159265, 3.14159265, 3.14159265, 3.14159265,
       3.14159265, 3.14159265, 3.14159265, 3.14159265, 3.14159

In [5]:
# Ex. 2
np.arange(1,101)

array([  1,   2,   3,   4,   5,   6,   7,   8,   9,  10,  11,  12,  13,
        14,  15,  16,  17,  18,  19,  20,  21,  22,  23,  24,  25,  26,
        27,  28,  29,  30,  31,  32,  33,  34,  35,  36,  37,  38,  39,
        40,  41,  42,  43,  44,  45,  46,  47,  48,  49,  50,  51,  52,
        53,  54,  55,  56,  57,  58,  59,  60,  61,  62,  63,  64,  65,
        66,  67,  68,  69,  70,  71,  72,  73,  74,  75,  76,  77,  78,
        79,  80,  81,  82,  83,  84,  85,  86,  87,  88,  89,  90,  91,
        92,  93,  94,  95,  96,  97,  98,  99, 100])

In [None]:
# Ex. 3
lista = []
elemento = 0
cont = 0
while cont < 100:
    lista.append(elemento)
    elemento = elemento + 0.01
    cont = cont + 1
listanp = np.array(lista)

In [None]:
range(100)

In [1]:
lista = [0 + 0.01*i for i in range(100)]
listanp = np.array(lista)
listanp

NameError: name 'np' is not defined

### 2. Listas a partir de intervalos numéricos

Relembre que é possível criar uma lista comum do python com o uso da função `range`:

In [None]:
lista = [i for i in range(1,10)]
print(lista)

O numpy possui algumas funções parecidas, entre elas:
 - `np.arange(start, stop, step)`: recebe um inteiro `start` que será o primeiro ítem da lista, um inteiro `stop` onde a lista deverá parar, mas não estará na lista, e o número de passos que a função deve dar para achar o ítem seguinte. O valor padrão do `stop` é 1.

In [None]:
listanp = np.arange(0,100,2)
listanp

In [None]:
listanp2 = np.arange(100,0,-1)
listanp2

In [None]:
# criando uma lista de 10 elementos, partindo do 0 e parando no 10 (excludente):
listanp = np.arange(0,10)
print(lista)

In [None]:
# criando uma lista de 10 elementos, partindo do 0 num intervalo de 3:
lista2np = np.arange(0,30,3)
print(lista2np)

 - `np.linspace(start,stop,num)`: recebe um inteiro `start` que será o primeiro elemento da lista, um inteiro `stop` onde a lista deve parar (inclusivo), e um inteiro `num`. Essa função devolve uma lista de `num+1` números igualmente espaçados no intervalo $[start,stop]$ (`num+1` já que o `stop` estará incluso!). 

In [None]:
# lista de 50 números entre 0 e 1 (inclusivo):
lista = np.linspace(0,1,50)
print(lista)

 - `np.random.randint(menor, maior, n)`: função que sorteia, segundo uma distribuição uniforme, `n` números inteiros entre `menor` e `maior` (excludente). 

In [None]:
np.random.randint(1,100, 100)

In [None]:
# sortear 50 números entre 0 e 1:
lista = np.random.randint(0,2,50)
print(lista)

In [None]:
# sortear 100 números entre 5 e 40 (excludente):
lista2 = np.random.randint(5,40,100)
print(lista2)

Outras maneiras de produzir listas de maneira aleatória (de `int` ou `float`), com outras distribuições que não seja a uniforme (e.g. gaussiana, Poisson, Bernoulli, etc) podem ser encontrados em:
  > https://docs.scipy.org/doc/numpy-1.14.1/reference/routines.random.html

In [None]:
help(np.arange)

In [None]:
np.arange(stop=10,step=2, start=1)

## Exercícios
__Exercício 1:__ Crie uma lista com 10 elementos igualmente espaçados entre 0 e 1 (incluíndo o 1). 

__Exercício 2:__ Crie uma lista com 10 elementos igualmente espaçados entre 0 e 1 (excluíndo o 1). 

__Exercício 3:__ Crie uma lista de 10 elementos cujo espaçamento entre cada um dos elementos dessa lista seja 4.

## Operações com listas

As operações com listas do python e do numpy funcionam de forma diferente:

In [None]:
# Soma de duas listas do python retorna a concatenação das listas:
lista1 = [1,2,3,4,5]
lista2 = [6,7,8,9,10]
lista_soma = lista1+lista2
print(lista_soma)

A operação de soma (concatenação) irá funcionar mesmo que as duas listas possuam tamanho diferentes:

In [None]:
lista1 = [1,2,3,4]
lista2 = [5,6]
lista_soma = lista1+lista2
print(lista_soma)

No numpy, a soma de listas ocorre de maneira parecida com a soma de colunas do excell, i.e. a soma é feita coordenada a coordenada:

In [None]:
lista1 = np.arange(0,10)
lista2 = np.arange(-5,5)
lista_soma = lista1+lista2
print('A lista1 é:\n%s \n' %lista1)
print('A lista2 é:\n%s \n' %lista2)
print('A soma de ambas é:\n%s' %lista_soma)

Devido a natureza das operações com listas no numpy, que é feita item a item, qualquer operação com duas ou mais listas no numpy só acontece se ambas tiverem o mesmo comprimento.

In [None]:
lista1 = np.arange(-10,10)
print('A lista1 é:\n%s \n' %lista1)
print('O comprimento da lista1 é:\n%s\n'%len(lista1))
lista2 = np.arange(0,10)
print('A lista2 é:\n%s \n' %lista2)
print('O comprimento da lista2 é:\n%s\n'%len(lista2))
print(lista1+lista2)

É possível multiplicar uma lista por um escalar:

In [None]:
lista1 = np.arange(2,10,3)
print(lista1)
lista2 = lista1 * np.pi
print(lista2)

É possível multiplicar duas listas:

In [None]:
lista1 = np.array([2,4,6,8])
lista2 = np.array([1,3,5,7])
print(lista1)
print(lista2)
print(lista1 * lista2)

é possível dividir uma lista por um escalar:

In [None]:
lista1 = np.linspace(3,10,5)
lista2 = lista1/4
print(lista1)
print(lista2)

É possível dividir duas listas:

In [None]:
lista1 = np.array([2,4,8,16])
lista2 = np.array([16,64,256,512])
print(lista1)
print(lista2)
print(lista2/lista1)

Repare que os itens da lista 1 e a lista 2 são `int`, ao passo que os itens da divisão são `float`.

É possível exponenciar uma lista por um número:

In [None]:
# devolve uma lista cujos itens são os itens da lista1 elevado a pi
lista1 = np.arange(0,1,0.1)
print(lista1 ** np.pi)

Também é possível exponciar um número por uma lista:

In [None]:
# devolve uma lista de mesmo tamnho que lista1, cujos itens são o número pi elevado 
# ao respectivo item da lista1.
print(np.pi ** lista1)

É possível exponenciar uma lista por outra:

In [None]:
lista1 = np.array([1,2,3])
lista2 = np.array([2,4,8])
print(lista1)
print(lista2)
print(lista2 ** lista1)

## Comparações de listas no numpy

A comparação de listas do python funciona como a comparação de números, verifica apenas se uma lista é igual a outra:

In [None]:
x = 2
y = 4
x == y

In [None]:
lista1 = [0,4,2,3,4]
lista2 = [0,1,2,5,5]
lista1 < lista2

A comparação com `<`, `>`, `<=` e `>=` é feita na ordem lexicográfica, ou seja na ordem "do dicionário".


In [None]:
lista1 = [0,1,2,3,4]
lista2 = [3,1,2,3,4]
lista1 > lista2 # irá retornar falso, pois lista[1] < lista[2]

Comparação `<`, `>`, `<=` e `>=` entre listas e escalares não são possíveis:

In [None]:
lista = [1,2,3,4]
lista > 4

No numpy a comparação, tanto entre listas quanto com escalares, é feita item a item, tal como as operações. Assim, o resultado de uma comparação é sempre uma lista numpy. Cuidado ao comparar duas listas, pois o tamanho de ambas devem ser iguais pra comparação ocorrer.

In [None]:
lista1 = np.array([1,2,3,4,5])
lista2 = np.array([3,10,0,4,2])
lista1 < lista2

In [None]:
lista1 = np.array([1,2,3,4,5])
lista2 = np.array([3,10,0,4,2])
lista1 == lista2

## Indexação e Slicing
Nessa seção veremos como acessar elementos dentro de uma lista ou produzir uma lista a partir de outra através de recortes ou condicionais (ou máscaras)

### 1. Acessando um elemento dentro da lista


Funciona exatamente igual com listas do python. Uma lista `listanp` de comprimento `n` estará indexada de `0` até `n-1`. Para acessar o item da posição `i` ($0\leq i\leq n-1$) basta excutar `listanp[i]`.

In [None]:
lista = [1,2,3,4]
lista[1]

In [None]:
lista = np.arange(-20,20,3)
print(lista
)
print(lista[7]) # acessa o elemento da casa de número 7

É possível usar números negativos para acessar os elementos de uma lista. Se uma lista `listanp` tem comprimento `n`, então `lista[n-i]` é igual a `lista[-i]`. 

In [None]:
lista = np.arange(10,15,0.1)
print(lista[-5])
print(lista[len(lista)-5])

Também é possível acessar os elementos de uma lista numpy `lista` com números negativos. Quando um inteiro negativo $i$ é passado como index da lista, a lista retorna o elemento na posição $\textrm{len}(lista)-|i|$.

In [None]:
lista = np.array([i for i in range(20)])
lista[-3] # retorna o antepenúltimo elemento da lista

In [None]:
n = len(lista)
lista[-3] == lista[len(lista)-3]

### Exercícios

__Exercício 1:__ Considere a seguinte lista numpy:
```python
lista = np.array([2*i for i in range(20)])
```
Exiba a lista inversa dessa lista.

### 2. Recortando um pedaço da lista

__Recorte (slicing)__: é o processo de obter um "pedaço" da lista original. Também funciona exatamente igual às listas do python. Se `listanp` é uma lista então `listanp[start:stop:step]` irá produzir uma lista cujos primeiro elemento é o elemento na posição `start` da listanp, ela para o recorte na posição `stop` (excludente), e o intervalo entre uma posição e sua sucessora é `step`. Quando `step` é omitido, o numpy calcula como sendo `step=1`.

In [None]:
listanp = np.array([1,2,3,4,5,6,7,8,9,10]) # cria a lista
listanp

In [None]:
recorte = listanp[3:5] # seleciona os elementos cujas posições estão entre 3 e 5 (excludente)
print(recorte)

In [None]:
listanp = np.arange(10,110,2)
recorte = listanp[:10]
listanp

In [None]:
recorte

### Exercícios

__Exercício 1:__ Construa uma lista de todos os inteiros de 0 até 100. Produza um recorte dessa lista constituída de todos os múltiplos de 6. É verdade que o elemento na posição `i` desse recorte será igual a $i\cdot 6$?

### 3. Recortes com posições negativas
Os inteiros `start`, `stop` e `step` podem ser negativos.


 - Se `start` é negativo, para obter o análogo positivo é só substituir por `len(lista)+start` (lembre-se que + com - dá -!)

In [None]:
lista = np.array([0,1,2,3,4,5,6,7,8,9])
n = len(lista)
print(lista)
print(n)
print(lista[-4:9])
print(lista[n-4:9])

 - Se `stop` é negativo, para obter o análogo positivo é só substituir por `len(lista)+stop` (lembre-se que + com - dá -!)

In [None]:
lista = np.array([0,1,2,3,4,5,6,7,8,9])
n = len(lista)
print(lista)
print(n)
print(lista[2:-6])
print(lista[2:len(lista)-6])

 - O mais interessante ocorre quando `step` é negativo. Neste caso percorre-se a lista invertida:

In [None]:
lista = np.array([0,1,2,3,4,5,6,7,8,9])
lista[::-1]

In [None]:
lista = np.array([0,1,2,3,4,5,6,7,8,9])
lista[::-2]

In [None]:
lista = np.array([0,1,2,3,4,5,6,7,8,9])
lista[7:1:-2]

### Exercícios
__Exercício 1:__ Escreva uma função que recebe um inteiro e uma lista e devolve uma progressão aritmética cujo primeiro elemento é o primeiro elemento dessa lista e a razão é esse inteiro.

### 4. Máscaras
A diferença entre o recorte e indexação de listas no numpy está no processo de máscaras. Nesse processo, definimos um condicional para selecionar apenas os itens de uma lista que satisfazem uma determinada condição.

In [None]:
lista = np.array([0,1,2,3,4,5,6,7,8,9])
condicional = (lista == 2) # produz uma lista chamada condicional cujos itens serão True
# se o item da lista original for 2, e False do contrário.
print('O condicional é:\n%s\n'%condicional)
# dessa forma podemos usar o condicional pra obter uma lista cujos elementos serão todos os
# elementos da lista original que satisfizerem o condicional (i.e. forem iguais a 2).
print('a lista obtida é:\n%s'%lista[condicional])

Como os condicionais são avaliados item a item, mais de um condicional pode gerar ambiguidade, já que o numpy não saberá se a avaliação deve ser feita para todos os itens, para apenas um, apenas 2, etc. Dessa forma, o numpy dispõe de funções booleanas para montar condicionais mais complexos.

In [None]:
lista = np.arange(-20,10)
condicional = np.logical_and(lista > 0, lista % 2 == 0)
# O condicional irá verificar item a item se o número é positivo E divisível por 2
print('A lista é:\n%s\n'%lista)
print('O condicional é:\n%s\n'%condicional)
# dessa forma podemos formar uma nova lista a partir dos elementos da lista original que
# satisfazem o condicional, i.e. forem positivos E divisíveis por 2
lista_cond = lista[condicional]
print(lista_cond)

In [None]:
lista = np.random.randint(0,100,400)# sorteia 400 números inteiros entre 0 e 100 (excludente)
condicional  = np.logical_or(lista <= 5, lista % 5 == 0)
# constroe uma nova lista cujos elementos serão True se o elemento avaliado da lista original
# for menor ou igual a 5 ou divisível por 5 e False do contrário.
print(lista[condicional])

### Exercícios

__Exercício 1:__ Escrever uma função que recebe uma lista numpy de inteiros e devolve uma lista com todos os itens pares dessa lista.

__Exercício 2:__ Crie uma lista com 100 inteiros sorteados entre 0 e 100. Produza uma nova lista que comece no último elemento da lista e o intervalo dos índicies é 5.  

## Passando listas do numpy como parâmetro de funções
O numpy consegue avaliar listas em vários tipos de funções. O resultado será uma nova lista, do mesmo tamanho da original na qual cada item será o respectivo item da original avaliado pela função. Algumas funções matemáticas estão disponíveis em:
> https://docs.scipy.org/doc/numpy-1.13.0/reference/routines.math.html

Embora essas funções possam receber listas do tipo `list` como parâmetro, o retorno sempre será uma `np.ndarray`. Além disso, o numpy consegue avaliar `np.ndarray` em funções construídas pelo usuário: no exemplo abaixo considere a função $f(x) = \sin(x)+2\cdot\ln(x^2)$. Essa função pode receber um `np.ndarray`, mas ela retorna erro ao receber uma `list`.

In [None]:
def f(x): 
    return np.sin(x)+2*np.log(x**2)

In [None]:
lista = [1,2,3,4,5,6,7,8,9,10]
print(f(lista))

In [None]:
listanp = np.array([1,2,3,4,5,6,7,8,9,10])
print(f(listanp))

In [None]:
lista = [0,1,2,3,4]
seno = np.sin(lista)
print(seno)
print(type(seno)) # embora dê para usar listas do python como parâmetro de funções do numpy,
# o resultado do cálculo sempre será uma lista do numpy.

Ao tentar avaliar uma lista numpy em qualquer função é sempre bom verficar se todos os valores presentes na lista podem ser calculados pela função. Exemplo, a função $\ln(x)$ não está definida para $x=0$. Assim, se zero estiver presente numa lista, a valiação retornará um erro: 

In [None]:
lista = np.array([0,1,2,3])
print(np.log(lista))

Em alguns casos, a função pode retornar valores `np.inf` ou `-np.inf`, que são objetos do numpy para lidar com $\infty$ e $-\infty$. De maneira geral, tome cuidado com os cálculos e divisões por zero! 

## Métodos para `np.ndarray`

Alguns métodos estão disponíveis para `np.ndarray`, tais como máximo, mínimo, soma, suma cumulativa, desvio padrão, etc. Uma lista completa pode ser encontrada em 
> https://docs.scipy.org/doc/numpy-1.15.0/reference/generated/numpy.ndarray.html

Veremos abaixo os mais importantes para o nosso curso.

In [None]:
# Máximo e mínimo dentro de uma lista
lista = np.random.randint(0,100,200)
print(lista.max())
print(lista.min())

In [None]:
# Argumentos em que se encontram o máximo ou o mínimo
lista = np.random.randint(0,100,200)
print(lista.argmax())
print(lista.argmin())

In [None]:
# Soma de todos os elementos
lista = np.arange(-10,10)
print(lista.sum())

In [None]:
# Soma cumulativa dos elementos
lista = np.arange(-10,10)
print(lista.cumsum())

In [None]:
# Produto de todos os elementos
lista = np.arange(1,10)
print(lista.prod())

In [None]:
# Produto cumulativo
lista = np.arange(1,10)
print(lista.cumprod())

In [None]:
# Média aritmética
lista = np.random.randint(0,100,300)
print(lista.mean())

In [None]:
# Desvio padrão
lista = np.random.randint(0,100,300)
print(lista.std())

In [None]:
# Ordenação dos valores
lista = np.random.randint(-10,10,10)
print(lista)
lista.sort() # esse método não devolve, ele salva no objeto
print(lista)

In [None]:
# tipo dos elementos da lista
lista = np.array([1,2,2.0,np.pi,6+3j])
print(lista.dtype) # retorna o tipo de maior complexidade da lista, caso complexo

In [None]:
# Converte os elementos da lista para um tipo
lista = np.array([1,2,2.0,np.pi,6+3j])
lista.astype('complex')

Tome cuidado ao converter. Ao tentar converter um complexo para um tipo de menor complexidade, o sistema retornará um erro. Ao converter um `int` para um `float`, ele arredondará o valor. 

In [None]:
lista = np.array([1,2,2.0,np.pi,6+3j])
lista.astype('float')