# Numpy

## Introdução

Numpy é uma biblioteca para Python que implementa diversas funções e estruturas de dados para uso em aplicações científicas.  Embora as estruturas de dados do Python, em particular as listas, sejam poderosas o suficiente para poderem ser usadas nestas aplicações, elas foram implementadas para uso geral e portanto existe um compromisso com relação ao desempenho.

Por esta razão, Numpy oferece estruturas otimizadas para performance e manipulação de arrays e matrizes. Além disso, Numpy contém algumas funções para uso científico e é fortemente integrada com outra biblioteca, a SciPy, que estende a quantidade de funções oferecendo inúmeras funções científicas, como integração, resolução de equações diferenciais, processamento de imagens, estatística e muito mais.

Por estas razões, estudaremos estas bibliotecas a fundo.

In [None]:
# Código necessário para as atividades abaixo
%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt

## Arrays

A estrutura básica em Numpy é a `ndarray`, uma espécie de lista multidimensional.  Além de ser otimizada em termos de desempenho para cálculos numéricos, ela também oferece operações elemento a elemento com uma sintaxe natural, a la Matlab.  Em Numpy, este tipo de operação é denominada de *broadcast*.

In [None]:
# A maneira mais básica de se criar um array em Numpy é através da
# função `array` (compare com a criação através da classe `ndarray`
# diretamente)
fun = lambda x: np.cos(np.pi*x)
xs = np.array([0.4, 1.2, 2.3, 4.5, 5.86])
ys = fun(xs)
plt.plot(xs, ys, "*")

# Cria um array com 301 pontos indo de 0 a 100 espaçado de forma uniforme
t = np.linspace(0, 6, 301)
# Traça um gráfico de seno de t por t; observe que usamos a função seno
# do Numpy
line = plt.plot(t, fun(t))

In [None]:
# Cria um array com 400 números cujos logs são espaçados uniformemente 
w = np.logspace(-2, 2, 400)
# Traça o gráfico de Bode de um filtro passa-baixa com wc = 1 rad/s
plt.semilogx(w, 20*np.log10(np.absolute(1/(1j*f+1))))

Vimos acima 2 formas de criar arrays comumente usadas.  Várias outras formas existem.

In [None]:
a1 = np.zeros(10)
print("Tudo zero: ", a1)

a2 = np.ones(15)
print("Tudo um: ", a2)

a3 = np.random.random(5)
print("Tudo aleatório: ", a3)

a4 = np.identity(3)
print("Matriz identidade:\n", a4)

a5 = np.zeros_like(a4)
print("Matriz toda zero:\n", a5)

In [None]:
# Podemos criar também vetores multi-dimensionais
m1 = np.empty((3, 5))
m2 = np.ones((4, 2))
m3 = np.random.randn(2, 3, 4)

print("Matriz vazia (valores espúrios):\n", m1)
print()
print("Tudo 1:\n", m2)
print()
print("Uma matriz tridimensional:\n", m3)

In [None]:
# Podemos acessar as dimensões do array através do atributo
# shape
print("As dimensões de m3 são", m3.shape)

In [None]:
# Observe que um array unidimensional é diferente de um array
# bidimensional com uma das dimensões igual a 1
a1 = np.zeros(10)
a2 = np.ones((1, 10))
a3 = np.ones((10, 1))
print("a1 = ", a1)
print("a2 = ", a2)
print("a3 = ", a3)
print("Formato de a1: ", a1.shape)
print("Formato de a2: ", a2.shape)
print("Formato de a3: ", a3.shape)

## Exercícios

Usando [`numpy.random.randn`](file:///usr/share/doc/python-numpy-doc/html/reference/generated/numpy.random.randn.html#numpy.random.randn), crie dois vetores de distribuição normal com tamanho $N=1000$ e plote-os, um dando as coordenadas $x$ e o outro dando as coordenadas $y$.  Repita para $N=10000$ e $N=100000$.  Para plotar, use a função `plt.scatter(x, y)`.

## Acessando elementos

Acessar elementos em Numpy é tão ou mais fácil do que em Python em si, principalmente se o array é multidimensional.

In [None]:
# Observe o uso da função reshape() para rearranjar um array
a1 = np.random.random(16)
print(a1)
a2 = np.reshape(a1, (4, 4))
print("Matriz aleatória:\n", a2)
# Observe o uso de uma tupla para acessar o elemento
print("Elemento na 2a linha, 4a coluna:", a2[1, 3])

# Podemos rearranjar o array original por coluna
a3 = np.reshape(a1, (4, 4), order="F")
print("Matriz aleatória:\n", a3)

In [None]:
# Observe que a função reshape não realiza uma cópia de seu argumento
a1 = np.zeros(16)
a2 = a1.reshape((4, 4))
print("a1 = ", a1)
print("a2 = ", a2)

a1[4] = 1
a2[3, 2] = -1
print("a1 = ", a1)
print("a2 = ", a2)

In [None]:
# Slices também funcionam em Numpy.  Observe que a dimensão de uma slice
# é o número de "fatias" (coordenadas definidas por ":") da slice
print("1a linha:", a2[0, :])
print("1a coluna:", a2[:, 0])
print("Uma submatriz:", a2[2:4, 1:3])

In [None]:
# Da mesma forma que a função reshape(), e diferentemente de Python, slicing
# não cria uma nova array
a = np.array([[0, 1, 2, 3, 4], [5, 6, 7, 8, 9], 
              [10, 11, 12, 13, 14], [15, 16, 17, 18, 19]])
b = a[2:4, 1:3]
b[0, 0] = 100
print("b = ", b)
print("a = ", a)