# Processamento numérico

Ao contrário de outras linguagens, como R ou MATLAB, Python não tem, nativamente, tipos e métodos para processamento numérico. Como tal, esse tipo de processamento costuma ser realizado usando bibliotecas adicionais. Neste contexto, a biblioteca [NumPy](https://numpy.org/) é a mais usada para processamento numérico em Python, sendo quase considerada um standard.

Em Python, para usar a funcionalidade de uma biblioteca é necessário importá-la usando a *keyword* `import`.

In [None]:
import numpy as np

**Nota**: Utilizar `import <biblioteca>` é suficiente para importar a biblioteca. A utilização de `as <nome>` permite definir um nome alternativo para aceder aos conteúdos da biblioteca. Neste caso, `np` é apenas uma abreviatura para evitar escrever o nome completo.

## Array

O tipo array (`numpy.ndarray`) é o tipo básico definido pela biblioteca *NumPy*. Um array multidimensional pode ser criado a partir de uma sequência (ex: lista ou tuplo).

In [None]:
v = np.array([1, 2, 3, 4])
v

In [None]:
type(v)

In [None]:
v.shape

In [None]:
m = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
m

In [None]:
m.shape

A biblioteca define também um conjunto de métodos para criar arrays com características específicas. Por exemplo:

- `zeros`
- `ones`
- `full`
- `random.rand`

In [None]:
np.zeros(10)

In [None]:
np.ones((3,2))

In [None]:
np.full(4, 3)

In [None]:
np.random.rand(2, 3)

O operador de indexação `[]` pode ser usado para aceder aos elementos de um array.

In [None]:
print(v[0])
print(v[-1])
print(v[1:3])

print(m[0])
print(m[1,2])
print(m[:,1])
print(m[:2,1:])

Os arrays são mutáveis, por isso é possível alterar o valor dos seus elementos diretamente.

In [None]:
v[0] = 10
v

**Nota**: Quando o operador de indexação é usado para obter uma parte do array original, é obtida uma referência para essa parte do array. Logo, quaisquer alterações são refletidas no array original. Caso não seja esse o comportamento pretendido, deve ser usado o método `copy`.

In [None]:
s = m[:2,1:]
c = s.copy()

s[0, 0] = -1
c[1, 1] = 50

print(s)
print(c)
print(m)

## Porque é precisa a biblioteca NumPy?

Porque não usar listas?

In [None]:
a = np.array([1,2,3])
b = [1, 2, 3]

1. Métodos para processamento numérico
2. Eficiência
3. Expressividade

## Métodos para processamento numérico

Os tipo array define um grande conjunto de métodos para processamento numérico. Por exemplo:

- `mean`
- `std`
- `max`
- `min`
- `sum`
- `dot`

In [None]:
v = np.array([1, 2, 3,])
m = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

In [None]:
print(f'{v.mean():.2f}±{v.std():.2f}')
print(f'{m.min()}-{m.max()}')
print(v.sum())

m.dot(v)

**Nota**: Muitos dos métodos podem ser aplicados ao longo de um eixo específico.

In [None]:
m.mean(axis=0)

In [None]:
m.max(axis=1)

## Operações sobre arrays

Para além dos métodos referidos anteriormente, também é possível fazer operações numéricas sobre arrays. Estas são aplicadas a todos os elementos do array.

In [None]:
v = np.array([1, 2, 3,])
m = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

In [None]:
m + 1

In [None]:
m ** 2

As operações também podem ser entre dois arrays.

In [None]:
v * v

In [None]:
m + m

In [None]:
m - v

**Nota**: Quando as operações são entre dois arrays, é necessário que as dimensões sejam compatíveis 

In [None]:
m - np.array([1,2])

Para além das operações numéricas, também é possível aplicar operações lógicas sobre arrays. Neste caso, o resultado é um array de booleanos.

In [None]:
v > 2

In [None]:
(v > 1) & (v < 3)

Estas operações também podem ser usadas para selecionar os elementos de um array que satisfazem uma determinada condição.

In [None]:
n = np.array([-1, -2, 4, 3, 5, -1])
n[n < 0] = 0
n

## Eficiência

Uma lista em Python é uma sequência de ponteiros para objetos:

![lista](../images/python-list.svg)

Por outro lado, um array da biblioteca *NumPy* guarda os seus dados em memória de forma contígua:

![array](../images/numpy-array.svg)

Os computadores são **muito bons** a processar blocos de memória contíguos.

In [None]:
a = list(range(1024))
%timeit sum(a)

In [None]:
b = np.arange(1024)
%timeit b.sum()

Uma diferença na ordem dos microsegundos pode não parecer muito relevante, mas a diferença torna-se cada vez maior à medida que o tamanho dos arrays aumenta ou quando são usadas operações mais complexas.

In [None]:
a = list(range(1024*1024))
%timeit sum(v*v for v in a)

In [None]:
b = np.arange(1024*1024)
%timeit (b**2).sum()

**Nota**: Os comandos que começam por `%` são chamados comandos mágicos e só podem ser usados em ambientes interativos, como por exemplo este notebook.

## Desvantagens

As vantagens dos arrays têm um preço. Por exemplo, ao contrário das listas, não é possível adicionar ou remover elementos de um array. Isto acontece porque o seu espaço em memória é alocado no momento da criação. Para além disso, também contrariamente às listas, os arrays são homogéneos, isto é, todos os seus elementos têm de ser do mesmo tipo, sendo este definido no momento da criação.

In [None]:
i = np.array([0, 1, 2]) # implicit type
i.dtype

In [None]:
i[0] = 2.7
i

In [None]:
f = np.array([0.5, 1.1, 2.1])
f.dtype

In [None]:
e = np.array([0, 1, 2], dtype=np.float64) # explicit type
e

A biblioteca *NumPy* define um conjunto de tipos que podem ser usados nos arrays. Por exemplo:

- `int8`, `int16`, `int32`, `int64`
- `uint8`, `uint16`, `uint32`, `uint64`
- `float32`, `float64`, `float16`
- `bool`

Também podem ser usados outros tipos, por exemplo para criar arrays de cadeias de caracteres ou objetos genéricos, mas a funcionalidade de arrays desses tipos é limitada.

**Nota**: Tendo em conta a natureza de alguns destes tipos, é preciso ter cuidado pois podem transbordar.

In [None]:
v = np.array([1,2,3], np.uint8)
v - 10