# Computação Numérica com Python e Numpy

![](https://raw.githubusercontent.com/davsimoes/mcde-pds/main/img/numpy.png)

Esta aula cobre os seguintes tópicos:

- Trabalhar com dados numéricos em Python
- Passar de listas Python para arrays Numpy
- Arrays multidimensionais do Numpy e os seus benefícios
- Operações sobre arrays, broadcasting, indexing, e slicing
- Trabalhar com ficheiros de dados CSV usando o Numpy

### Como executar o código

Esta aula é um [Jupyter notebook](https://jupyter.org) executável. Pode _correr_ esta aula e experimentar os exemplos de código de diferentes formas: *localmente no seu computador*, ou *utilizando um serviço online gratuito*.

#### Opção 1: Correr localmente no seu computador

Para correr localmente o código no seu computador, faça download do notebook e abra o ficheiro com uma aplicação ou ambiente de desenvolvimento suportado, por exemplo:
* Visual Studio Code: https://code.visualstudio.com/download
* Anaconda: https://www.anaconda.com/download
* Miniconda: https://docs.conda.io/projects/miniconda/en/latest/

Em qualquer das opções, as aplicações terão de suportar (nativamente ou através de extensões) o [Python](https://www.python.org) e os [Jupyter notebooks](https://jupyter.org), de forma a disponibilizar um ambiente de visualização e execução local com um kernel que execute o código Python contido no notebook.

#### Opção 2: Correr num serviço online gratuito

Para executar o notebook online, faça upload do notebook para o serviço da sua preferência, por exemplo:
* Google Colab: https://colab.google/
* Binder (com repositório GitHub): https://mybinder.org/
* Kaggle: https://www.kaggle.com/


>  **Jupyter Notebooks**: Esta aula é um [Jupyter notebook](https://jupyter.org) - um documento feito de _células_. Cada célula pode conter código escrito em Python ou explicações em português. Pode executar células de código e visualizar os resultados, e.g., números, mensagens, gráficos, tabelas, ficheiros, etc., instantaneamente no notebook. O Jupyter é uma plataforma poderosa para experimentação e análise. Não tenha medo de mexer no código ou estragar alguma coisa - aprenderá muito ao encontrar e corrigir erros. Pode utilizar a opção de menu "Kernel > Restart & Clear Output" (Kernel > Reiniciar e Limpar Saída) para limpar todas as saídas e recomeçar do início.

## Trabalhar com dados numéricos

O termo "dados" em *Análise de Dados* refere-se tipicamente a dados numéricos, e.g., cotações de ações, valores de vendas, medições de sensores, resultados desportivos, tabelas de bases de dados, etc. A biblioteca [Numpy](https://numpy.org) fornece estruturas de dados especializadas, funções e outras ferramentas para computação numérica em Python. Vamos trabalhar com um exemplo para ver como utilizar o Numpy para trabalhar com dados numéricos.

> Vamos supor que queremos usar dados climáticos como a temperatura, precipitação e humidade para determinar se uma região é adequada para o cultivo de maçãs. Uma abordagem simples para o fazer seria formular a relação entre a produção anual das maçãs (toneladas por hectare) e as condições climáticas, como a temperatura média (em graus Fahrenheit), a precipitação (em milímetros) e a humidade relativa média (em percentagem), como uma equação linear.
>
> `yield_of_apples = w1 * temperature + w2 * rainfall + w3 * humidity`

Estamos a expressar o rendimento da produção de maçãs como uma soma ponderada da temperatura, precipitação e humidade. Esta equação é uma aproximação, uma vez que a relação real pode não ser necessariamente linear e pode haver outros factores envolvidos. Mas um modelo linear simples como este funciona frequentemente bem na prática.

Com base numa análise estatística de dados históricos, podemos chegar a valores razoáveis para os pesos `w1`, `w2` e `w3`. Aqui está um exemplo de conjunto de valores:

In [None]:
w1, w2, w3 = 0.3, 0.2, 0.5

Dados alguns dados climáticos de uma região, podemos agora prever a produção de maçãs. Aqui estão alguns dados de exemplo:

<img src="https://raw.githubusercontent.com/davsimoes/mcde-pds/main/img/climate_data.png" style="width:360px;">

Para começar, podemos definir algumas variáveis para registar os dados climáticos de uma região.

In [None]:
kanto_temp = 73
kanto_rainfall = 67
kanto_humidity = 43

Podemos agora substituir estas variáveis na equação linear para prever a produção de maçãs.

In [None]:
kanto_yield_apples = kanto_temp * w1 + kanto_rainfall * w2 + kanto_humidity * w3
kanto_yield_apples

In [None]:
print("A produção esperada de maçãs na região de Kanto é de {} toneladas por hectare.".format(kanto_yield_apples))

Para facilitar um pouco o cálculo acima para várias regiões, podemos representar os dados climáticos de cada região como um vetor, ou seja, uma lista de números.

In [1]:
kanto = [73, 67, 43]
johto = [91, 88, 64]
hoenn = [87, 134, 58]
sinnoh = [102, 43, 37]
unova = [69, 96, 70]

Os três números em cada vetor representam os dados de temperatura, precipitação e humidade, respetivamente.

Também podemos representar o conjunto dos pesos usados na fórmula como um vetor.

In [2]:
weights = [w1, w2, w3]

NameError: name 'w1' is not defined

Podemos agora escrever uma função `crop_yield` para calcular a produção de macãs (or qualquer outro cultivo) dados os dados climáticos e respetivos pesos.

In [None]:
def crop_yield(region, weights):
    result = 0
    for x, w in zip(region, weights):
        result += x * w
    return result

In [None]:
crop_yield(kanto, weights)

In [None]:
crop_yield(johto, weights)

In [None]:
crop_yield(unova, weights)

## Passar das listas Python para os arrays Numpy


O cálculo efetuado pela função `crop_yield` (multiplicar dois vetores elemento a elemento e tomar a soma dos resultados) é designado por *produto escalar (dot product)*. Pode aprender mais sobre o produto escalar aqui: https://www.khanacademy.org/math/linear-algebra/vectors-and-spaces/dot-cross-products/v/vector-dot-product-and-vector-length . 

A biblioteca Numpy tem uma função incorporada para calcular o produto escalar de dois vectores. No entanto, primeiro temos de converter as listas em arrays Numpy.

Vamos instalar a biblioteca Numpy usando o gestor de pacotes `pip`.

In [None]:
%pip install numpy --upgrade --quiet

De seguida, vamos importar o módulo `numpy`. É prática comum importar o numpy com o alias `np`.

In [None]:
import numpy as np

Podemos agora usar a função `np.array` para criar arrays Numpy.

In [None]:
kanto = np.array([73, 67, 43])

In [None]:
kanto

In [None]:
weights = np.array([w1, w2, w3])

In [None]:
weights

Os arrays Numpy têm o tipo `ndarray`.

In [None]:
type(kanto)

In [None]:
type(weights)

Tal como as listas, os arrays Numpy suportam a notação de indexação `[]`.

In [None]:
weights[0]

In [None]:
kanto[2]

## Trabalhar com arrays Numpy

Podemos agora calcular o produto escalar dos dois vectores usando a função `np.dot`.

In [None]:
np.dot(kanto, weights)

Podemos obter o mesmo resultado com operações de baixo nível suportadas pelas matrizes Numpy: efetuar uma multiplicação por elementos e calcular a soma dos números resultantes.

In [None]:
(kanto * weights).sum()

O operador `*` efetua uma multiplicação de dois arrays elemento a elemento desde que os arrays tenham o mesmo tamanho. O método `sum` calcula a soma dos números num array.

In [None]:
arr1 = np.array([1, 2, 3])
arr2 = np.array([4, 5, 6])

In [None]:
arr1 * arr2

In [None]:
arr2.sum()

## Benefícios de usar arrays Numpy

Os arrays Numpy oferecem os seguintes benefícios sobre as listas Python em operações sobre dados numéricos:

- **Facilidade de uso**: É possível escrever expressões matemáticas pequenas, concisas e intuitivas como `(kanto * weights).sum()` em vez de usar ciclos e funções personalizadas como `crop_yield`.
- **Desempenho**: As operações e funções do Numpy são implementadas internamente em C++, o que as torna muito mais rápidas do que usar instruções e ciclos Python que são interpretados em tempo de execução

Aqui está uma comparação de produtos escalares realizados usando ciclos Python vs. arrays Numpy em dois vetores com um milhão de elementos cada.

In [None]:
# Listas Python
arr1 = list(range(1000000))
arr2 = list(range(1000000, 2000000))

# Arrays Numpy
arr1_np = np.array(arr1)
arr2_np = np.array(arr2)

In [None]:
%%time
result = 0
for x1, x2 in zip(arr1, arr2):
    result += x1*x2
result

In [None]:
%%time
np.dot(arr1_np, arr2_np)

Como se pode ver, usar o `np.dot` é 100 vezes mais rápido do que usar um ciclo `for`. Isto torna o Numpy especialmente útil para trabalhar com datasets muito grandes, com dezenas de milhares ou milhões de valores.

## Arrays Numpy multidimensionais

Podemos agora avançar mais um passo e representar os dados climáticos para todas as regiões usando um único array Numpy de 2 dimensões.

In [None]:
climate_data = np.array([[73, 67, 43],
                         [91, 88, 64],
                         [87, 134, 58],
                         [102, 43, 37],
                         [69, 96, 70]])

In [None]:
climate_data

Se já estudou álgebra linear, poderá reconhecer a matriz bidimensional acima como uma matriz com cinco linhas e três colunas. Cada linha representa uma região e as colunas representam a temperatura, a precipitação e a humidade, respetivamente.

Os arrays Numpy podem ter qualquer número de dimensões e comprimentos diferentes ao longo de cada dimensão. Podemos inspecionar o comprimento ao longo de cada dimensão usando a propriedade `.shape` de um array.

<img src="https://raw.githubusercontent.com/davsimoes/mcde-pds/main/img/numpy_array_t.png" width="420">

In [None]:
# Array 2D (matriz)
climate_data.shape

In [None]:
weights

In [None]:
# Array 1D (vetor)
weights.shape

In [None]:
# Array 3D 
arr3 = np.array([
    [[11, 12, 13], 
     [13, 14, 15]], 
    [[15, 16, 17], 
     [17, 18, 19.5]]])

In [None]:
arr3.shape

Todos os elementos num array numpy têm o mesmo tipo de dados. Podemos verificar o tipo de dados de um array usando a propriedade `.dtype`.

In [None]:
weights.dtype

In [None]:
climate_data.dtype


Se um array contiver ainda que só um número decimal, todos os outros elementos são também convertidos para floats.

In [None]:
arr3.dtype

Podemos agora calcular a produção prevista de maçãs em todas as regiões utilizando uma única multiplicação matricial entre `climate_data` (uma matriz 5x3) e `weights` (um vetor de comprimento 3). Aqui está o que vamos fazer, visualmente:

<img src="https://raw.githubusercontent.com/davsimoes/mcde-pds/main/img/matrix_multiplication.png" width="240">

Pode aprender mais sobre matrizes e multiplicação de matrizes nos primeiros 2-3 vídeos desta playlist: https://www.youtube.com/watch?v=xyAuNHPsq-g&list=PLFD0EB975BA0CC1E0&index=1 .

Podemos utilizar a função `np.matmul` ou o operador `@` para efetuar a multiplicação de matrizes.

In [None]:
np.matmul(climate_data, weights)

In [None]:
climate_data @ weights

## Trabalhar com ficheiros de dados CSV

O Numpy também fornece funções auxiliares para ler e escrever em ficheiros. Vamos descarregar um ficheiro `climate.txt`, que contém 10.000 medições climáticas (temperatura, precipitação e humidade) no seguinte formato:


```
temperature,rainfall,humidity
25.00,76.00,99.00
39.00,65.00,70.00
59.00,45.00,77.00
84.00,63.00,38.00
66.00,50.00,52.00
41.00,94.00,77.00
91.00,57.00,96.00
49.00,96.00,99.00
67.00,20.00,28.00
...
```

Este formato de armazenamento de dados é conhecido como *comma-separated values* ou CSV. 

> **CSVs**: Um ficheiro de valores separados por vírgula (CSV) é um ficheiro de texto delimitado que utiliza uma vírgula para separar os valores. Cada linha do ficheiro é um registo de dados. Cada registo é composto por um ou mais campos, separados por vírgulas. Normalmente, um ficheiro CSV armazena dados tabulares (números e texto), caso em que cada linha terá o mesmo número de campos. (Wikipedia)


Para ler este ficheiro para uma matriz numpy, podemos utilizar a função `genfromtxt`.

In [None]:
import urllib.request

urllib.request.urlretrieve(
    'https://raw.githubusercontent.com/davsimoes/mcde-pds/main/res/climate.csv', 
    'climate.txt')

In [None]:
climate_data = np.genfromtxt('climate.txt', delimiter=',', skip_header=1)

In [None]:
climate_data

In [None]:
climate_data.shape

Podemos agora realizar uma multiplicação de matrizes com o operador `@` para prever a produção de maçãs para todo o dataset, dado um conjunto de pesos.

In [None]:
weights = np.array([0.3, 0.2, 0.5])

In [None]:
yields = climate_data @ weights

In [None]:
yields

In [None]:
yields.shape

Vamos adicionar o `yields` ao `climate_data` como uma quarta coluna usando a função [`np.concatenate`](https://numpy.org/doc/stable/reference/generated/numpy.concatenate.html).

In [None]:
climate_results = np.concatenate((climate_data, yields.reshape(10000, 1)), axis=1)

In [None]:
climate_results

Alguns pormenores:

* Como desejamos adicionar uma nova coluna ao array `climate_results`, passamos o argumento `axis=1` ao `np.concatenate`. O argumento `axis` especifica a dimensão onde fazer a concatenação.

* Os arrays devem ter o mesmo número de dimensões, e o mesmo comprimento em cada uma delas, exceto na dimensão utilizada para a concatenação. Utilizamos a função [`np.reshape`](https://numpy.org/doc/stable/reference/generated/numpy.reshape.html) para mudar a forma de `yields` de `(10000,)` para `(10000,1)` (vetor de coluna).

Aqui está uma explicação visual de `np.concatenate` ao longo de `axis=1` (consegue adivinhar como ficava com `axis=0`?):

<img src="https://raw.githubusercontent.com/davsimoes/mcde-pds/main/img/python-numpy-image-exercise-58.png" width="300">

A melhor maneira de perceber o que é que uma função Numpy faz é experimentá-la e ler a documentação para saber os seus argumentos e valores de retorno. Use as células abaixo para experimentar o `np.concatenate` e `np.reshape`.

Vamos pegar nos resultados finais da nossa computação acima e escrevê-los de volta para um ficheiro usando a função `np.savetxt`.

In [None]:
climate_results

In [None]:
np.savetxt('climate_results.txt', 
           climate_results, 
           fmt='%.2f', 
           delimiter=',',
           header='temperature,rainfall,humidity,yield_apples', 
           comments='')

Os resultados são escritos de volta para o formato CSV no ficheiro `climate_results.txt`. 

```
temperature,rainfall,humidity,yield_apples
25.00,76.00,99.00,72.20
39.00,65.00,70.00,59.70
59.00,45.00,77.00,65.20
84.00,63.00,38.00,56.80
...
```



O Numpy oferece centenas de funções para realizar operações sobre arrays. Aqui ficam algumas das funções mais utilizadas:

* Matemática: `np.sum`, `np.exp`, `np.round`, operadores aritméticos 
* Manipulação de arrays: `np.reshape`, `np.stack`, `np.concatenate`, `np.split`
* Álgebra Linear: `np.matmul`, `np.dot`, `np.transpose`, `np.eigvals`
* Estatística: `np.mean`, `np.median`, `np.std`, `np.max`

> **Como encontrar a função que precisamos?** A forma mais fácil de encontrar a função certa para um dado caso de uso ou operação específica é fazer uma pesquisa na web. Por exemplo, procurar "How to join numpy arrays" leva a [este tutorial sobre concatenação de arrays](https://cmdlinetips.com/2018/04/how-to-concatenate-arrays-in-numpy/). 

Pode encontrar uma lista completa de funções de arrays aqui: https://numpy.org/doc/stable/reference/routines.html

## Operações aritméticas, broadcasting e comparação

Os arrays Numpy suportam operadores aritméticos como `+`, `-`, `*`, etc. Podemos realizar uma operação aritmética com um único número (também designado *escalar*) ou com outro array com as mesmas dimensões. Os operadores facilitam a escrita de expressões matemáticas com arrays multidimensionais.

In [None]:
arr2 = np.array([[1, 2, 3, 4], 
                 [5, 6, 7, 8], 
                 [9, 1, 2, 3]])

In [None]:
arr3 = np.array([[11, 12, 13, 14], 
                 [15, 16, 17, 18], 
                 [19, 11, 12, 13]])

In [None]:
# Adicionar um escalar
arr2 + 3

In [None]:
# Subtração elemento a elemento
arr3 - arr2

In [None]:
# Divisão por escalar
arr2 / 2

In [None]:
# Multiplicação elemento a elemento
arr2 * arr3

In [None]:
# Resto da divisão por escalar
arr2 % 4

### Broadcasting de arrays

Os arrays Numpy também suportam *broadcasting*, permitindo operações aritméticas entre dois arrays com diferentes dimensões mas formas compatíveis. Vamos ver como funciona com um exemplo.

In [None]:
arr2 = np.array([[1, 2, 3, 4], 
                 [5, 6, 7, 8], 
                 [9, 1, 2, 3]])

In [None]:
arr2.shape

In [None]:
arr4 = np.array([4, 5, 6, 7])

In [None]:
arr4.shape

In [None]:
arr2 + arr4

Quando a expressão `arr2 + arr4` é avaliada, o `arr4` (que tem a forma `(4,)`) é replicado três vezes para corresponder à forma `(3, 4)` do `arr2`. O Numpy executa a replicação sem criar mesmo três cópias do array mais pequeno, melhorando a performance e usando menos memória.

<img src="https://raw.githubusercontent.com/davsimoes/mcde-pds/main/img/02.05-broadcasting.png" width="360">

O broadcasting só funciona se um dos arrays puder ser replicado para coincidir com a forma do outro array.

In [None]:
arr5 = np.array([7, 8])

In [None]:
arr5.shape

In [None]:
arr2 + arr5

No exemplo acima, mesmo se replicarmos `arr5` três vezes, a sua forma não vai coincidir com a forma do `arr2`. Assim, `arr2 + arr5` não pode ser avaliado com sucesso.

Pode aprender mais sobre broadcasting aqui: https://numpy.org/doc/stable/user/basics.broadcasting.html .

### Comparação de arrays

Os arrays Numpy também suportam operadores de comparação como `==`, `!=`, `>` etc. O resultado é um array de booleanos.

In [None]:
arr1 = np.array([[1, 2, 3], [3, 4, 5]])
arr2 = np.array([[2, 2, 3], [1, 2, 5]])

In [None]:
arr1 == arr2

In [None]:
arr1 != arr2

In [None]:
arr1 >= arr2

In [None]:
arr1 < arr2

A comparação de arrays frequentemente utilizada para contar o número de elementos iguais em dois arrays usando o método `sum`. Lembre-se que `True` avalia para `1` e `False` avalia para `0` quando usamos booleanos em operações aritméticas.

In [None]:
(arr1 == arr2).sum()

## Indexação e slicing de arrays

O Numpy estende a notação de indexação das listas Python `[]` para múltiplas dimensões de forma intuitiva. Podemos fornecer uma lista de índices ou ranges separada por vírgulas para selecionar um elemento específico ou um subarray (também conhecido por slice) de um array Numpy.

In [None]:
arr3 = np.array([
    [[11, 12, 13, 14], 
     [13, 14, 15, 19]], 
    
    [[15, 16, 17, 21], 
     [63, 92, 36, 18]], 
    
    [[98, 32, 81, 23],      
     [17, 18, 19.5, 43]]])

In [None]:
arr3.shape

In [None]:
# Elemento único
arr3[1, 1, 2]

In [None]:
# Subarray com ranges
arr3[1:, 0:1, :2]

In [None]:
# Misturar índices e ranges
arr3[1:, 1, 3]

In [None]:
# Misturar índices e ranges
arr3[1:, 1, :3]

In [None]:
# Usar menos índices
arr3[1]

In [None]:
# Usar menos índices
arr3[:2, 1]

In [None]:
# Usar demasiados índices
arr3[1,3,2,1]

A notação e os seus resultados podem parecer confusos inicialmente, por isso tome o seu tempo para experimentar e a familiarizar-se com ela. Utilize as células abaixo para experimentar alguns exemplos de indexação e slicing de arrays, com diferentes combinações de índices e ranges. Aqui ficam mais alguns exemplos demonstrados visualmente:

<img src="https://raw.githubusercontent.com/davsimoes/mcde-pds/main/img/numpy_indexing.png" width="360">

## Outras formas de criar arrays Numpy

O Numpy também fornece algumas funções úteis para criar arrays de formas desejadas com valores fixos ou aleatórios. Consulte a [documentação oficial](https://numpy.org/doc/stable/reference/routines.array-creation.html) ou use a função `help` para saber mais.

In [None]:
# Tudo a zero
np.zeros((3, 2))

In [None]:
# Tudo a um
np.ones([2, 2, 3])

In [None]:
# Matriz identidade
np.eye(3)

In [None]:
# Vetor aleatório
np.random.rand(5)

In [None]:
# Matriz aleatória
np.random.randn(2, 3) # rand vs. randn - qual a diferença?

In [None]:
# Valor fixo
np.full([2, 3], 42)

In [None]:
# Range com início, fim e salto
np.arange(10, 90, 3)

In [None]:
# Números igualmente espaçados numa range
np.linspace(3, 27, 9)

### Guardar o seu notebook

É muito importante guardar o seu trabalho com frequência. Pode continuar a trabalhar mais tarde num notebook que gravou anteriormente ou pode partilhá-lo com outras pessoas e permitir que executem o seu código.

## Sumário e Leitura Complementar

Com isto, completamos a nossa discussão sobre computação numérica com Numpy. Cobrimos os seguintes tópicos nesta aula:

- Passar de listas Python a arrays Numpy
- Trabalhar com arrays Numpy
- Benefícios de usar arrays Numpy em vez de listas
- Arrays Numpy multidimensionais
- Trabalhar com ficheiros de dados CSV
- Operações aritméticas e broadcasting
- Indexação e slicing de arrays
- Outras formas de criar arrays Numpy


Consulte os seguintes recursos para aprender mais sobre Numpy:

- Tutorial oficial: https://numpy.org/devdocs/user/quickstart.html
- Tutorial Numpy do W3Schools: https://www.w3schools.com/python/numpy_intro.asp
- Numpy avançado (explorando o funcionamento interno): http://scipy-lectures.org/advanced/advanced_numpy/index.html

## Questões para Revisão

Tente responder às seguintes questões para testar a sua compreensão sobre os tópicos cobertos neste notebook:

1. O que é um vetor?
2. Como é que podemos representar um vetor usando uma lista Python? Dê um exemplo.
3. O que é o produto escalar de dois vectores?
4. Escreva uma função para calcular o produto escalar de dois vectores.
5. O que é o Numpy?
6. Como é que se instala o Numpy?
7. Como é que se importa o módulo `numpy`?
8. O que significa importar um módulo com um alias? Dê um exemplo.
9. Qual é o alias normalmente usado para o `numpy`?
10. O que é um array Numpy?
11. Como é que se cria um array Numpy? Dê um exemplo.
12. Qual é o tipo de um array Numpy?
13. Como é que se acede aos elementos de um array Numpy?
14. Como é que se calcula o produto escalar de dois vectores utilizando o Numpy?
15. O que é que acontece se tentarmos calcular o produto escalar de dois vectores de tamanhos diferentes?
16. Como é que se calcula o produto de dois arrays Numpy elemento a elemento?
17. Como é que se calcula a soma de todos os elementos de um array Numpy?
18. Quais são as vantagens de usar arrays Numpy em vez de listas Python para trabalhar sobre dados numéricos?
19. Por que é que as operações com arrays Numpy têm melhor desempenho em comparação com funções e ciclos Python?
20. Ilustre a diferença de desempenho entre as operações com arrays Numpy e os ciclos Python usando um exemplo.
21. O que são arrays Numpy multidimensionais? 
22. Ilustre a criação de arrays Numpy com 2, 3 e 4 dimensões.
23. Como é que se inspeciona o número de dimensões e o comprimento ao longo de cada dimensão num array Numpy?
24. Os elementos de um array Numpy podem ter tipos de dados diferentes?
25. Como é que se verifica o tipo de dados dos elementos de um array Numpy?
26. Qual é o tipo de dados de um array Numpy?
27. Qual é a diferença entre uma matriz e um array Numpy 2D?
28. Como se faz a multiplicação de matrizes usando o Numpy?
29. Para que serve o operador `@` no Numpy?
30. O que é o formato de ficheiro CSV?
31. Como podemos ler dados de um ficheiro CSV usando o Numpy?
32. Como é que podemos concatenar dois arrays Numpy?
33. Qual é o objetivo do argumento `axis` do `np.concatenate`?
34. Quando é que dois arrays Numpy são compatíveis para concatenação?
35. Dê um exemplo de dois arrays Numpy que podem ser concatenados.
36. Dê um exemplo de dois arrays Numpy que não podem ser concatenados.
37. Qual é o objetivo da função `np.reshape`?
38. O que significa fazer "reshape" de um array Numpy?
39. Como escrever um array numpy num ficheiro CSV?
40. Dê alguns exemplos de funções Numpy para efetuar operações matemáticas.
41. Dê alguns exemplos de funções Numpy para efetuar manipulação de arrays.
42. Dê alguns exemplos de funções Numpy para efetuar operações de álgebra linear.
43. Dê alguns exemplos de funções Numpy para efetuar operações estatísticas.
44. Como podemos encontrar a função Numpy correcta para uma determinada operação ou caso de uso?
45. Onde é que podemos ver uma lista de todas as funções e operações sobre arrays do Numpy?
46. Quais são os operadores aritméticos suportados pelos arrays Numpy? Ilustre com exemplos.
47. O que é o broadcasting de arrays? Qual é a sua utilidade? Ilustre com um exemplo.
48. Dê alguns exemplos de arrays que são compatíveis com o broadcasting?
49. Dê alguns exemplos de arrays que não são compatíveis com o broadcasting?
50. Quais são os operadores de comparação suportados pelos arrays Numpy? Ilustre com exemplos.
51. Como é que se acede a um subarray ou a uma slice específica de um array Numpy?
52. Ilustre a indexação e o slicing de matrizes Numpy multidimensionais com alguns exemplos.
53. Como é que se cria um array Numpy com uma determinada forma preenchido a zero?
54. Como é que se cria um array Numpy com uma determinada forma preenchido a um?
55. Como se cria uma matriz identidade de uma dada forma?
56. Como se cria um vetor aleatório com um determinado comprimento?
57. Como é que se cria um array Numpy com uma dada forma e um valor fixo para cada elemento?
58. Como é que se cria um array Numpy com uma dada forma contendo elementos inicializados aleatoriamente?
59. Qual é a diferença entre `np.random.rand` e `np.random.randn`? Ilustre com exemplos.
60. Qual é a diferença entre `np.arange` e `np.linspace`? Ilustre com exemplos.

## Referências

Este notebook é uma adaptação traduzida do curso *<u>Data Analysis with Python: Zero to Pandas</u>* de AaKash N S / [Jovian.ai](https://jovian.ai)

Outras referências:
* McKinney, W., Python for Data Analysis, 3rd. Ed. O'Reilly. Versão online em https://wesmckinney.com/book/ 
* Documentação oficial do Python: https://docs.python.org/3/tutorial/index.html
* Tutorial Python do W3Schools: https://www.w3schools.com/python/
* Practical Python Programming: https://dabeaz-course.github.io/practical-python/Notes/Contents.html
* Jupyter Notebooks: https://docs.jupyter.org
* Markdown Reference: https://www.markdownguide.org
