<img src="https://neuraspike.com/wp-content/uploads/2020/11/thumbnail_numpy_tutorial_logo-neuraspike.png.png" alt="image info" />

*****************

<b> Susanne Tainá Ramalho Maciel </b>

<b> Guilherme Zakarewicz de Aguiar </b>

Universidade de Brasília (UnB)

<font color='red'> Esta é uma tradução livre do código *numpy_ultraquick_tutorial*. Para acessar a versão original, verifique este [código](https://colab.research.google.com/github/google/eng-edu/blob/master/ml/cc/exercises/numpy_ultraquick_tutorial.ipynb#scrollTo=T4r2z30vJSbA). </font>


******************

## Tutorial Rápido de NumPy

[Numpy](https://numpy.org/doc/stable/index.html) é uma biblioteca de Python usada para a criação e manipulação de matrizes, o principal tipo de estrutura de dados usada por algoritmos de ML. [Matrizes](https://en.wikipedia.org/wiki/Matrix_(mathematics)) são objetos matemáticos usados para armazenar valores em linhas e colunas.

O Python nomeia matrizes como *listas*, NumPy as chama de *arrays* e o TensorFlow as chama de *tensors*. Python representa as matrizes com os [tipos de dados de listas](https://docs.python.org/3/library/stdtypes.html#lists).

Este Notebook não é um tutorial exaustivo em NumPy. Em vez disso, ensina o necessário para usar o NumPy em exercícios básicos de Machine Learning. 


## Importando o módulo NumPy 

Execute a seguinte célula para importar o módulo NumPy:

In [1]:
import numpy as np

## Criar *arrays* com números específicos

Utilize `np.array` para criar um array com valores específicos. Por exemplo, a seguinte célula cria um array com 8 elementos:

In [2]:
one_dimensional_array = np.array([1.2, 2.4, 3.5, 4.7, 6.1, 7.2, 8.3, 9.5])
print(one_dimensional_array)

[1.2 2.4 3.5 4.7 6.1 7.2 8.3 9.5]


Podemos também usar o `np.array` para criar arrays de duas dimensões. Por exemplo, vamos criar um array 3x2:

In [3]:
two_dimensional_array = np.array([[6, 5], [11, 7], [4, 8]])
print(two_dimensional_array)

[[ 6  5]
 [11  7]
 [ 4  8]]


Para criar um array somente com zeros, utilize `np.zeros`. Para criar um array somente com 1's, utilize `np.ones`.

In [4]:
zeros = np.zeros([10])
ones = np.ones([3,2])

print(zeros)
print(ones)

[0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
[[1. 1.]
 [1. 1.]
 [1. 1.]]


## Criar arrays com sequências de números

Podemos criar arrays com sequências de números:

In [5]:
sequence_of_integers = np.arange(5, 12)
print(sequence_of_integers)

[ 5  6  7  8  9 10 11]


Note que `np.arange` gera uma sequência que inclui o limite inferior (5), mas não inclui o limite superior (12).

## Criar arrays com números aleatórios

O NumPy possui várias funções para criar arrays com números aleatórios em diferentes intervalos. Por exemplo, `np.random.randint` gera números inteiros aleatórios entre um limite inferior e um superios. A célula a seguir cria um array com 6 elementos aleatórios entre o intervalo de 50 e 100:

In [6]:
random_integers_between_50_and_100 = np.random.randint(low=50, high=101, size=(6))
print(random_integers_between_50_and_100)

[51 83 71 89 70 83]


Note que o maior número inteiro gerado pela função `np.random.randint` será sempre menor que o argumento máximo (`high=101`. No caso, o maior número possível será `100`).

Para criar números com decimais entre 0.0 e 1.0, utilizamos a função `np.random.random`. Por exemplo:

In [7]:
random_floats_between_0_and_1 = np.random.random([6])
print(random_floats_between_0_and_1) 

[9.15133997e-01 8.80208196e-01 4.70767899e-01 3.52822791e-04
 7.92618583e-01 5.43992141e-01]


## Operações matemáticas com operadores NumPy

Se você deseja adicionar ou subtrair dois arrays, a álgebra linear exige que os dois operadores possuam a mesma dimensão. Além disso, se você deseja multiplicar dois arrays, a álgebra linear impõe regras estritas sobre a compatibilidade dimensional dos operadores. 

Por sorte, o NumPy usa um truque chamado [**broadcasting**](https://developers.google.com/machine-learning/glossary/#broadcasting) para virtualmente expandir o menor operador para dimensões compatíveis para a álgebra linear. Por exemplo, a seguinte operação usa o *broadcasting* para adicionar 2.0 para o valor de cada item no array criado anteriormente:

In [8]:
random_floats_between_2_and_3 = random_floats_between_0_and_1 + 2.0
print(random_floats_between_2_and_3)

[2.915134   2.8802082  2.4707679  2.00035282 2.79261858 2.54399214]


A seguinte operação também utiliza o *broadcasting* para multiplicar cada item no array por 3.0:

In [9]:
random_integers_between_150_and_300 = random_integers_between_50_and_100 * 3.0
print(random_integers_between_150_and_300)

[153. 249. 213. 267. 210. 249.]


## Tarefa 1: Criar um Dataset Linear

O nosso objetivo é criar um dataset simples com duas variáveis diferentes:

1. Crie uma sequência de valores inteiros de 6 a 20 (cuidado! queremos 20, e não 19) em um array chamado `feature`.
2. Crie um array com 15 valores chamado `label` em que:


```
   label = (3)(feature) + 4
```

Por exemplo, o primeiro item de `label` deve ser:


```
  label = (3)(6) + 4 = 22
 ```

In [None]:
feature = # escreva seu código aqui
print(feature)
label = # escreva seu código aqui
print(label)

## Tarefa 2: Adicionar ruído ao dataset

Para tornar nosso dataset um pouco mais realista, vamos inserir um pouco de ruído em cada elemento do array `label`. Mais precisamente, modifique cada valor de `label` adicionando um valor diferente de ruído aleatório entre -2 e 2. 

*Dica: crie um array `noise` com a mesma dimensão de `label`*

In [None]:
noise = # escreva seu código aqui
print(noise)
label = # escreva seu código aqui
print(label)

*************************************

<br>

<br>

<br>

<br>

<br>

<br>

<br>

<br>



# Soluções:

In [14]:
feature = np.arange(6, 21)
print(feature)
label = (feature * 3) + 4
print(label)

[ 6  7  8  9 10 11 12 13 14 15 16 17 18 19 20]
[22 25 28 31 34 37 40 43 46 49 52 55 58 61 64]


In [15]:
noise = (np.random.random([15]) * 4) - 2
print(noise)
label = label + noise 
print(label)

[ 1.84045197 -0.35359525 -1.17126938 -1.08835929  0.84747546 -0.18762989
  0.59569238 -0.53388658  0.62158627 -1.27807214  1.88401054  0.09325103
  1.32063747 -1.57844882  0.89911911]
[23.84045197 24.64640475 26.82873062 29.91164071 34.84747546 36.81237011
 40.59569238 42.46611342 46.62158627 47.72192786 53.88401054 55.09325103
 59.32063747 59.42155118 64.89911911]
