<a href="https://colab.research.google.com/github/nilobarrantes/Projetos_Deep_Learning/blob/master/Ola_Mundo_Depp_Learning.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# O *'Ola mundo'* do Deep Learning com Redes Neurais

![](https://drive.google.com/uc?export=view&id=1ca33d_0NHcp-_qbuksNlMeuzkU7YHuVh)


Para mostrar como funciona a estrutura geral de uma rede neural, vamos começar com algo muito simples.

No caso da criação de redes neurais, o exemplo mais usado é aquele em que aprende a relação entre dois números. Dada a tabela

![](https://drive.google.com/uc?export=view&id=1Drk3ylG1sJoO6ZWcSAzFpCDmye1M_dTe)

Qual é a relaçao entre os conjuntos de números X e Y? Facílmente observamos que Y= 2X-1.
Se você tem conhecimentos em python, poderia estar escrevendo o código para uma função como esta 


```
float hw_function(float x){
    float y = (2 * x) - 1;
    return y;
}
```

Então, como treinar uma rede neural para fazer a tarefa equivalente? Usando dados! Ao alimentá-lo com um conjunto de Xs e um conjunto de Ys, ele deve ser capaz de descobrir a relação entre eles.

Obviamente, este é um paradigma muito diferente daquele com o qual estamos acostumados, então vamos analisá-lo peça por peça.


## Importações

Vamos começar com nossas importações. Aqui, estamos importando o TensorFlow e chamando-o de tf para facilitar o uso.

Em seguida, importamos uma biblioteca chamada numpy, que nos ajuda a representar nossos dados como listas de maneira fácil e rápida.

O framework para definir uma rede neural como um conjunto de camadas sequenciais é chamada de keras, por isso também a importamos.

In [None]:
import tensorflow as tf
import numpy as np
from tensorflow import keras

## Definir e Compilar a Rede Neural (NN)

A seguir, criaremos a rede neural mais simples possível. Ele tem 1 camada, e essa camada tem 1 neurônio, e a forma de entrada para ela é de apenas 1 valor.

In [None]:
model = tf.keras.Sequential([keras.layers.Dense(units=1, input_shape=[1])])

Agora compilamos nossa Rede Neural. Quando fazemos isso, temos que especificar 2 funções, chamas loss  e optimizer.

Se você já viu muita matemática para o aprendizado de máquina, é aqui que ela é geralmente usada, mas, neste caso, está bem encapsulada em funções para você. Mas o que acontece aqui - vamos explicar ...

Sabemos que, em nossa função, a relação entre os números é y = 2x-1.


Quando o computador está tentando 'aprender' isso, ele faz uma suposição ... talvez y = 10x + 10. A função LOSS mede as respostas adivinhadas em relação às respostas corretas conhecidas e mede o quão bem ou mal ela se saiu.

Em seguida, ele usa a função OPTIMIZER para fazer outra estimativa. Com base em como a função LOOS funcionou, ele tentará minimizar a perda. Nesse ponto, talvez ele apareça com algo como y = 5x + 5, que, embora ainda seja muito ruim, está mais perto do resultado correto (ou seja, o LOOS é menor).

Ele repetirá isso para o número de EPOCHS que você verá em breve. Mas primeiro, aqui está como dizemos a ele para usar 'MEAN SQUARED ERROR' para o LOOS e 'STOCHASTIC GRADIENT DESCENT' para o OPTIMIZER. Você não precisa entender a matemática para eles ainda, mas pode ver que funcionam! :)

Com o tempo, você aprenderá as funções LOOS e OPTIMIZER diferentes e apropriadas para diferentes cenários.

In [None]:
model.compile(optimizer='sgd', loss='mean_squared_error')

## Fornecendo os Dados

Em seguida, inseriremos alguns dados. Neste caso, estamos pegando 6 xs e 6ys. Você pode ver que a relação entre eles é y = 2x-1, então quando x = -1, y = -3 etc. etc.

Uma biblioteca python chamada 'Numpy' fornece muitas estruturas de dados do tipo array que são uma maneira padrão de fazer isso. Declaramos que queremos usá-los especificando os valores como np.array[]

In [None]:
xs = np.array([-1.0,  0.0, 1.0, 2.0, 3.0, 4.0], dtype=float)
ys = np.array([-3.0, -1.0, 1.0, 3.0, 5.0, 7.0], dtype=float)

# Treinando a Rede Neural

O processo de treinamento da rede neural, onde ela "aprende" a relação entre os Xs e Ys, está na chamada **model.fit**. É aqui que ele percorrerá o ciclo de que falamos acima, fazendo um palpite, medindo o quão bom ou ruim ele é (também conhecido como Loss), usando o Optimizer para fazer outro palpite etc. Ele fará isso pelo número de Epoch que especificamos. Quando você executa este código, você verá o LOOS do lado direito.

In [None]:
model.fit(xs, ys, epochs=500)

Epoch 1/500
Epoch 2/500
Epoch 3/500
Epoch 4/500
Epoch 5/500
Epoch 6/500
Epoch 7/500
Epoch 8/500
Epoch 9/500
Epoch 10/500
Epoch 11/500
Epoch 12/500
Epoch 13/500
Epoch 14/500
Epoch 15/500
Epoch 16/500
Epoch 17/500
Epoch 18/500
Epoch 19/500
Epoch 20/500
Epoch 21/500
Epoch 22/500
Epoch 23/500
Epoch 24/500
Epoch 25/500
Epoch 26/500
Epoch 27/500
Epoch 28/500
Epoch 29/500
Epoch 30/500
Epoch 31/500
Epoch 32/500
Epoch 33/500
Epoch 34/500
Epoch 35/500
Epoch 36/500
Epoch 37/500
Epoch 38/500
Epoch 39/500
Epoch 40/500
Epoch 41/500
Epoch 42/500
Epoch 43/500
Epoch 44/500
Epoch 45/500
Epoch 46/500
Epoch 47/500
Epoch 48/500
Epoch 49/500
Epoch 50/500
Epoch 51/500
Epoch 52/500
Epoch 53/500
Epoch 54/500
Epoch 55/500
Epoch 56/500
Epoch 57/500
Epoch 58/500
Epoch 59/500
Epoch 60/500
Epoch 61/500
Epoch 62/500
Epoch 63/500
Epoch 64/500
Epoch 65/500
Epoch 66/500
Epoch 67/500
Epoch 68/500
Epoch 69/500
Epoch 70/500
Epoch 71/500
Epoch 72/500
Epoch 73/500
Epoch 74/500
Epoch 75/500
Epoch 76/500
Epoch 77/500
Epoch 78

<tensorflow.python.keras.callbacks.History at 0x7f5f70cf7c18>

Ok, agora você tem um modelo que foi treinado para aprender a relação entre X e Y. Você pode usar o método **model.predict** para que ele descubra o Y para um X anteriormente desconhecido. Então, por exemplo, se X = 10, o que você acha que Y será? Adivinhe antes de executar este código:

In [None]:
print(model.predict([10.0]))

[[18.984657]]


Você deve ter pensado em 19, certo? Mas acabou ficando um pouco abaixo. Por que você acha que é isso?

Lembre-se de que as redes neurais lidam com probabilidades, portanto, dados os dados com os quais alimentamos a NN, ele calculou que há uma probabilidade muito alta de que a relação entre X e Y seja Y = 2X-1, mas com apenas 6 pontos de dados podemos não saber com certeza. Como resultado, o resultado para 10 é muito próximo de 19, mas não necessariamente 19.

Ao trabalhar com redes neurais, você verá esse padrão se repetindo. Quase sempre você lidará com probabilidades, não certezas, e fará um pouco de codificação para descobrir qual é o resultado com base nas probabilidades, especialmente quando se trata de classificação.