# Redes neurais profundas

Nos notebooks anteriores (`introducao.ipynb` e `not_mnist_with_tf.ipynb`) você aprendeu como construir uma rede neural com uma camada. Neste notebook você vai aprender a construir uma rede neural de várias camadas com o TensorFlow. Adicionar uma camada oculta a uma rede permite que ela modele funções mais complexas. Além disso, usar uma função de ativação não linear na camada oculta permite que ela modele funções não lineares.

Este notebook foi construído a partir dos conhecimentos saprensentados na aula `Introdução às redes neurais`. Conceitos como feedforward e dropout são alguns dos muitos cruciais para o entendimento completo deste notebook.

---
## ReLu

A primeira coisa que nós vamos aprender a implementar no TensorFlow é a camada oculta com função de ativação ReLu (Rectified Linear Unit, ou unidade retificada linear). A ReLu é uma função não linear que retorna 0 para entradas negativas e $x$ para todas as entradas $x > 0$.

O TensorFlow fornece a função ReLu como [**`tf.nn.relu()`**](https://www.tensorflow.org/api_docs/python/tf/nn/relu), como visto no trecho de código abaixo:

```
# Camada oculta com função de ativação ReLu
hidden_layer = tf.add(tf.matmul(X, hidden_w), hidden_b)
hidden_layer = tf.nn.relu(hidden_layer)

output = tf.add(tf.matmul(hidden_layer, output_w), output_b)
```

O trecho acima aplica a função [**`tf.nn.relu()`**](https://www.tensorflow.org/api_docs/python/tf/nn/relu) na camada `hidden_layer`, o que ba prática desativa quaisquer pesos negativos e funciona como chave liga/desliga. Camadas adicionais, como a camada `output`, aplicadas após a ativação transformam o modelo em uma função não-linear. Essa não-linearidade permite que a rede resolva problemas mais complexos.

### Implementação

<img src='img/two_layer_network.png' width=600px>


Na célula abaixo, você vai usar a função ReLu para transformar uma rede linear de uma camada em uma rede não-linear multicamadas.

In [1]:
import tensorflow as tf

output = None
hidden_layer_weights = [[0.1, 0.2, 0.4],
                        [0.4, 0.6, 0.6],
                        [0.5, 0.9, 0.1],
                        [0.8, 0.2, 0.8]]
out_weights = [[0.1, 0.6],
               [0.2, 0.1],
               [0.7, 0.9]]

# Weights and biases
weights = [tf.Variable(hidden_layer_weights),
           tf.Variable(out_weights)]
biases = [tf.Variable(tf.zeros(3)),
          tf.Variable(tf.zeros(2))]

# Input
features = tf.Variable([[1.0, 2.0, 3.0, 4.0], 
                        [-1.0, -2.0, -3.0, -4.0], 
                        [11.0, 12.0, 13.0, 14.0]])

# TODO: Create Model
hidden_layer = tf.add(tf.matmul(features, weights[0]), biases[0])
hidden_layer = tf.nn.relu(hidden_layer)
output = tf.add(tf.matmul(hidden_layer, weights[1]), biases[1])

# TODO: Print session results
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    print(sess.run(output))

[[ 5.11      8.440001]
 [ 0.        0.      ]
 [24.010002 38.239998]]
