# Introdução ao TensorFlow


<img src="img/tensorflow.png" width=200px>

Ao longo desta aula, você aplicará seus conhecimentos de redes neurais em conjuntos de dados reais usando o [TensorFlow](https://www.tensorflow.org), uma biblioteca de código aberto de Deep Learning criada pela Google. Você usará o TensorFlow para classificar imagens do conjunto de dados notMNIST - um conjunto de imagens em inglês de A até J. Você pode ver alguns exemplos abaixo.

<img src="img/notmnist.png" width=500px>

Seu objetivo será detectar automaticamente a letra baseada na imagem do conjunto de dados.

---
## Instalação

Um arquivo de ambiente com todos os pacotes necessários para o acompanhamento da aula foi criado e está no mesmo repositório que este notebook (procure por `tf_intro.yaml`). Use o comando abaixo para criar o ambiente a partir dele:

`conda env create -f tf_intro.yaml`

Após criar e entrar no ambiente `tf_intro`, execute a célula abaixo para garantir que tudo está instalado corretamente. O output deve ser "Ola, mundo!". Não se preocupe em entender o que está acontecendo, explicações serão dadas ao longo do notebook.

In [2]:
import tensorflow as tf

hello_constant = tf.constant('Ola, mundo!')

with tf.Session() as sess:
    output = sess.run(hello_constant)
    print(output)

b'Ola, mundo!'


---
## "Olá, mundo" do TensorFlow

Nesta seção, vamos analisar o script que foi executado na célula acima.

### Tensor

No TensorFlow, os objetos não são salvos em integers, floats ou strings. estes valores são encapsulados em um objeto chamado tensor. No caso de `hello_constant = tf.constant('Ola, mundo!')`, `hello_constant` é um tensor string de 0 dimensões, mas os tensores podem ter uma variedade de tamanhos, como exposto abaixo:

In [3]:
# A é um tensor int32 de 0 dimensões
A = tf.constant(1234)

# B é um tensor int32 de 1 dimensão
B = tf.constant([123, 456, 789])

# C é um tensor int32 de 2 dimensões
C = tf.constant([[123, 456, 789], [222, 333, 444]])

[**`tf.constant`**](https://www.tensorflow.org/api_docs/python/tf/constant) é uma das diversas operações do TensorFlow que usaremos neste notebook. O tensor retornado por [**`tf.constant`**](https://www.tensorflow.org/api_docs/python/tf/constant) é o que chamamos de tensor constante, pois seu valor nunca muda.

### Sessão

A API do TensorFlow é construída em volta da ideia de um grafo computacional, um modo de visualizar processos matemáticos que é discutido no repositório do MiniFlow **(incluir link para repo)**. A figura abaixo ilustra o código do "Olá, mundo" transformado em um grafo:

<img src="img/session.png">

Uma "Sessão do TensorFlow", como mostrada acima, é um abiente para rodar um grafo. A sessão é responsável por alocar as operações para as GPU(s) e/ou CPU(s), incluindo máquinas remotas. Vamos executar o "Olá, mundo" mais uma vez e logo depois entender como funciona a sessão.

In [4]:
import tensorflow as tf

hello_constant = tf.constant('Ola, mundo!')

with tf.Session() as sess:
    output = sess.run(hello_constant)
    print(output)

b'Ola, mundo!'


O código cria o tensor `hello_constant` nas linhas iniciais. O próximo passo é avaliar o tensor na sessão.

O código cria uma instância de sessão, `sess`, usando [**`tf.Session`**](https://www.tensorflow.org/api_docs/python/tf/Session). A função [**`sess.run()`**](https://www.tensorflow.org/api_docs/python/tf/Session#run) então avalia o tensor e retorna os resultados.

---
## Input

Na seção anterior, passamos um tensor por uma sessão e ele retornou um resultado. E se quisermos usar algo não constante? Aqui é onde a função [**`tf.placeholder()`**](https://www.tensorflow.org/api_docs/python/tf/placeholder) e o `feed_dict` aparecem. Nesta seção, apresentaremos o básico sobre como introduzir dados no TensorFlow.

### tf.placeholder()

Infelizmente, não é possível alocar `x` para o conjunto de dados e colocar isso no TensorFlow, porque com o tempo você irá querer que o seu modelo receba diferentes conjuntos de dados com diferentes parâmetros. Para isso, você precisará do [**`tf.placeholder()`**](https://www.tensorflow.org/api_docs/python/tf/placeholder)!

[**`tf.placeholder()`**](https://www.tensorflow.org/api_docs/python/tf/placeholder) retorna um tensor que pega o valor dos dados passados para a função [**`tf.session.run()`**](https://www.tensorflow.org/api_docs/python/tf/Session#run), permitindo que você decida o input logo antes da sessão rodar.

### feed_dict

O parâmetro `feed_dict` é usado na [**`tf.session.run()`**](https://www.tensorflow.org/api_docs/python/tf/Session#run) para alocar o tensor placeholder. O exemplo abaixo mostra o tensor `x` recebendo a string `Ola, mundo`:

In [5]:
x = tf.placeholder(tf.string)

with tf.Session() as sess:
    output = sess.run(x, feed_dict={x: 'Ola, mundo'})

Também é possível alocar mais de um tensor usando o `feed_dict`, como feito abaixo:

In [7]:
x = tf.placeholder(tf.string)
y = tf.placeholder(tf.int32)
z = tf.placeholder(tf.float32)

with tf.Session() as sess:
    outpupt = sess.run(x, feed_dict={x: 'Teste', y: 123, z: 45.67})

Caso os dados passados para o `feed_dict` não combinem com o tipo do tensor e não possam ser lançados no tipo do tensor, você obterá o erro "`ValueError: invalid literal for`...".

---
## Matemática com TensorFlow

Conseguir o input é ótimo, mas agora precisamos usá-lo. Nesta seção, usaremos as funções matemáticas mais conhecidas (adição, subtração, multiplicação e divisão) com tensores. Existem muitas outras funções matemáticas que podem ser encontradas na [documentação](https://www.tensorflow.org/api_docs/python/math_ops/) do Tensorflow

### Adição

Começaremos com a função de adição. A função [**`tf.add()`**](https://www.tensorflow.org/api_docs/python/tf/add) faz exatamente o que esperamos que ela faça: recebe dois números, dois tensores ou um de cada, e retorna a soma deles como um tensor.

In [13]:
x = tf.add(5, 2)    # Retorna 7

with tf.Session() as sess:
    print(sess.run(x))

7


### Subratação, multiplicação e divisão

Assim como a função de adição, as funções de subratação, multiplicação e divisão são bastante intuitivas.

In [15]:
a = tf.subtract(15, 5)    # Retorna 10
b = tf.multiply(15, 5)    # Retorna 75
c = tf.div(15, 5)         # Retorna 3

with tf.Session() as sess:
    print(sess.run(a))
    print(sess.run(b))
    print(sess.run(c))

10
75
3


### Convertendo tipos

Pode ser necessário converter tipos para fazer alguns operadores trabalharem juntos. Por exemplo, o código `tf.subtract(tf.constant(2.0), tf.constant(1))` falha ao ser executad.

Isso acontece pois `1` é um interger e a constante `2.0` é um ponto flutuante. A operação `subtract` espera que eles combinem.

Em casos como este, você pode tanto garantir que os dados sejam sempre do mesmo tipo quanto mudar o tipo de um determinado valor. Neste caso, converter `2.0` para um interger antes de subtrair irá gerar o resultado certo.

### Exemplo

Na célula a seguir, usaremos o TensorFlow para imprimir o resultado da expressão numérica `10 / 2 + 1`:

In [17]:
import tensorflow as tf

x = tf.constant(10)
y = tf.constant(2)
result = tf.subtract(tf.divide(x, y), 1)

with tf.Session() as sess:
    print(sess.run(result))

4.0
