# Variaveis

Os algoritmos de deep learning são representados por um grafo computacional, podemos ver um exemplo de grafo computacional na figura abaixo.

Cada circulo no grafo representa uma variavel, e na entrada e saída de cada operação existe uma variavel, no PyTorch, as variaveis são wrappers para os tensores, isso é, ela armazena os tensores e mais 3 atributos. O dado em si (data), o gradiente (grad) e um apontador (creator) para construir o grafo da backpropagation.

O que faz o PyTorch ser um framework proprio para o uso em deep learning é sua capacidade de calcular o gradiente automaticamente de um grafo computacional definido, e isso no PyTorch é feito utilizando variaveis, ou seja, com as variaveis é possivel criar expressões matemáticas e o PyTorch é capaz de calcular o gradiente dessa expressão.
O gradiente é uma operação matemática que é calculada através de derivadas parciais.

### Criação de variaveis

In [1]:
import torch
from torch.autograd import Variable

As variaveis são criadas a partir de tensores

In [6]:
y = Variable(torch.rand(2,4))
y

tensor([[0.8807, 0.3669, 0.7776, 0.5670],
        [0.9787, 0.2027, 0.1333, 0.1424]])

In [7]:
y_t = 5*torch.rand(2,4)
y = Variable(y_t)
y

tensor([[4.4132, 0.7287, 0.0983, 4.2892],
        [2.0199, 4.2254, 3.5996, 3.4344]])

In [9]:
x = Variable(torch.ones(2, 2), requires_grad=True)
x

tensor([[1., 1.],
        [1., 1.]], requires_grad=True)

**requires_grad** indica se o PyTorch deve ou não calcular o gradiente da variavel, ou seja, se essa variável irá ser utilizada durante o treinamento no calculo do gradiente. Por padrão *requires_grad* é falso quando a variavel é criada, Se uma de suas entrada para um operação requer o calculo do gradiente, sua saída e seus subgrafos também irão requerer o caclulo do grdiente.

### Calculo do gradiente

In [17]:
y = x + 2
z = y * y * 2
out = z.mean()
out.backward()

# acessa o gradiente da variavel x individualmente
x.grad

tensor([[24., 24.],
        [24., 24.]])

Autograd é o pacote do PyTorch utilizado para calcular a derivada do grafo computacional, calculando o backpropagation começando pela variavel que chamou a função *backward*. Nos modelos de deep learning, essa variavel geralmente contém a função de perda.
Para acessar o gradiente individual para cada variavel é utilizado o atributo *grad*.

O `backward()` destroi o grafo após sua execução. Isso é intrínsico ao PyTorch pelo fato dele trabalhar com grafos computacionais dinâmico.