El paquete central para todas las redes neuronales en PyTorch es **autograd.**

El paquete **autograd** proporciona diferenciación automática para todas las operaciones sobre tensores. Es un marco definido por ejecución, lo que significa que su backprop se define por la forma en que se ejecuta su código, y que cada iteración individual puede ser diferente.

**autograd.Variable** es la clase central del paquete. Envuelve un Tensor y admite casi todas las operaciones definidas en él. Una vez que termine su cálculo, puede llamar a **.backward ()** y tener todos los gradientes calculados automáticamente.

Puede acceder al tensor sin procesar a través del atributo **.data**, mientras que el gradiente w.r.t. se acumula en **.grad.**

**Variable** y **Function** están interconectados y crean un gráfico acíclico, que codifica una historia completa de computación. Cada variable tiene un atributo **.grad_fn** que hace referencia a una **Función** que ha creado la **Variable** (a excepción de las Variables creadas por el usuario - su grad_fn es Ninguno).

Si desea calcular las derivadas, puede llamar a **.backward()** en una variable. Si Variable es un escalar (es decir, contiene datos de un elemento), no es necesario especificar ningún argumento para .backward(); sin embargo, si tiene más elementos, debe especificar un argumento *grad_output* que sea un tensor de la misma forma.

In [13]:
import torch
from torch.autograd import Variable
import matplotlib.image as mpimg
import matplotlib.pyplot as plt

Creamos una variable.

In [3]:
x = Variable(torch.ones(2 ,2), requires_grad = True)
print(x)

Variable containing:
 1  1
 1  1
[torch.FloatTensor of size 2x2]



Una operación simple.

In [4]:
y = x + 2
print(y)

Variable containing:
 3  3
 3  3
[torch.FloatTensor of size 2x2]



**y** fue creado como una operación por lo que tiene un **grad_fn**

In [5]:
print(y.grad_fn)

<AddBackward0 object at 0x7fb5614c1e10>


Más operaciones sobre **y**

In [8]:
z = y*y*3
out = z.mean()
print(z,'\n',out)

Variable containing:
 27  27
 27  27
[torch.FloatTensor of size 2x2]
 
 Variable containing:
 27
[torch.FloatTensor of size 1]



## Gradiente

let’s backprop now out.backward() is equivalent to doing out.backward(torch.Tensor([1.0]))

In [9]:
out.backward()

Imprimamos ahora el gradiente d(out)/dx

In [11]:
print('x--> ', x)
print('\nout--> ', out)
print('\ngradiente--> ',x.grad)

x-->  Variable containing:
 1  1
 1  1
[torch.FloatTensor of size 2x2]


out-->  Variable containing:
 27
[torch.FloatTensor of size 1]


gradiente-->  Variable containing:
 4.5000  4.5000
 4.5000  4.5000
[torch.FloatTensor of size 2x2]



<img src="imagen.png">

¡Puedes hacer muchas cosas locas con autograd!

In [56]:
x = torch.randn(3)
x = Variable(x, requires_grad=True)

y = x * 2

while y.data.norm() < 1000:
    y = y * 2

print(y)
print(y/x)

Variable containing:
  -90.5316
  195.8454
 1186.3274
[torch.FloatTensor of size 3]

Variable containing:
 512
 512
 512
[torch.FloatTensor of size 3]



In [57]:
gradients = torch.FloatTensor([1.0, 0.1, 0.001])
y.backward(gradients)

print(x.grad)

Variable containing:
 512.0000
  51.2000
   0.5120
[torch.FloatTensor of size 3]

