In [1]:
%matplotlib inline

# Aprender Pytorch con ejemplos - Tensor

Numpy es un gran marco, pero no puede utilizar GPU para acelerar sus cálculos numéricos. Para las redes neuronales profundas modernas, las GPU a menudo brindan aceleraciones de [50x o más](https://github.com/jcjohnson/cnn-benchmarks), por lo que, desafortunadamente, numpy no será suficiente para el aprendizaje profundo moderno.

Aquí presentamos el concepto más fundamental de PyTorch: el ``Tensor``. Un tensor de PyTorch es conceptualmente idéntico a una matriz numérica: un tensor es una matriz de n dimensiones y PyTorch proporciona muchas funciones para operar en estos tensores. Detrás de escena, los tensores pueden realizar un seguimiento de un gráfico computacional y gradientes, pero también son útiles como una herramienta genérica para la computación científica.

También a diferencia de numpy, los tensores PyTorch pueden utilizar GPU para acelerar sus cálculos numéricos. Para ejecutar un PyTorch Tensor en GPU, simplemente necesita especificar el dispositivo correcto.

Aquí usamos Tensores PyTorch para ajustar un polinomio de tercer orden a la función seno. Como en el ejemplo anterior, necesitamos implementar manualmente los pases hacia adelante y hacia atrás a través de la red:

In [2]:
import torch
import math


dtype = torch.float
device = torch.device("cpu")
# device = torch.device("cuda:0") # Uncomment this to run on GPU

# Create random input and output data
x = torch.linspace(-math.pi, math.pi, 2000, device=device, dtype=dtype)
y = torch.sin(x)

# Randomly initialize weights
a = torch.randn((), device=device, dtype=dtype)
b = torch.randn((), device=device, dtype=dtype)
c = torch.randn((), device=device, dtype=dtype)
d = torch.randn((), device=device, dtype=dtype)

learning_rate = 1e-6
for t in range(2000):
    # Forward pass: compute predicted y
    y_pred = a + b * x + c * x ** 2 + d * x ** 3

    # Compute and print loss
    loss = (y_pred - y).pow(2).sum().item()
    if t % 100 == 99:
        print(t, loss)

    # Backprop to compute gradients of a, b, c, d with respect to loss
    grad_y_pred = 2.0 * (y_pred - y)
    grad_a = grad_y_pred.sum()
    grad_b = (grad_y_pred * x).sum()
    grad_c = (grad_y_pred * x ** 2).sum()
    grad_d = (grad_y_pred * x ** 3).sum()

    # Update weights using gradient descent
    a -= learning_rate * grad_a
    b -= learning_rate * grad_b
    c -= learning_rate * grad_c
    d -= learning_rate * grad_d


print(f'Result: y = {a.item()} + {b.item()} x + {c.item()} x^2 + {d.item()} x^3')

99 615.1214599609375
199 409.7394714355469
299 273.9296569824219
399 184.1245574951172
499 124.74034118652344
599 85.47217559814453
699 59.50581359863281
799 42.335472106933594
899 30.981456756591797
999 23.47347068786621
1099 18.508834838867188
1199 15.225869178771973
1299 13.05500602722168
1399 11.61949634552002
1499 10.670235633850098
1599 10.042546272277832
1699 9.627472877502441
1799 9.352996826171875
1899 9.171492576599121
1999 9.051473617553711
Result: y = 0.0003305132267996669 + 0.8418641686439514 x + -5.7019158703042194e-05 x^2 + -0.09121430665254593 x^3
