## Reverse Automatic Differentiation mit PyTorch

[Automatic differentiation in PyTorch](https://openreview.net/pdf?id=BJJsrmfCZ)

In [2]:
import torch
import numpy as np

### Mit skalaren Wert zum Verständnis

In [None]:
# Unsere trainierbare Variable hat einen Wert von 100.
a = torch.tensor(100., requires_grad=True)

# Wir addieren einen Konstante 2 im Forward Pass
# Die Ableitung der "+" Operation ist g(x)=x
b = a + 2

# Im Backward Pass g(x) ist das x bspw. ein Fehler, Loss, ... hier 123.
b.backward(gradient=torch.tensor(123.))

# Der Gradient von der Variable "a" ist 123.
a.grad

tensor(123.)

### Beispiel Zwei

In [4]:
# Unsere trainierbare Variable hat einen Wert von 100.
a = torch.tensor(100., requires_grad=True)

# Forward Pass
b = a + 2.  # speichert die Ableitung g(x)=x
c = b * 3.  # speichert die Ableitung h(x;v)=v*x

# Im Backward Pass g(x) ist das x bspw. ein Fehler, Loss, ... hier 123.
c.backward(gradient=torch.tensor(123.))

# Der Gradient von der Variable "a" ist ((123.)*3)=369
a.grad

tensor(369.)

### Wir basteln uns ein Loss/Fehler

In [5]:
# Unsere trainierbare Variable hat einen Wert von 100.
a = torch.tensor(100., requires_grad=True) 

# Forward Pass
b = a + 2.
y_pred = b * 3.

# Lass "y_pred" unser Modelloutput sein (z.B. ein Score, Logit, usw.)
print(f"Model score: {y_pred}")

# Angenommen "a" soll so manipuliert werden, 
# dass "y_pred" den gewünscht Score "y_target" entspricht
y_target = 290.
print(f"Target score: {y_target}")

# Für den Fehler/Loss verwenden wir den Squared Loss
loss = (y_pred - y_target)**2
print(f"Loss: {loss}")

# Backward Pass
loss.backward()

# Der Gradient von der Variable "a"
a.grad

Model score: 306.0
Target score: 290.0
Loss: 256.0


tensor(96.)

### Trainiere es

In [8]:
# Unser Zielwert
y_target = 290.

# Die Lernrate für das Weight Update
lr = 0.01

# Der Startwert für das trainierbare Gewicht
weight = 100.

for epoch in range(10):
    # Forward Pass
    a = torch.tensor(weight, requires_grad=True) 
    y_pred = (a + 2.) * 3
    # Backward Pass
    loss = (y_pred - y_target)**2
    loss.backward()
    # weight update (Gradient Descent)
    weight = weight - lr * a.grad.detach().numpy()
    print(f"{loss.item():11.3f} | {weight}")

print(f"weight: {weight}")

    256.000 | 99.04
    172.134 | 98.25280000000001
    115.743 | 97.607296
     77.826 | 97.07798272000001
     52.330 | 96.64394583040001
     35.187 | 96.28803558092801
     23.660 | 95.99618917636097
     15.909 | 95.756875124616
     10.697 | 95.56063760218512
      7.193 | 95.3997228337918
weight: 95.3997228337918
