<img src="Bilder/ost_logo.png" width="240" align="right"/>
<div style="text-align: left"> <b> Applied Neural Networks | FS 2025 </b><br>
<a href="mailto:christoph.wuersch@ost.ch"> © Christoph Würsch, François Chollet </a> </div>
<a href="https://www.ost.ch/de/forschung-und-dienstleistungen/technik/systemtechnik/ice-institut-fuer-computational-engineering/"> Eastern Switzerland University of Applied Sciences OST | ICE </a>

[![Run in Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/ChristophWuersch/AppliedNeuralNetworks/blob/main/ANN01/ANN01_torch_tensors.ipynb)


In [None]:
# für Ausführung auf Google Colab auskommentieren und installieren
%pip install -q -r https://raw.githubusercontent.com/ChristophWuersch/AppliedNeuralNetworks/main/requirements.txt

# Torch Tensoren


In [None]:
import sys
import matplotlib
import pandas as pd
import torch

# Print Python version
print(f"Python version: {sys.version}")
print(f"Matplotlib version: {matplotlib.__version__}")
print(f"Pandas version: {pd.__version__}")
print(f"PyTorch version: {torch.__version__}")

# Check and print CUDA availability and version
if torch.cuda.is_available():
    print(f"CUDA is available. CUDA version: {torch.version.cuda}")
else:
    print("CUDA is not available.")


In [None]:
# Creating Tensors
# You can create tensors from Python lists or NumPy arrays:
data = [[2, 3], [5, 1]]
x = torch.tensor(data)

# Shape and Datatype
print(x.shape)  # Output: torch.Size([2, 2])
print(x.dtype)  # Output: torch.int64


In [None]:
# Indexing and Slicing
print(x[1, 0])  # Accessing individual element, Output: tensor(5)
print(x[:, 1])  # Selecting a column, Output: tensor([3, 1])

In [None]:
# Mathematical Operations
y = torch.rand(2, 2)
print(x + y)  # Element-wise addition
print(torch.mul(x, 2))  # Scalar multiplication

# Transformations
z = x.t()  # Matrix transpose
print(z)

In [None]:
# Reduction Operations
print(x.sum())  # Sum of all elements
# Convert to torch.float32, then get mean across rows
print("Mean across rows:")
print(x.float().mean(dim=0))

In [None]:
# Mathematical Operations with Broadcasting
b = torch.ones(2)  # Tensor of ones with shape (2,)
print(x + b)  # Broadcasting 'b' across rows

# Random Number Generation
random_tensor = torch.rand(3, 2)
print(random_tensor)


In [None]:
# Reshaping using view
reshaped_tensor = random_tensor.view(6, 1)  # Reshape to 6 rows, 1 column
print(reshaped_tensor)
print(reshaped_tensor.shape)  # Output: torch.Size([6, 1])


In [None]:
# GPU Operations (if you have a GPU available)
if torch.cuda.is_available():
    print("CUDA is available.")
    device = torch.device("cuda")
    x = x.to(device)
    y = torch.ones_like(x, device=device)
    GPU_tensor = x + y  # Calculations performed on GPU

# Move the tensor to the CPU
cpu_tensor = GPU_tensor.cpu()

# Convert the tensor to a NumPy array
numpy_array = cpu_tensor.numpy()

print("NumPy array:", numpy_array)
print("Type:", type(numpy_array))

In [None]:
cpu_tensor

# Unterschied zwischen PyTorch und TensorFlow: Dynamische vs. Statische Graphen

PyTorch erstellt den Berechnungsgraphen **dynamisch zur Laufzeit** ("on the fly"), was sich erheblich von der traditionellen Funktionsweise von TensorFlow (vor TensorFlow 2.x) unterscheidet. Hier eine Erläuterung, was das bedeutet, der Vergleich mit TensorFlow sowie die Vorteile dieses Ansatzes.


## **PyTorch: Dynamische Berechnungsgraphen**

- **Graph-Erstellung zur Laufzeit:** PyTorch baut den Berechnungsgraphen dynamisch auf, während der Code ausgeführt wird.
- **Automatische Differentiation:** Der Graph wird für das Backpropagation-Verfahren genutzt, um Gradienten zu berechnen, und danach verworfen.
- **Intuitives Debugging:** Da der Graph während der Ausführung erstellt wird, ist das Debugging in PyTorch einfacher und fühlt sich natürlicher an.

### Beispiel:



In [None]:
x = torch.tensor([1.0, 2.0, 3.0], requires_grad=True)
y = x * 2
z = y.sum()
z.backward()  # Gradientenberechnung
print(x.grad)  # Gradienten von z nach x_i



1. Operation $y = x \times 2$
- Für jedes Element $x_i$ im Tensor $x$ gilt: $y_i = 2 \cdot x_i$
- Die Ableitung von $y_i$ nach $x_i$ ist: $ \frac{\partial y_i}{\partial x_i} = 2 $

2. Operation $z = \text{sum}(y)$
- $z$ ist die Summe aller Elemente in $y$:   $ z = y_1 + y_2 + y_3 = 2x_1 + 2x_2 + 2x_3 $
- Die Ableitung von $z$ nach $x_i$ ist: $\frac{\partial z}{\partial x_i} = 2 $

3. Backpropagation
- Während der Ausführung von `z.backward()` berechnet PyTorch die Gradienten:
  $$ \frac{\partial z}{\partial x} = [2, 2, 2] $$


- Der Graph wird dynamisch aufgebaut, wenn die Operationen ausgeführt werden (`x * 2`, `sum()`), was ihn flexibel und benutzerfreundlich macht.


## **TensorFlow (Statischer Graph in TensorFlow 1.x)**

- **Statischer Berechnungsgraph:** In TensorFlow 1.x definiert man den Berechnungsgraphen explizit und führt ihn später in einer Session aus.
- **Graph-Ausführung:** Dieser Ansatz folgt oft einem Zwei-Schritt-Prozess:
  1. **Graph erstellen** (Berechnung definieren).
  2. **Graph ausführen** in einer Session, um Ergebnisse zu erhalten.

### Beispiel in TensorFlow 1.x:
```python
import tensorflow as tf

x = tf.placeholder(tf.float32)
y = x * 2
with tf.Session() as sess:
    result = sess.run(y, feed_dict={x: [1.0, 2.0, 3.0]})
    print(result)
```
- Diese Trennung von Definition und Ausführung machte das Debugging schwieriger und weniger intuitiv.


## **TensorFlow 2.x und Eager Execution**

- TensorFlow 2.x führte **Eager Execution** als Standard ein, was ähnlich wie die dynamischen Berechnungsgraphen in PyTorch funktioniert.
- Eager Execution ermöglicht die sofortige Ausführung von Operationen, ohne dass ein Graph explizit definiert und ausgeführt werden muss.

### Beispiel in TensorFlow 2.x:
```python
import tensorflow as tf

x = tf.constant([1.0, 2.0, 3.0])
y = x * 2
print(y.numpy())
```
- Dieser Stil ist sehr ähnlich zum Ansatz von PyTorch.


## **Vorteile der dynamischen Graph-Erstellung**

1. **Flexibilität und dynamische Kontrolle:**
   - PyTorch erlaubt dynamische Änderungen am Berechnungsgraphen während der Laufzeit, was es für Modelle mit variablen Architekturen (z. B. RNNs mit variablen Eingabelängen) ideal macht.

2. **Einfacheres Debugging:**
   - Fehler in PyTorch treten während der Ausführung auf und nicht während eines separaten Graph-Kompilierungsschritts, was die Fehlersuche erleichtert.

3. **Pythonischer Workflow:**
   - Die Schnittstelle von PyTorch fühlt sich natürlicher und intuitiver für Python-Entwickler an.

4. **Schnelles Prototyping:**
   - Änderungen am Modell können sofort implementiert und getestet werden, ohne den Berechnungsgraphen neu definieren oder kompilieren zu müssen.



## **Vergleichszusammenfassung**

| Merkmal                       | PyTorch (Dynamischer Graph)     | TensorFlow 1.x (Statischer Graph) | TensorFlow 2.x (Eager Execution) |
|-------------------------------|----------------------------------|------------------------------------|-----------------------------------|
| Graph-Erstellung              | Dynamisch (zur Laufzeit)         | Statisch (vordefiniert)            | Dynamisch (Eager-Standard)        |
| Debugging                     | Intuitiv                        | Schwierig                         | Intuitiv                          |
| Flexibilität                  | Hoch                            | Niedrig                           | Hoch                              |
| Laufzeitgeschwindigkeit (Training) | Leicht langsamer (keine Optimierung) | Potentiell schneller (optimiert)   | Vergleichbar mit PyTorch          |



## **Warum dynamische Graphen verwenden?**

Dynamische Berechnungsgraphen sind besonders vorteilhaft bei:

- **Variablen Eingabegrößen:** Wie bei der Textverarbeitung oder dynamischen neuronalen Netzen (z. B. rekursiven Netzen).
- **Komplexen, konditionalen Modellen:** Bei denen Verzweigungen der Berechnung von Laufzeitwerten abhängen.
- **Interaktiver Entwicklung:** Für Forschung und schnelles Experimentieren.

Statische Graphen können jedoch immer noch vorteilhaft für Produktionsumgebungen sein, die strikte Optimierung und Effizienz erfordern, weshalb Frameworks wie TensorFlow beide Ansätze unterstützen.