# TensorFlow auf GPU

Dieses Notebook bietet eine Einführung zum Rechnen auf einer GPU in Colab.
In diesem Notebook wirst du dich mit einer GPU verbinden und dann einige grundlegende
TensorFlow-Operationen sowohl auf der CPU (Hauptprozessor) als auch auf einer GPU ausführen.
Dabei beobachten wir die durch die Verwendung der GPU erzielte Beschleunigung.

**CPU (Central Processing Unit):** Der Hauptprozessor ist das "Gehirn" des Computers. Er ist
für die Ausführung der meisten Berechnungen und Anweisungen zuständig, die ein Computer
zum Funktionieren benötigt. Er ist vielseitig und kann eine Vielzahl von Aufgaben bewältigen,
z. B. das Ausführen von Programmen, das Verwalten des Speichers und das Kommunizieren mit
anderen Hardwarekomponenten. Die CPU arbeitet sequentiell, d. h. sie verarbeitet eine
Aufgabe nach der anderen. Sie hat relativ wenige, aber dafür sehr leistungsstarke Kerne.

**GPU (Graphics Processing Unit):** Der Grafikprozessor ist ein spezialisierter Prozessor,
der ursprünglich für die Verarbeitung von Grafiken entwickelt wurde. Er ist darauf
ausgelegt, viele einfache Berechnungen parallel auszuführen, was ihn ideal für Aufgaben
macht, die von der Verarbeitung großer Datenmengen profitieren, wie z. B. Spiele,
Videobearbeitung und maschinelles Lernen. Die GPU hat viele Kerne, die jeweils weniger
leistungsstark sind als die Kerne einer CPU, aber zusammen eine enorme Rechenleistung
bieten.

## GPU aktivieren und testen

Zuerst musst du GPUs für das Notebook aktivieren:

1. Navigiere zu "Bearbeiten" -> "Notebook-Einstellungen"
2. Wähle "GPU" aus dem Dropdown-Menü "Hardwarebeschleuniger"

Als Nächstes bestätigen wir, dass wir uns mit TensorFlow mit der GPU verbinden können:

In [None]:
import tensorflow as tf

device_name = tf.test.gpu_device_name()

if not device_name:  # Check if device_name is empty
  print("GPU device not found. Please ensure that the notebook is configured to use a GPU.")
  # Optionally, you can suggest steps to enable GPU or handle the case gracefully
elif device_name != '/device:GPU:0':
  raise SystemError('Expected GPU device at /device:GPU:0 but found {}'.format(device_name))

print('Found GPU at: {}'.format(device_name))

GPU device not found. Please ensure that the notebook is configured to use a GPU.
Found GPU at: 


## Beschleunigung von TensorFlow auf der GPU im Vergleich zur CPU beobachten

Dieses Beispiel erstellt eine typische Convolutional Neural Network-Schicht über einem
zufälligen Bild und platziert die resultierenden Operationen manuell entweder auf der CPU
oder der GPU, um die Ausführungsgeschwindigkeit zu vergleichen.

**Convolutional Neural Network (CNN):** Ein CNN ist eine Art von neuronalem Netzwerk, das
häufig für die Bildverarbeitung und -erkennung verwendet wird. Es besteht aus mehreren Schichten,
die jeweils eine bestimmte Aufgabe erfüllen, z. B. das Erkennen von Kanten, Formen oder
Objekten. CNNs sind sehr rechenintensiv und profitieren daher von der parallelen
Verarbeitung einer GPU.

In [None]:
import tensorflow as tf
import timeit

import tensorflow as tf

device_name = tf.test.gpu_device_name()

if not device_name:  # Check if device_name is empty
  print("GPU device not found. Please ensure that the notebook is configured to use a GPU.")
  # Optionally, you can suggest steps to enable GPU or handle the case gracefully
elif device_name != '/device:GPU:0':
  raise SystemError('Expected GPU device at /device:GPU:0 but found {}'.format(device_name))

print('Found GPU at: {}'.format(device_name))

def cpu():
  with tf.device('/cpu:0'):
    random_image_cpu = tf.random.normal((100, 100, 100, 3))
    net_cpu = tf.keras.layers.Conv2D(32, 7)(random_image_cpu)
    return tf.math.reduce_sum(net_cpu)

def gpu():
  with tf.device('/device:GPU:0'):
    random_image_gpu = tf.random.normal((100, 100, 100, 3))
    net_gpu = tf.keras.layers.Conv2D(32, 7)(random_image_gpu)
    return tf.math.reduce_sum(net_gpu)

# We run each op once to warm up; see: https://stackoverflow.com/a/45067900
cpu()
gpu()

# Run the op several times.
print('Time (s) to convolve 32x7x7x3 filter over random 100x100x100x3 images '
      '(batch x height x width x channel). Sum of ten runs.')
print('CPU (s):')
cpu_time = timeit.timeit('cpu()', number=10, setup="from __main__ import cpu")
print(cpu_time)
print('GPU (s):')
gpu_time = timeit.timeit('gpu()', number=10, setup="from __main__ import gpu")
print(gpu_time)
print('GPU speedup over CPU: {}x'.format(int(cpu_time/gpu_time)))

GPU device not found. Please ensure that the notebook is configured to use a GPU.
Found GPU at: 
Time (s) to convolve 32x7x7x3 filter over random 100x100x100x3 images (batch x height x width x channel). Sum of ten runs.
CPU (s):
4.252110466999966
GPU (s):
5.377550960000008
GPU speedup over CPU: 0x
