<a href="https://colab.research.google.com/github/mleyvaz/computacion-paralela/blob/main/GPU-CPU%20Speedup.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Tensorflow con la GPU

Este cuaderno proporciona una introducción a la computación en una [GPU](https://cloud.google.com/gpu) en Colab. En este cuaderno te conectarás a una GPU, y luego ejecutarás algunas operaciones básicas de TensorFlow tanto en la CPU como en la GPU, observando el aumento de velocidad que proporciona el uso de la GPU.

## Habilitar y probar la GPU

En primer lugar, tendrás que habilitar la GPU para el portátil:

- Vaya a Editar→Configuración del portátil
- selecciona GPU en el menú desplegable Acelerador de hardware

A continuación, confirmaremos que podemos conectarnos a la GPU con tensorflow:

In [1]:
%tensorflow_version 2.x
import tensorflow as tf
device_name = tf.test.gpu_device_name()
if device_name != '/device:GPU:0':
  raise SystemError('GPU device not found')
print('Found GPU at: {}'.format(device_name))

SystemError: ignored

## Calcular el aumento de velocidad de TensorFlow en la GPU respecto a la CPU (speedup)

Este ejemplo construye una capa típica de red neuronal convolucional sobre una
imagen aleatoria y coloca manualmente las operaciones resultantes en la CPU o en la GPU
para comparar la velocidad de ejecución.

In [None]:
%tensorflow_version 2.x
import tensorflow as tf
import timeit

device_name = tf.test.gpu_device_name()
if device_name != '/device:GPU:0':
  print(
      '\n\nThis error most likely means that this notebook is not '
      'configured to use a GPU.  Change this in Notebook Settings via the '
      'command palette (cmd/ctrl-shift-P) or the Edit menu.\n\n')
  raise SystemError('GPU device not found')

def cpu():
  with tf.device('/cpu:0'):
    random_image_cpu = tf.random.normal((100, 100, 100, 3))
    net_cpu = tf.keras.layers.Conv2D(32, 7)(random_image_cpu)
    return tf.math.reduce_sum(net_cpu)

def gpu():
  with tf.device('/device:GPU:0'):
    random_image_gpu = tf.random.normal((100, 100, 100, 3))
    net_gpu = tf.keras.layers.Conv2D(32, 7)(random_image_gpu)
    return tf.math.reduce_sum(net_gpu)
  
# We run each op once to warm up; see: https://stackoverflow.com/a/45067900
cpu()
gpu()

# Run the op several times.
print('Time (s) to convolve 32x7x7x3 filter over random 100x100x100x3 images '
      '(batch x height x width x channel). Sum of ten runs.')
print('CPU (s):')
cpu_time = timeit.timeit('cpu()', number=10, setup="from __main__ import cpu")
print(cpu_time)
print('GPU (s):')
gpu_time = timeit.timeit('gpu()', number=10, setup="from __main__ import gpu")
print(gpu_time)
