In [1]:
import torch
import torch.nn as nn

- *Es muy importante poder escribir nuestro código de PyTorch de manera tal que sea agnóstico al dispositivo que estamos utilizando para ejecutarlo (más información [acá](https://docs.pytorch.org/docs/stable/notes/cuda.html#device-agnostic-code)). Por ejemplo, queremos poder ejecutar nuestro código en una GPU si es que tenemos alguna disponible, o ejecutarlo en una MPS (las GPUs disponibles para las computadoras Apple Silicon) o, como último recurso, ejecutarlo en la CPU.*
- *Es muy importante que cualquier modulo de PyTorch (i.e., tensores, modelos, etc.) que vayamos a utilizar en operaciones o entrenamientos se encuentren en el mismo dispositivo. PyTorch no nos permite realizar operaciones entre objectos que están guardados en diferentes dispositivos.*
- *Comenzamos definiendo una variable o clase que defina, según la disponibilidad, el dispositivo a utilizar por defecto.*

In [2]:
class Config:
    def __init__(self):
        if torch.cuda.is_available():
            self.device = torch.device("cuda")
        elif torch.backends.mps.is_available():
            self.device = torch.device("mps")
        else:
            self.device = torch.device("cpu")
    
config = Config()
print(f'Current available device: {config.device}')

Current available device: mps


- *PyTorch crea todos los objetos, por defecto, en la CPU. Podemos especificiar el dispositivo en donde queremos crear un tensor con el argumento `device`. También se puede utilizar el método `torch.Tensor.to()` para moverlo de un dispositivo a otro.*

In [5]:
# Create a tensor without specifying device
# This will default to the CPU
tensor_A = torch.randn((2, 3))
print(f'Device of tensor_A: {tensor_A.device}')

Device of tensor_A: cpu


In [4]:
# Create a tensor and define its device
tensor_B = torch.randn((2, 3), device=config.device)
print(f'Device of tensor_B: {tensor_B.device}')

Device of tensor_B: mps:0


- *Notar que si no podemos realizar operaciones entre `tensor_A` y `tensor_B`, porque esto nos devuelve un error. Tenemos que mover alguno de los tensores de dispositivo para que esto funcione.*

In [6]:
try:
    print(tensor_A * tensor_B)
except Exception as error:
    print(f'Error: {error}')

Error: Expected all tensors to be on the same device, but found at least two devices, mps:0 and cpu!


In [10]:
# Move tensor_A to the same device as tensor_B
tensor_A = tensor_A.to(config.device) # or tensor_A.to(tensor_B.device)

print(tensor_A * tensor_B)

tensor([[ 0.5859,  0.1104,  0.8016],
        [ 0.0325,  1.1627, -0.6197]], device='mps:0')
