Adapté de https://pytorch.org/tutorials/beginner/deep_learning_60min_blitz.html

# Qu'est-ce que PyTorch?

-  Une librairie pouvant remplacer **NumPy** et permettant une **accélération GPU**
-  Une plateforme pour la **recherche en Deep Learning** offrant un maximum de **flexibilité et de rapidité**

## Tenseurs (`Tensor`)

Les tenseurs sont similaires aux `ndarray` de NumPy, et peuvent être utilisés sur GPU.

In [32]:
import torch
import numpy as np

Construisons une matrice 5x3 non-initialisée:

In [33]:
x = torch.empty(5, 3)
print(x)

tensor([[1.4426e-36, 0.0000e+00, 1.4714e-43],
        [1.5414e-43, 1.6255e-43, 5.6052e-44],
        [1.6816e-43, 1.2752e-43, 8.1275e-44],
        [6.1657e-44, 4.4842e-44, 6.8664e-44],
        [1.3032e-43, 5.7453e-44, 1.0681e-05]])


Construisons une matrice 5x3 de nombre aléatoires (entre 0 et 1):

In [34]:
x = torch.rand(5, 3)
print(x)

tensor([[0.3933, 0.0094, 0.3518],
        [0.2470, 0.4679, 0.0403],
        [0.4564, 0.7307, 0.1192],
        [0.0067, 0.7419, 0.1859],
        [0.6745, 0.2331, 0.2262]])


Construisons une matrice remplie de zéros, et de type `long`:

In [35]:
x = torch.zeros(5, 3, dtype=torch.long)
print(x)

tensor([[0, 0, 0],
        [0, 0, 0],
        [0, 0, 0],
        [0, 0, 0],
        [0, 0, 0]])


Construisons une matrice à partir de données:

In [36]:
x = torch.tensor([5.5, 3])
print(x)

tensor([5.5000, 3.0000])


In [37]:
x = torch.tensor([[1, 0], [0, 1]])
print(x)

tensor([[1, 0],
        [0, 1]])


Note: Les fonctions `torch.*_like(x)` fonctionnent de la même façon qu'avec NumPy (e.g. `zeros_like(x)`)

Affichons les dimensions du tenseur:

In [38]:
print(x.size())
print(x.shape)

torch.Size([2, 2])
torch.Size([2, 2])


Note: `torch.Size` est une sous-classe de `tuple`.

Vous pouvez aussi obtenir la taille d'une seule dimension d'un coup:

In [39]:
print(x.size(0))

2


## Opérations

Les opérations sur les tenseurs peuvent être faites avec différentes syntaxes. Regardons l'exemple de l'addition.

**Addition: syntaxe 1**

In [40]:
x = torch.rand(5, 3)
y = torch.ones_like(x)

somme = x + y
print(somme)

tensor([[1.4671, 1.8284, 1.2437],
        [1.6272, 1.3705, 1.7590],
        [1.2207, 1.1970, 1.5704],
        [1.2498, 1.3075, 1.0013],
        [1.0461, 1.7843, 1.2826]])


**Addition: syntaxe 2**

In [41]:
somme = torch.add(x, y)
print(somme)

tensor([[1.4671, 1.8284, 1.2437],
        [1.6272, 1.3705, 1.7590],
        [1.2207, 1.1970, 1.5704],
        [1.2498, 1.3075, 1.0013],
        [1.0461, 1.7843, 1.2826]])


**Addition: fournir un tenseur de destination**

In [42]:
somme = torch.empty(5, 3)
torch.add(x, y, out=somme)
print(somme)

tensor([[1.4671, 1.8284, 1.2437],
        [1.6272, 1.3705, 1.7590],
        [1.2207, 1.1970, 1.5704],
        [1.2498, 1.3075, 1.0013],
        [1.0461, 1.7843, 1.2826]])


**Addition: "in-place"**

In [43]:
y.add_(x)  # équivalent à torch.add(x, y, out=y)
print(y)

tensor([[1.4671, 1.8284, 1.2437],
        [1.6272, 1.3705, 1.7590],
        [1.2207, 1.1970, 1.5704],
        [1.2498, 1.3075, 1.0013],
        [1.0461, 1.7843, 1.2826]])


Note: les méthodes opérant "in-place" ont le suffixe `_`. Par exemple, `x.t_()` transpose `x`, alors que `x.t()` retourne un nouveau tenseur contenant `x` transposé.

**Indiçage**

Vous pouvez utiliser la même syntaxe qu'avec NumPy, même pour les cas complexes!

In [44]:
print(x[:, 1])
print(x[:, np.newaxis, 1])

tensor([0.8284, 0.3705, 0.1970, 0.3075, 0.7843])
tensor([[0.8284],
        [0.3705],
        [0.1970],
        [0.3075],
        [0.7843]])


`torch.reshape` est équivalent à `numpy.reshape`. Cependant, `torch.view` est plus souvent utilisée (mais ne fonctionne que lorsqu'une les valeurs n'ont pas à être copiées):

In [45]:
x = torch.randn(4, 4)
print(x.size())

y = x.view(16)
print(y.size())

z = x.view(-1, 8)  # -1 permet d'inférer automatiquement les autres dimensions
print(z.size())

torch.Size([4, 4])
torch.Size([16])
torch.Size([2, 8])


Si vous avez un tenseur contenant un seul élément, utilisez `.item()` pour obtenir la valeur sous forme de nombre Python:

In [46]:
x = torch.randn(4).mean()
print(x)
print(x.item())

tensor(0.2026)
0.2025759518146515


**À voir plus tard:** 100+ opérations, includant transposée, indiçage, _slicing_, algèbre linéaire, nombres aléatoires, etc. : https://pytorch.org/docs/torch

# Interopérabilité avec NumPy

La conversion d'un tenseur PyTorch en un NumPy array, et vice versa, est simple comme bonjour.

Le tenseur et le NumPy array utiliseront le même espace mémoire (si le tenseur n'est pas sur GPU); modifier l'un modifie l'autre du même coup.

## Conversion PyTorch --> NumPy

In [47]:
a = torch.ones(5)
print(type(a))
print(a)

<class 'torch.Tensor'>
tensor([1., 1., 1., 1., 1.])


In [48]:
b = a.numpy()
print(type(b))
print(b)

<class 'numpy.ndarray'>
[1. 1. 1. 1. 1.]


Modifions le tenseur et observons le changement dans le NumPy array:

In [49]:
a.add_(1)
print(a)
print(b)

tensor([2., 2., 2., 2., 2.])
[2. 2. 2. 2. 2.]


## Conversion NumPy --> PyTorch

In [50]:
a = np.ones(5)
b = torch.from_numpy(a)
np.add(a, 1, out=a)
print(a)
print(b)

[2. 2. 2. 2. 2.]
tensor([2., 2., 2., 2., 2.], dtype=torch.float64)



# Placer un tenseur sur GPU

Les tenseurs peuvent être placés sur un appareil (`torch.device`) avec la méthode `.to`:

In [51]:
assert torch.cuda.device_count() > 0, "On va avoir besoin d'un GPU"

device = torch.device("cuda")
x = torch.rand(2, 2, device=device)    # créer un tenseur directement sur GPU
y = torch.ones_like(x)
x = x.to(device)                       # placer un tenseur existant sur GPU
z = x + y
print(z)
print(z.to("cpu", torch.double))       # ``.to`` peut aussi changer le type du même coup

tensor([[1.8158, 1.7368],
        [1.5822, 1.6473]], device='cuda:0')
tensor([[1.8158, 1.7368],
        [1.5822, 1.6473]], dtype=torch.float64)
