<a href="https://colab.research.google.com/github/CodingTomo/PyTorch-Tutorials/blob/master/PyTorch_Le_Basi.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

**Torch** è un *framework* open-source sviluppato da Facebook per implementare modelli di Machine Learning e opera tramite l'utilizzo di tensori. 

 Un **vettore** rispetto ad un fissato sistema di riferimento è un **tensore** di dimensione 1. Una **matrice** nelle stesse condizioni è un **tensore** di dimensione 2 e così via. 
 A questo concetto intuitivo di tensore si affianca, in matematica, una definizione più rigorosa che non necessita di specificare un particolare sistema di riferimento (base).

 [Per ulteriori informazioni sul concetto di tensore](https://en.wikipedia.org/wiki/Tensor)


 ### PyTorch
Pytorch è una libreria Python, simile a NumPy, per sviluppare modelli statistici e di ML. I due aspetti principali che la differenziano da Numpy sono:
- permettere uso di GPU;
- permettere il calcolo differenziale.

Questo notebook e i successivi sono pensati per essere utilizzati su google **Colab**.

In [0]:
import torch
import numpy as np

Definiamo di seguito due tensori di dimensione $1$ e $2$ rispettivamente.

In [0]:
X = torch.tensor([1, 2, 3, 4, 5])
print('Questo è un tensore di dimensione 1: ', X.numpy())
print('-'*70)
print("La 'lunghezza' del tensore nella sua unica dimensione è: ", X.numpy().shape)

In [0]:
Y = torch.tensor([[1,2,3],[4,5,6]])
print('Questo è un tensore di dimensione 1: \n', Y.numpy())
print('-'*70)
print("Le 'lunghezze' del tensore nelle sue due dimensioni sono: ", Y.numpy().shape)

**Esercizio**: costruire un tensore con dimensione $[3,3,2]$ e verificare cosa cambia se rimuoviamo il *cast* che trasforma la nostra istanza Pytorch in numpy. 

**Pytorch** è molto simile anche sintatticamente a **numpy**. Vediamo qualche esempio.

In [0]:
np.eye(3)

In [0]:
torch.eye(3)

In [0]:
np.arange(0,10,2)

In [0]:
torch.arange(0,10,2)

Molto spesso non molto utile definire tensori scrivendone il contenuto esplicitamente. Esistono molte funzioni che permettono di scrivere particolari tensori usando un solo comando. 

In [0]:
torch.zeros(3)

In [0]:
torch.ones((2,2,2))

In [0]:
torch.empty((2,3))

In [0]:
torch.rand(2,2,2)

In [0]:
torch.linspace(1,10,5)

Di seguito una serie di metodi o attributi utili a recuperare la **struttura** di un tensore.

In [0]:
x = torch.Tensor([[0,1,2], [3,4,5]])

print("x.shape : ", (x.shape,))
print('-'*70)
print("x.size() : ",(x.size(),))
print('-'*70)
print("x.size(1) : ", x.size(1))
print('-'*70)
print("x.dim() : ",x.dim())
print('-'*70)
print("x.numel(): ", x.numel())

In generale in PyTorch le **operazioni** si concatenano l'una con l'altra. 

In [0]:
X = torch.rand(3, 2)
print(X.numpy())

In [0]:
X.exp()

In [0]:
(X.exp() + 2).sqrt() - 2 * X.log().sigmoid()

Tuttavia esiste la possibità di eseguire i conti scrivendo in forma "funzionale" il calcolo. 

In [0]:
torch.exp(X)

**Esercizio**: portare in forma "funzionale" (dove possibile) il seguente conto:
```
(X.exp() + 2).sqrt() - 2 * X.log().sigmoid()
```








Anche le operazioni di **aggregazione** hanno una sintassi simile.

In [0]:
X=torch.rand(3, 2)
print(X.numpy())
print('-'*70)
print('La somma è :', X.sum())
print('-'*70)
print('La media è :', X.mean())
print('-'*70)
print('La norma 1 è :', X.norm(p=2))
print('-'*70)
print('Il massimo per ogni riga è : \n', X.max(dim=1))

**Esercizio** Convincersi che nell'esempio precedente vale sempre: 

```
X.sum() = X.norm(p=1) > X.norm(p=2)
```



Le pricipali **operazioni** tra tensori di dimensione 2 (matrici) sono già implementate all'interno di PyTorch.

In [0]:
Y = torch.rand(2, 3)
print('La matrice Y : \n',  Y.numpy())
print('-'*70)
print('La trasposta di Y : \n', Y.t().numpy())
print('-'*70)
print('Il prodotto righe per colonne fra Y e Y.t() : \n', (Y @ Y.t()).numpy())
print('-'*70)
print('Il determinante di Y @ Y.t() : \n', (Y @ Y.t()).det().numpy())
print('-'*70)
print('Inversa di Y @ Y.t() : \n', (Y @ Y.t()).inverse().numpy())
print('-'*70)
print('Informazioni spettrali di Y @ Y.t() : \n', (Y @ Y.t()).eig())

**Esercizio**: Capire come eseguire il prodotto elemento per elemento di due matrici. Che vincolo devono soddisfare le due matrici?

Esistono alcuni operatori che non vanno a modificare l'oggetto su cui operano. E' fondamentale capire ciò che, si potrebbe dire, agisce per **riferimento** o per **valore**. 

In [0]:
X=torch.eye(3)
X

In [0]:
print('Sommo 5 elemento per elemento ad X usando add() : \n', X.add(5).numpy())
print('-'*70)
print('Stampo X: \n', X.numpy())

In [0]:
print('Sommo 5 elemento per elemento ad X usando add_() : \n', X.add_(5).numpy())
print('-'*70)
print('Stampo X: \n', X.numpy())


Ancora più sottile è la differenza tra i seguenti blocchi di codice. Chiara se si pensa alle **variabili** come ad **allocazioni di memoria** fisiche sulla macchina.

In [0]:
A = torch.ones(1)

A_copia = A
A = A + 1

print('A e A_copia valgono rispettivamente: ', A.numpy(), A_copia.numpy())

In [0]:
A = torch.ones(1)

A_copia = A
A += 1

print('A e A_copia valgono rispettivamente: ', A.numpy(), A_copia.numpy())

**Esercizio**: Quante celle di memoria sono occupate nell'ultimo blocco? Quante nel penultimo?

Selezionare specifiche **righe** e/o **colonne** è molto facile usando opportunamente gli indici e l'operatore **:**

Osservare che la numerazione parte da 0. 

In [0]:
A = torch.randint(100, (5, 5))
A

In [0]:
A[0,0]

In [0]:
A[:, 2:4]

In [0]:
A[2:, :3]

**Esercizio**: estrarre dal tensore X definito come:

```
X = torch.arange(40).view(5,8)
```
il vettore
$ \begin{bmatrix}
17 & 19 & 21 & 23 \\
\end{bmatrix}  $


Nella pratica sono molto utili le funzioni di **ridimensionamento** di un tensore.

La funzione `view()` è l'quivalente di `reshape()` di numpy con la differenza che non rialloca l'oggetto, ma tiene traccia solo del metadato.

In [0]:
X = torch.tensor([1, 2, 3, 4, 5, 6])
print('Tensore di partenza : ', X.numpy())
print('-'*70)
Y = X.view(2, 3)  
print('Ridimensionato : \n' ,Y.numpy())

In [0]:
Z = X.view(-1, 2) # inferisce in automatico la prima delle due dimensioni
print('Ridimensionato : \n' ,Z.numpy())

Altre funzioni di ridimensionamento sono `expand()`, `squeeze()` e `unsqueeze()`.

In [0]:
Y = torch.ones(5) # dimensione 1
Y = Y.view(-1, 1) # dimensione 2
Y, Y.shape

In [0]:
Y.expand(5, 3)

In [0]:
X = torch.eye(4)
Y = X[3:, :]
Y, Y.shape

In [0]:
Y = Y.squeeze()
Y, Y.shape

In [0]:
Y = Y.unsqueeze(1)
Y, Y.shape

**Esercizio**: creare il seguente tensore:


$$ \begin{bmatrix}
1 & 0.5 & 0.5   \\ 0.5 & 1 & 0.5 \\ 0.5 & 0.5 & 1
\end{bmatrix}  $$

**Esercizio**: creare il seguente tensore:

$$ \begin{bmatrix}
2 & 2 & 2 & 2 & 2 \\
4 & 4 & 4 & 4 & 4 \\
6 & 6 & 6 & 6 & 6 \\
8 & 8 & 8 & 8 & 8
\end{bmatrix}  $$

Le **maschere** sono molto utili per imporre condizioni direttamente sugli elementi che compongono un tensore.

In [0]:
X = torch.randint(100, (2, 5, 3))
print('Tensore: \n', X.numpy())

In [0]:
mask = (X > 25) & (X < 75)
print('Una possibile maschera per X: \n', mask)
# mask = (X == 25) | (X > 60) #un'altra possibile maschera.

In [0]:
X[mask] # Ritorna in un tensore 1 dimensionale tutti gli elementi che soddisfano la condizione

In [0]:
mask.sum() # Ritorna il numero di elementi che soddisfano la condizione

**Esercizio**: A partire dal tensore X definito come:

```
X = torch.tensor([[1, 0, 2], [4, 6, 0], [0, -7, 1]]),
```
usare le maschere per rispondere alle seguenti domande.

1.   Quanti elementi sono negativi?
2.   Dopo aver trovato la media aritmetica degli elementi di $X$, calcolare la somma degli elementi di $X$ il cui valore è superiore alla media calcolata.
3. Sostituire $0$ a tutti gli elementi di X che non sono compresi nell'intervallo $[1,3]$.





Le operazioni di **cast** fra tipi diversi di tensori o fra oggetti Pytorch e numpy sono immediati.

In [0]:
Y = 4 * torch.rand((2,4))
Y

In [0]:
Y.to(torch.int)

In [0]:
torch.LongTensor([1, 2]) + torch.FloatTensor([1.1, 2.2]) # supporta l'autocast se necessario

In [0]:
X = np.random.random((5,3)) # da numpy a Torch
Y=torch.from_numpy(X)
Y

In [0]:
X = Y.numpy() # da Torch a numpy
X

**CUDA** (acronimo di Compute Unified Device Architecture) è un'architettura hardware per **l'elaborazione parallela** creata da NVIDIA. Tramite l'ambiente di sviluppo per CUDA, i programmatori di software possono scrivere applicazioni capaci di eseguire calcolo parallelo sulle GPU delle schede video NVIDIA.

[Ulteriori informazioni su CUDA](https://en.wikipedia.org/wiki/CUDA)

Pytorch è in grado di rilevare è disponibile una GPU e in caso positivo sfruttarla.

In [0]:
torch.cuda.is_available() 
# Se la risposta è false, andare nella barra in alto, quindi Runtime -> Change runtime type -> Hardware accelerator = GPU e ricaricare le librerie

In [0]:
torch.cuda.device_count() # numero di GPU disponibili

Il modo migliore per spostare un tensore da una *device* ad un'altra è la funzione `to()` alla quale è necessario passare un oggetto di tipo *torch.device object*. Un **torch.device object** è un oggetto che rappresenta il *device* su cui il tesore è definito o sarà allocato.

In [0]:
x = torch.Tensor([[1,2,3], [4,5,6]])

cpu = torch.device('cpu')
cuda_0 = torch.device('cuda:0') # si indicizza da 0

x = x.to(cpu)
print('Il tensore è posizionato su:', x.device)
x = x.to(cuda_0)
print('Il tensore è posizionato su:', x.device)

In [0]:
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
x = x.to(device)  # In questo modo se siamo su una macchina con GPU bene, altrimenti si va su CPU
print(x.device)

In [0]:
y = torch.Tensor([[1,1,1], [1,1,1]])
print('Il tensore y è posizionato in: ', y.device)
print('Il tensore x è posizionato in: ', x.device)

# z = x+y # Questo comando va in errore ogni volta che x e y sono posizionati su device diverse!

Un **confronto** fra le prestazioni di CPU e GPU.

In [0]:
A = torch.rand(100, 1000, 1000) # pensare a 100 matrici 1000x1000
B = A.cuda()
A.size()

In [0]:
%timeit -n 3 torch.bmm(A, A) # prodotto tensore di A con se stesso eseguito 3 volte su CPU

In [0]:
%timeit -n 30 torch.bmm(B, B) # prodotto tensore di B con se stesso eseguito 30 volte su GPU