## Tutorial Pytorch

<img src="figs/fig-pytorch.png" width="30%">

[https://pytorch.org](https://pytorch.org)

### - **PyTorch** es una biblioteca de aprendizaje automático de código abierto desarrollada por Meta AI.
###  - **Tensores**: Principal bloque de construcción (arreglos multi-dimensionales, no estrictamente el mismo significado que en matemáticas), similar a NumPy, con soporte para GPUs.
###  - **Autograd**: Sistema de diferenciación automática para el cálculo de los gradientes y facilitar el entrenamiento de modelos.
###  - **Ecosistema**: Incluye bibliotecas para visión por computadora, procesamiento de lenguaje natural y audio.

###

## Instalación 

###  <span style="color:cyan"> Windows </span>

```bash
conda install pytorch torchvision torchaudio cpuonly -c pytorch
```
##### CUDA - Compute Unified Device Architecture (https://developer.nvidia.com/cuda-toolkit)

```bash
conda install pytorch torchvision torchaudio pytorch-cuda=12.4 -c pytorch -c nvidia

```


### PIP

```bash
pip install torch torchvision torchaudio
```

##### CUDA - Compute Unified Device Architecture (https://developer.nvidia.com/cuda-toolkit)

```bash
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124

```




###  <span style="color:cyan">  Mac OS </span>

### Anaconda

```bash
conda install pytorch torchvision -c pytorch
```

### PIP

```bash
pip install torch torchvision
```


### Verificación de la instalación

In [None]:
import torch
torch.__version__

In [None]:
import torch
x = torch.rand(5, 3)
print(x)

## Paquete: torch
[https://pytorch.org/docs/stable/torch.html](https://pytorch.org/docs/stable/torch.html)

- ### El paquete Torch contiene estructuras de datos para tensores multidimensionales y define operaciones matemáticas sobre estos tensores
- ### Tiene una contraparte CUDA, que le permite ejecutar sus cálculos de tensores en una GPU NVIDIA.


## Introducción a los tensores

###  Tensores

- #### Los tensores son una estructura de datos similar a las matrices y arreglos.
 - #### En PyTorch, se usan tensores para codificar las entradas y salidas de un modelo, así como los parámetros del modelo.

- #### Los tensores son similares a los ndarrays de NumPy, excepto que los tensores pueden ejecutarse en GPU u otros aceleradores de hardware.

 - ####  Los tensores están optimizados para la diferenciación automática (Autograd).

 - #### Su función es representar los datos de forma numérica


In [None]:
import torch
# Creación de un tensor desde datos
data = [[1, 2],[3, 4]]
x_data = torch.tensor(data)
print(x_data)


In [None]:
import numpy as np
# A partir de una matriz NumPy
# Se pueden crear tensores a partir de matrices NumPy (y viceversa).

np_array = np.array(data)
x_np = torch.from_numpy(np_array)
print(x_np)

In [None]:
# El nuevo tensor conserva las propiedades (forma, tipo de datos) del tensor del argumento

x_ones = torch.ones_like(x_data) # conserva las propiedades de x_data
print(f"Tensor de unos: \n {x_ones} \n")

x_rand = torch.rand_like(x_data, dtype=torch.float32) # anula el tipo de datos de x_data
print(f"Tensor aleatorio: \n {x_rand} \n")

In [None]:
shape = (2,3)
# random
rand_tensor = torch.rand(shape)
# unos
ones_tensor = torch.ones(shape)
# ceros
zeros_tensor = torch.zeros(shape)

print(f"Tensor aleatorio: \n {rand_tensor} \n")
print(f"Tensor de unos: \n {ones_tensor} \n")
print(f"Tensor de ceros: \n {zeros_tensor}")


## Atributos del tensor

In [None]:
tensor = torch.rand(3,4)

print(f"Forma del tensor: {tensor.shape}")
print(f"Tipo de datos del tensor: {tensor.dtype}")
print(f"El tensor del dispositivo se almacena en: {tensor.device}")

# Operaciones con tensores

### Creando tensores en GPU

In [None]:
# Movemos nuestro tensor a la GPU si está disponible
print("GPU disponible: ", torch.cuda.is_available())

# Por default los tensores se crean en el cpu
tensor  = torch.rand((3,4))
print("tensor en: ", tensor.device)


In [None]:

if torch.cuda.is_available():  # GPU
    print("Moviendo tensor a GPU: ", torch.cuda.is_available())
    tensor = tensor.to("cuda")
    tensor2 = torch.rand((3,4), device="cuda")
    print("Creando tensor2 en GPU: ", tensor2)

if torch.backends.mps.is_available():  #GPU en MAC
    print("Moviendo tensor a GPU Mac: ", torch.backends.mps.is_available())
    tensor = tensor.to("mps")
    tensor2 = torch.rand((3,4), device="mps")
    print("Creando tensor2 en GPU Mac: ", tensor2)

print(tensor)


## Indexamiento y slicing

In [None]:
#Indexación y segmentación estándar de tipo numpy:

tensor = torch.linspace(1, 16, 16).reshape(4,4)
print(tensor)
print(f"Primera fila: {tensor[0]}")
print(f"Primera columna: {tensor[:, 0]}")
print(f"Última columna: {tensor[:, -1]}")
# colocar ceros a la columna 1 
tensor[:, 1] = 0
print(tensor)

## Operaciones aritméticas

In [None]:
# Esto calcula la multiplicación de matrices entre dos tensores. y1, y2, y3 tendrán el mismo valor
# ``tensor.T`` devuelve la transpuesta de un tensor

tensor = torch.linspace(1, 6, 6).reshape(2,3)

print(tensor)
y1 = tensor @ tensor.T
print(f"y1:\n{y1}\n")
y2 = tensor.matmul(tensor.T)
print(f"y2:\n{y2}\n")

y3 = torch.rand_like(y1)
print(f"y3:\n{y3}\n")

# Esto calcula el producto elemento por elemento. z1, z2, z3 tendrán el mismo valor
z1 = tensor * tensor
print(f"z1:\n{z1}\n")

z2 = tensor.mul(tensor)
print(f"z2:\n{z2}\n")


## Ejemplo de imagen
- ### Por ejemplo, se podría representar una imagen como un tensor con forma [3, 200, 200]
- ### lo que significaría [canales_de_color, altura, ancho], dado que la imagen tiene 3 canales de color (red, green, blue), una altura de 200 píxeles y un ancho de 200 píxeles.

In [None]:
import torch.nn as nn
import matplotlib.pyplot as plt

tensor_image = torch.randn((3, 200, 200) , dtype=torch.float32)
print(tensor_image.shape)
#nn.init.xavier_uniform_(tensor_image, gain=18)

#Crea un nuevo vector con los mismo datos, con diferente forma (shape)  forma para visualizar 200x200x3
tensor = tensor_image.view(tensor_image.shape[1], tensor_image.shape[2], tensor_image.shape[0])
plt.imshow(tensor)



## Creación de capas lineales

In [None]:
# Capa lineal
import torch
import numpy as np
from torch import nn

#Estable la semilla para la generación de números aleatorios para la reproducibilidad de experimentos

np.random.seed(42)
torch.manual_seed(42)

#creación de la capa lineal de 3x2: 3 entradas y 2 neuronas de salida
linear_layer = nn.Linear(in_features=3,out_features=2)

# parámetro donde se guardan los pesos
print("weight:", linear_layer.weight)

# El bias se crea automáticamente de acuerdo al números de neuronas
print("bias:", linear_layer.bias)

## Introducción de datos a la capa

In [None]:
# definición de entradas

x = torch.tensor([1, 2, 3], dtype=torch.float32)

#Aplicación de la capa lineal en Pytorch
z_c1 = linear_layer(x)
print("z_c1:", z_c1)


print("\n\nCáluclo manual de z para las entradas de x:")
print("inputs:", x)
print("z11 : ", 0.4414*1 + 0.4792*2 -0.1353*3 + (-0.2811) )
print("z12 : ", 0.5304*1 -0.1265*2 + 0.1165*3 + (0.3391) )

torch.matmul(x, linear_layer.weight.T) + linear_layer.bias

## Aplicación de funciones de activación

In [None]:
#Funcion de activación Sigmoide
sigmoid = nn.Sigmoid()
z = torch.tensor([5, 0, -5], dtype=torch.float32)
a = sigmoid(z)
print(a)

In [None]:
#Funcion de activación ReLU
relu = nn.ReLU()

z = torch.tensor([5, 0, -5], dtype=torch.float32)
a = relu(z)
print(a)

In [None]:
#Funcion de activación ELU
elu = nn.ELU()

z = torch.tensor([5, 0, -5], dtype=torch.float32)
a = elu(z)
print(a)

In [None]:
#Funcion de activación PReLU
prelu = nn.PReLU()

z = torch.tensor([5, 0, -5], dtype=torch.float32)
a = prelu(z)
print(a)

## Cálculo de Gradientes: AutoGrad

### Torch.autograd proporciona clases y funciones que implementan la diferenciación automática de funciones con valores escalares arbitrarios.

### Requiere declarar los tensores para los que se deben calcular los gradientes con la palabra clave **require_grad=True**.

### **backward**  Calcular la suma de gradientes de tensores dados con respecto a las hojas del gráfico generado.

### **grad**  Compute and return the sum of gradients of outputs with respect to the inputs.

#### A continuación se muestra una representación visual del grado (DAG) del ejemplo siguiente. En el gráfico, las flechas apuntan en la dirección del paso hacia adelante. Los nodos representan las funciones hacia atrás de cada operación en el paso hacia adelante. Los nodos de hoja en azul representan  tensores de hojas a y b.

$$ Q=3a^3 - b^2 $$

$$ \frac {\partial Q}{\partial a} =9a^2 $$ 
$$ \frac {\partial Q}{\partial b} = - 2b $$
<img src="figs/fig-dag_autograd.png" width="20%">


Cuando se llama a **.backward()** en Q, autograd calcula estos gradientes y los almacena en el atributo **.grad** de los tensores respectivos.

Se requiere pasar explícitamente un argumento **gradient** en **Q.backward()** porque es un vector. **gradient** es un tensor de la misma forma que Q y representa el gradiente de Q con respecto a sí mismo, es decir,




In [None]:
import torch

# Tensores que requieren el cálculo de los gradientes

a = torch.tensor([2., 3.], requires_grad=True)
b = torch.tensor([6., 4.], requires_grad=True)

# Funcion Q = a^3 - b^2

Q = a**3 - b**2

# Derivada de Q = 3a^2 - 2b
# Derivada de Q respecto a 'a'  Qa = 3a^2 
# Derivada de Q respecto a 'b'  Qb = -2b

# Cálculo de los gradientes
# Se requiere como parámetro el tamaño de las dimensiones del vector o matriz que se calcularán los gradientes
print(torch.ones_like(b))
Q.backward(gradient=torch.ones_like(b))

print("Pytorch gradiente de a:",  a.grad)
print("Pytorch gradiente de b:",  b.grad)
print(Q.grad_fn)


# Comparación de los gradientes
print("")
print("Gradientes calculados con las derivadas parciales")
print("Gradiente respecto a 'a' :",  3*a**2)
print("Gradiente respecto a 'b' :",  -2*b)
#


### Gradiente de la función sigmoide

### $\sigma(x) = \frac{1}{1 + e^{-x}}$

### Derivada de la función sigmoide

### $\sigma'(x) = \sigma(x) \cdot (1 - \sigma(x))$

In [None]:
#Gradientes de la función de sigmoide
sigmoid = nn.Sigmoid()

z = torch.tensor([5, 0, -5], dtype=torch.float32, requires_grad=True)

a = sigmoid(z)
print("activaciones:", a)

a.backward(torch.ones_like(z))

print("Gradientes:", z.grad)

# Derivada símbolica de la función y=sigmoide(z): y*(1-y)
print("\nGradientes manuales")

print(a[0]*(1-a[0]))

print("\n", a*(1-a))

In [None]:
#Gradientes de la función de activación ReLu
relu = nn.ReLU()

z = torch.tensor([5, 0, -5], dtype=torch.float32, requires_grad=True)
a = relu(z)

a.backward(torch.ones_like(z))

print(a)
print("Gradientes:", z.grad)


## Ejercicio de gradientes  1
### Obtener los gradientes de la función f(x,y) respecto a los tensores $x$ y $y$ 
### $f(x, y) = x^2  y + \sin(x + y) $

### 1. Definir los tensores $x$=2.0 y $y$=3.0
### 2. Usar las funciones torch.sin(z) y torch.cos(z)


In [153]:
# TODO: 
# 1. Definir los tensores y calcular los gradientes de los tensores x y y con la función anterior
# 2. Comprobar manualmente que los gradientes  son los mismos obtenidos con el mecanismo de backward

## Ejercicio de gradientes 2

In [147]:
import numpy as np
# Función de activación sigmoide
def fn_sigmoid(x):
    return 1 / (1 + np.exp(-x))

# Derivada de la sigmoide
def fn_sigmoid_derivative(x):
    # return sigmoid(x) * (1 - sigmoid(x))
    return x * (1 - x)


In [149]:
# TODO: Dado el siguiente tensor t apicar una función aplicar dos veces una función sigmoide a t es decir y = sigmoide(sigmoide(t)), en pasos separados, 
# es decir con variables intermedias para aplicar la  regla de la cadena
# 1. Obtener el gradiente de t por medio de la librería PyTorch (backward)
# 2. Comprobar que el gradiente de t es el mismo obtenido de manera símbolica derivando la función sigmoide y aplicando la regla de la cadena, esto es,  dy_dt
# Nota1:  Para comprobar el gradiente de manera manual, hacer uso de las funciones fn_sigmoide y fn_sigmoid_derivative
# Nota2:  El cálculo de la derivada con la fn_sigmoid_derivative considera la entrada como el parámetro x ya activado, es decir,  x = sigmoide(t)
#         Si quiere aplicar el valor de entrada t en la dereivada use la linea comentada sigmoid(x) * (1 - sigmoid(x))

t = torch.tensor([0.8762], requires_grad = True)