# 2 - PyTorch


<br>
<br>

<img src="https://raw.githubusercontent.com/Hack-io-AI/ai_images/main/pytorch.png" style="width:400px;"/>

<h1>Tabla de Contenidos<span class="tocSkip"></span></h1>
<div class="toc"><ul class="toc-item"><li><span><a href="#1---¿Qué-es-PyTorch?" data-toc-modified-id="1---¿Qué-es-PyTorch?-1">1 - ¿Qué es PyTorch?</a></span></li><li><span><a href="#2---Creación-de-tensores" data-toc-modified-id="2---Creación-de-tensores-2">2 - Creación de tensores</a></span></li><li><span><a href="#3---Atributos-de-los-tensores" data-toc-modified-id="3---Atributos-de-los-tensores-3">3 - Atributos de los tensores</a></span></li><li><span><a href="#4---Dispositivo" data-toc-modified-id="4---Dispositivo-4">4 - Dispositivo</a></span></li><li><span><a href="#5---Manipulación-de-tensores" data-toc-modified-id="5---Manipulación-de-tensores-5">5 - Manipulación de tensores</a></span></li><li><span><a href="#6---Cálculos-con-tensores" data-toc-modified-id="6---Cálculos-con-tensores-6">6 - Cálculos con tensores</a></span></li><li><span><a href="#7---Selección-de-elementos-y-slicing" data-toc-modified-id="7---Selección-de-elementos-y-slicing-7">7 - Selección de elementos y slicing</a></span></li><li><span><a href="#8---Cálculo-del-gradiente-(derivadas)" data-toc-modified-id="8---Cálculo-del-gradiente-(derivadas)-8">8 - Cálculo del gradiente (derivadas)</a></span></li></ul></div>

## 1 - ¿Qué es PyTorch?

PyTorch es una biblioteca de código abierto para el aprendizaje automático y el desarrollo de redes neuronales profundas. Fue desarrollada principalmente por Facebook's AI Research lab (FAIR) y es ampliamente utilizada tanto en la investigación académica como en la industria. PyTorch proporciona una interfaz flexible y fácil de usar para construir, entrenar y desplegar modelos de aprendizaje profundo.


**Características Clave de PyTorch**


1. **Tensores**: Los tensores son estructuras de datos similares a los arrays de NumPy, pero con soporte para operaciones en aceleradores de hardware como GPUs. Son la base de las operaciones en PyTorch.


2. **Autograd**: PyTorch incluye una potente capacidad de diferenciación automática que permite calcular gradientes automáticamente. Esto es esencial para la optimización de redes neuronales mediante métodos de retropropagación.


3. **Interfaz dinámica**: A diferencia de otros marcos de aprendizaje profundo como TensorFlow, PyTorch utiliza una definición de gráficos dinámicos, lo que significa que los gráficos de computación se construyen en tiempo de ejecución. Esto hace que sea más fácil y natural escribir código de aprendizaje profundo, depurar y experimentar.


4. **Integración con Python**: PyTorch está profundamente integrado con Python, lo que lo hace intuitivo y fácil de aprender para aquellos que ya están familiarizados con el lenguaje. Se puede utilizar junto con otras bibliotecas de Python, como NumPy, SciPy y scikit-learn.


5. **Soporte extenso para redes neuronales**: PyTorch proporciona una amplia gama de herramientas y bibliotecas para construir y entrenar redes neuronales, incluyendo capas predefinidas, funciones de activación, optimizadores y herramientas para el procesamiento de datos.


**Aplicaciones de PyTorch**


1. **Investigación académica**: PyTorch es muy popular en la comunidad de investigación debido a su flexibilidad y facilidad de uso. Permite a los investigadores experimentar rápidamente con nuevas ideas y algoritmos.


2. **Industria**: Empresas como Facebook, Tesla, Microsoft y muchas startups utilizan PyTorch para desarrollar y desplegar modelos de aprendizaje profundo en producción.


3. **Procesamiento de lenguaje natural (NLP)**: PyTorch es utilizado para desarrollar modelos avanzados de NLP, como transformers y modelos de generación de lenguaje.


4. **Visión por computador**: PyTorch proporciona herramientas y bibliotecas para tareas de visión por computador, como clasificación de imágenes, detección de objetos y segmentación semántica.


Para instalar PyTorch tenemos que ejeccutar el siguiente comando:

```python
pip install pytorch
```


In [1]:
import torch

## 2 - Creación de tensores

Un tensor puede crearse usando constructores de torch o a partir de listas de Python o ndarray de NumPy.

In [2]:
torch.zeros(10)

tensor([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])

In [3]:
torch.ones(10)

tensor([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])

In [4]:
torch.linspace(0, 9, steps=10)

tensor([0., 1., 2., 3., 4., 5., 6., 7., 8., 9.])

In [5]:
lista = [1,2,3,4,5,6,7,8]

torch.Tensor(lista)

tensor([1., 2., 3., 4., 5., 6., 7., 8.])

In [6]:
import numpy as np

array = np.random.random(9)

torch.from_numpy(array)

tensor([0.8469, 0.5095, 0.7175, 0.0550, 0.8968, 0.9874, 0.7470, 0.5663, 0.7383],
       dtype=torch.float64)

In [8]:
data = torch.rand(5)

data.numpy()

array([0.23727506, 0.5851321 , 0.8017535 , 0.36349165, 0.03304368],
      dtype=float32)

## 3 - Atributos de los tensores

Un tensor tiene un tamaño, dimensiones y tipo específico. Esto se consulta con los atributos `ndim`, `shape` y `dtype`.

In [10]:
tensor = torch.rand(10, 20, 30)

In [11]:
tensor.ndim

3

In [12]:
tensor.shape

torch.Size([10, 20, 30])

In [13]:
tensor.dtype

torch.float32

## 4 - Dispositivo

Un tensor puede estar alojado en la memoria del sistema, `cpu`, en la memoria de dispositivo `gpu` con `cuda` o `mps` en los Mac, esto se consulta con el atributo `device`. Cuando se crea un tensor se puede especificar el tipo y el dispositivo.

In [14]:
tensor.device

device(type='cpu')

In [15]:
tensor = torch.zeros(10, dtype=torch.int32, device='mps')

tensor.device

device(type='mps', index=0)

In [16]:
tensor.dtype

torch.int32

## 5 - Manipulación de tensores

In [17]:
tensor = torch.linspace(0, 9, 10)

tensor

tensor([0., 1., 2., 3., 4., 5., 6., 7., 8., 9.])

Podemos reorganizar las dimensiones del tensor con el método `reshape`:

In [18]:
tensor = tensor.reshape(2, 5)

tensor

tensor([[0., 1., 2., 3., 4.],
        [5., 6., 7., 8., 9.]])

Podemos transponer el método `transpose()` o su alias `T`:

In [19]:
tensor.T

tensor([[0., 5.],
        [1., 6.],
        [2., 7.],
        [3., 8.],
        [4., 9.]])

Podemos convertir un tensor de dimensión arbitraria a uno de una dimensión con `flatten()`:

In [21]:
tensor.flatten()

tensor([0., 1., 2., 3., 4., 5., 6., 7., 8., 9.])

Podemos agregar una dimensión en una posición arbitraria con `unsqueeze(n)`:

In [23]:
tensor.unsqueeze(1).shape

torch.Size([2, 1, 5])

## 6 - Cálculos con tensores

Veamos algunas operaciones con tensores, igual que hicimos con NumPy:

In [24]:
tensor = tensor.flatten()

tensor

tensor([0., 1., 2., 3., 4., 5., 6., 7., 8., 9.])

In [25]:
5 + tensor

tensor([ 5.,  6.,  7.,  8.,  9., 10., 11., 12., 13., 14.])

In [26]:
tensor + tensor

tensor([ 0.,  2.,  4.,  6.,  8., 10., 12., 14., 16., 18.])

In [27]:
5 * tensor

tensor([ 0.,  5., 10., 15., 20., 25., 30., 35., 40., 45.])

In [28]:
tensor.pow(2)

tensor([ 0.,  1.,  4.,  9., 16., 25., 36., 49., 64., 81.])

In [29]:
tensor.log()

tensor([  -inf, 0.0000, 0.6931, 1.0986, 1.3863, 1.6094, 1.7918, 1.9459, 2.0794,
        2.1972])

In [30]:
tensor.exp()

tensor([1.0000e+00, 2.7183e+00, 7.3891e+00, 2.0086e+01, 5.4598e+01, 1.4841e+02,
        4.0343e+02, 1.0966e+03, 2.9810e+03, 8.1031e+03])

In [31]:
tensor.cos()

tensor([ 1.0000,  0.5403, -0.4161, -0.9900, -0.6536,  0.2837,  0.9602,  0.7539,
        -0.1455, -0.9111])

In [32]:
tensor.sin()

tensor([ 0.0000,  0.8415,  0.9093,  0.1411, -0.7568, -0.9589, -0.2794,  0.6570,
         0.9894,  0.4121])

In [33]:
tensor.min()

tensor(0.)

In [34]:
tensor.max()

tensor(9.)

In [35]:
tensor.mean()

tensor(4.5000)

In [36]:
tensor.median()

tensor(4.)

In [37]:
tensor.var()

tensor(9.1667)

In [38]:
tensor.std()

tensor(3.0277)

En pricipio, cualquier operación que pudieramos hacer con un ndarray de NumPy, se podrían hacer también con PyTorch. 

## 7 - Selección de elementos y slicing

Podemos realizar la selección de elementos y el slicing exactamente igual que hicimos con los ndarray.

In [40]:
tensor[0]

tensor(0.)

In [41]:
tensor[0].item()

0.0

In [42]:
int(tensor[0])

0

In [44]:
tensor[0:7:2]

tensor([0., 2., 4., 6.])

## 8 - Cálculo del gradiente (derivadas)

En general, las redes neuronales se entrenan usando Gradiente descedente. Por lo tanto necesitamos calcular las derivadas de la función de pérdida para todos los parámetros de la red. PyTorch tiene incorporado un sistema de derivación automática denominado autograd. Para poder derivar una función en pytorch:

1. Se necesita que su entrada sean tensores con el atributo `requires_grad=True`.

2. Luego llamamos la función `backward()` de la función.

3. El resultado queda guardado en el atributo `grad` de la entrada.

4. Podemos saber la función derivada de la función original con el atributo `grad_fn`.

In [54]:
# definiciones

x = torch.tensor(4., requires_grad=True)

y = 2*x

z = y**2. # (4x^2)

In [55]:
# calculo de derivada  (dz/dx = d4x^2/dx = 8x)

z.backward()

In [56]:
# valor

x.grad

tensor(32.)

Podemos hacer esto para una función completa. Veamos como:

In [58]:
x = torch.linspace(0, 10, steps=10, requires_grad=True)

y = torch.sin(2*x)

In [60]:
# funcion derivada

y.grad_fn

<SinBackward0 at 0x12fde1070>

In [61]:
y.backward(torch.ones_like(x))

In [62]:
x.grad

tensor([ 2.0000, -1.2126, -0.5295,  1.8547, -1.7196,  0.2306,  1.4400, -1.9768,
         0.9571,  0.8162])