# Introducción a PyTorch (Ejercicios)

**Curso:** CC227 - Introduction to Deep Learning

**Profesor:** Jhosimar George Arias Figueroa

*Universidad Peruana de Ciencias Aplicadas (UPC)*

-------

Este notebook contiene ejercicios prácticos acerca sobre PyTorch.


## 0. Importación de bibliotecas

Primero importe las bibliotecas de torch y numpy

In [None]:
# TODO: Importe la biblioteca numpy


# TODO: Importe la biblioteca torch


# Importamos biblioteca random y time
import random
import time

Adicionalmente controlaremos la aleatoriedad para poder reproducir los resultados. Para ello, tenemos la siguiente función:

In [None]:
def set_seed(seed=None, seed_torch=True):
  """
    Función que controla la aleatoriedad. Se deben importar módulos NumPy y 
    aleatorios.

    Args:
      - seed : entero no negativo que define el estado aleatorio. 
               El valor predeterminado es `None`.
      - seed_torch : `True` establece la semilla aleatoria para los tensores 
                     de pytorch, entonces el módulo de pytorch debe ser importado. 
                     El valor predeterminado es `True`.
  """
  if seed is None:
    seed = np.random.choice(2 ** 32)
  random.seed(seed)
  np.random.seed(seed)
  if seed_torch:
    torch.manual_seed(seed)
    torch.cuda.manual_seed_all(seed)
    torch.cuda.manual_seed(seed)
    torch.backends.cudnn.benchmark = False
    torch.backends.cudnn.deterministic = True
  
  print(f'Semilla {seed} ha sido asignada.')

In [None]:
#TODO: Asignar semilla igual a 42 para las pruebas


## 1. Creación de tensores

A continuación encontrará un código incompleto. Complete el código que falta para crear los siguientes tensores:

- $A:$ tensor de 10 por 11 formado por unos
- $B:$ tensor con elementos iguales a los elementos de una matriz numpy $Z$
- $C:$ tensor con el mismo número de elementos que $A$ pero con valores muestreados a partir de la siguiente distribución $\sim \mathcal{U}(0,1)^\dagger$
- $D:$ tensor 1D que contiene los números pares entre 4 y 40 inclusive.
<br>

$^\dagger$: $\mathcal{U(\alpha, \beta)}$ denota una [distribución uniforme](https://en.wikipedia.org/wiki/Continuous_uniform_distribution) de $\alpha$ a $\beta $, con $\alpha, \beta \in \mathbb{R}$.


In [None]:
def tensor_creation(Z):
  """
    Función que crea varios tensores.

    Args:
      - Z: arreglo de numpy
      
    Returns:
      - A: tensor de dimensión (10,11) conformado de solo unos
      - B: tensor con elementos iguales a los elementos de la matriz numpy Z
      - C: tensor con el mismo número de elementos que A pero con valores ∼U(0,1)
      - D: tensor 1D que contiene los números pares entre 4 y 40 inclusive
  """ 
  ##################################################
  ## TODO: completar las siguientes lineas de código
  ##################################################
  A = ...
  B = ...
  C = ...
  D = ...

  return A, B, C, D

Puede probar la funcionalidad llamando al metodo:

In [None]:
# Matriz de vandermonde usando numpy
Z = np.vander([1, 2, 3], 4)

A, B, C, D = tensor_creation(Z)

print("Tensor A:")
print(A)
print("Tamaño:", A.size())
print("\nTensor B:")
print(B)
print("Tamaño:", B.size())
print("\nTensor C:")
print(C)
print("Tamaño:", C.size())
print("\nTensor D:")
print(D)
print("Tamaño:", D.size())

## Operaciones tensoriales simples

Implemente la siguiente expresión que involucra operaciones de matrices:

\begin{equation}
\textbf{A} = 
\begin{bmatrix}2 &4 \\5 & 7 
\end{bmatrix} 
\begin{bmatrix} 1 &1 \\2 & 3
\end{bmatrix} 
+ 
\begin{bmatrix}10 & 10  \\ 12 & 1 
\end{bmatrix} 
\end{equation}

In [None]:
def simple_operations(a1, a2, a3):
  """
    Función para demostrar operaciones simples, i.e., multiplicación de tensor
    a1 con tensor a2 y sumarlo con el tensor a3

    Args:
      - a1: tensor de tamaño (2,2)
      - a2: tensor de tamaño (2,2)
      - a3: tensor de tamaño (2,2)

    Returns:
      - answer: tensor tamaño (2,2) resultado de a1 multiplicado con a2, 
                sumado con a3
  """
  ################################################
  ## TODO: completar el código usando los tensores
  ################################################
  answer = ...

  return answer

In [None]:
# Inicialización de tensores
a1 = torch.tensor([[2, 4], [5, 7]])
a2 = torch.tensor([[1, 1], [2, 3]])
a3 = torch.tensor([[10, 10], [12, 1]])

A = simple_operations(a1, a2, a3)
print("Tensor A:")
print(A)
print("Tamaño:", A.size())

Implemente el producto punto entre dos vectores:

\begin{equation}
b = 
\begin{bmatrix} 3 \\ 5 \\ 7
\end{bmatrix} \cdot 
\begin{bmatrix} 2 \\ 4 \\ 8
\end{bmatrix}
\end{equation}

In [None]:
def dot_product(b1, b2):
  ###############################################
  ## TODO: Completar el código usando los tensores
  ###############################################
  """
    Función para demostrar el funcionamiento del producto escalar. El producto 
    punto es una operación algebraica que toma dos secuencias de igual longitud 
    (generalmente vectores) y devuelve un solo número.

    Args:
      - b1: tensor de tamaño (3)
      - b2: tensor de tamaño (3)

    Returns:
      - product: tensor de tamaño (1) conteniendo el resultado del producto escalar
  """
  # Revisar el método torch.dot() 
  product = ...
  return product


In [None]:
# Inicialización de tensores
b1 = torch.tensor([3, 5, 7])
b2 = torch.tensor([2, 4, 8])

b = dot_product(b1, b2)

print("Tensor b:")
print(b)
print("Tamaño:", b.size())

##3. Manipulación de tensores
Usando una combinación de los métodos anteriores, complete las funciones a continuación:

**Función A**

Esta función recibe dos tensores 2D $A$ y $B$ y devuelve la suma de cada columna de A multiplicada por la suma de todos los elementos de $B$, es decir, un escalar, por ejemplo,

\begin{equation}
  \text{Si }
  A = \begin{bmatrix}
  1 & 1 \\
  2 & 3
  \end{bmatrix}
  \text{y }
  B = \begin{bmatrix}
  1 & 2 & 3 \\
  1 & 2 & 3
  \end{bmatrix}
  \text{ entonces }
  Out =  \begin{bmatrix}
  3 & 4
  \end{bmatrix} \cdot 12 = \begin{bmatrix}
  36 & 48
  \end{bmatrix}
\end{equation}

In [None]:
def functionA(A, B):
  """
    Esta función recibe dos tensores en 2D y retorna la suma por cada columna 
    de A multiplicado por la suma de todos los elementos de B

    Args:
      - A: torch.Tensor
      - A: torch.Tensor

    Returns:
      - output: tensor conteniendo el resultado
  """
  # TODO: Multiplicación de la suma de tensores
  output = ...

  return output


In [None]:
A = torch.tensor([[1, 1], [2, 3]])
B = torch.tensor([[1, 2, 3], [1, 2, 3]])

print(functionA(A, B))

**Función B**

Esta función recibe una matriz cuadrada $C$ y devuelve un tensor 2D que consta del tensor C aplanado (flattened) con el índice de cada elemento adjunto a este tensor en la primera columna, por ejemplo,

\begin{equation}
  \text{Si }
  C = \begin{bmatrix}
  2 & 3 \\
  -1 & 10
  \end{bmatrix}
  \text{ entonces }
  Out = \begin{bmatrix}
  0 & 2 \\
  1 & 3 \\
  2 & -1 \\
  3 & 10
  \end{bmatrix}
\end{equation}

**Hint:** Preste mucha atención a las dimensiones de los tensores.

In [None]:
def functionB(C):
  """
    Esta función recibe una matriz cuadrada y retorna un tensor 2D conteniendo
    el vector aplanado de C con el índice de cada elemento adjunto a este 
    tensor en la primera columna

    Args:
      - C: torch.Tensor

    Returns:
      - output: tensor concatenado/empilado
  """
  # TODO: aplanar el tensor. Revisar el método torch.flatten()
  C_flatten = ...

  # TODO: crear el tensor de indices para ser concatenado al tensor aplanado
  idx_tensor = ...
  
  # TODO: concatenar/empilar los dos tensores
  output = ...

  return output

In [None]:
C = torch.tensor([[2, 3], [-1, 10]])

print(functionB(C))

**Función C**

Esta función recibe dos tensores 2D, $D$ y $E$. Si las dimensiones lo permiten, esta función devuelve la suma elemento a elemento entre el tensor $D$ y el tensor $E$ (con el tamaño cambiado para que sea igual a $D$); de lo contrario, esta función devuelve un tensor 1D que es la concatenación de los dos tensores, por ejemplo,


\begin{equation}
  \text{Si }
  D = \begin{bmatrix}
  1 & -1 \\
  -1 & 3
  \end{bmatrix}
  \text{y } 
  E = \begin{bmatrix}
  2 & 3 & 0 & 2 \\
  \end{bmatrix}
  \text{ entonces } 
  Out = \begin{bmatrix}
  3 & 2 \\
  -1 & 5
  \end{bmatrix}
\end{equation}

<br>

\begin{equation}
  \text{Si }
  D = \begin{bmatrix}
  1 & -1 \\
  -1 & 3
  \end{bmatrix}
  \text{y }
  E = \begin{bmatrix}
  2 & 3 & 0  \\
  \end{bmatrix}
  \text{ entonces }
  Out = \begin{bmatrix}
  1 & -1 & -1 & 3  & 2 & 3 & 0  
  \end{bmatrix}
\end{equation}

<br>

**Hint:** `torch.numel()` es una manera fácil de encontrar el número de elementos en un tensor.

In [None]:
def functionC(D, E):
  """
    Esta función recibe dos tensores 2D, D y E. Si las dimensiones lo permiten,
    se retorna la suma elemento a alemento entre el tensor D y el tensor E
    (cambiado de tamaño), de otro modo la función retorna un tensor 1D que es
    la concatenación de ambos tensores

    Args:
      - D: torch.Tensor
      - E: torch.Tensor

    Returns:
      - output: torch.Tensor
  """
  # TODO: verificar si es posible cambiar el tamaño del tensor E para que sea
  #       igual al tensor D. Revisar el método torch.numel()
  if ...:
    # TODO: cambiar el tamaño de E
    E = ...
    # TODO: sumar ambos tensores
    output = ...
  else:
    # TODO: aplanar ambos vectores (flatten)
    D = ...
    E = ...
    # TODO: concatenar ambos vectores aplanados
    output = ...

  return output

In [None]:
# Caso 1
D = torch.tensor([[1, -1], [-1, 3]])
E = torch.tensor([[2,3,0,2]])

print(functionC(D, E))

In [None]:
# Caso 2
D = torch.tensor([[1, -1], [-1, 3]])
E = torch.tensor([[2,3,0]])

print(functionC(D, E))

## 4. Indexación

Complete las siguientes funciones usando indexación:

**Función D**

Dado el siguiente tensor:

\begin{equation}
  X = \begin{bmatrix}
  0 & 1 & 2 & 3 \\
  4 & 5 & 6 & 7 \\
  8 & 9 & 10 & 11 \\
  12 & 13 & 14 & 15 \\
  16 & 17 & 18 & 19 \\
  \end{bmatrix}
\end{equation}

Complete la función con el código que falta para crear los siguientes tensores:

- $A:$ tensor de tamaño (2,4) conteniendo la segunda y tercera fila del tensor $X$. Salida esperada:
\begin{equation}
 A = \begin{bmatrix}
  4 & 5 & 6 & 7 \\
  8 & 9 & 10 & 11 \\
 \end{bmatrix}
\end{equation}
- $B:$ tensor columna de tamaño (5,1) conteniendo la última columna del tensor $X$. Salida esperada:
\begin{equation}
 A = \begin{bmatrix}
  3  \\
  7  \\
  11 \\
  15 \\
  19 \\
 \end{bmatrix}
\end{equation}
- $C:$ tensor de tamaño (2,2) conteniendo elementos de la tercera y cuarta fila, asi como de la segunda y tercera columna. Salida esperada:

\begin{equation}
 C = \begin{bmatrix}
  9 & 10 \\
  13 & 14 \\
 \end{bmatrix}
\end{equation}
- $D:$ tensor copia de $X$ con las siguientes modificaciones:
\begin{equation}
 D = \begin{bmatrix}
  0 & 0 & 999 & 999 \\
  0 & 0 & 999 & 999 \\
  8 & 9 & 10 & 11 \\
  12 & 13 & 14 & 15 \\
  -999 & -999 & -999 & -1 \\
  \end{bmatrix}
\end{equation}
  Debe modificar la copia usando indexación

In [None]:
def functionD(X):
  """
    Función que crea varios tensores usando indexación sobre el tensor de entrada.

    Args:
      - X: tensor original
      
    Returns:
      - A: tensor de tamaño (2,4) conteniendo la segunda y tercera fila de X
      - B: tensor columna de tamaño (5,1) conteniendo la última columna de X
      - C: tensor de tamaño (2,2) conteniendo elementos de la tercera y cuarta 
           fila, asi como de la segunda y tercera columna.
      - D: tensor copia de X donde los elementas de la submatriz desde (0,0) 
           hasta (1,1) son iguales a 0, desde (0,2) hasta (1,3) son iguales a 999
           las tres primeras columnas de la última fila son iguales a -999 y 
           la última fila y columna es igual a -1
  """ 
  ##################################################
  ## TODO: completar las siguientes lineas de código
  ##################################################
  A = ...
  B = ...
  C = ...
  D = ...

  return A, B, C, D

In [None]:
# TODO: Crear el tensor X usando arange y view o reshape
X = ...
print("Tensor X:")
print(X)
print("\n")

A, B, C, D = functionD(X)

print("Tensor A:")
print(A)
print("Tamaño:", A.size())
print("\nTensor B:")
print(B)
print("Tamaño:", B.size())
print("\nTensor C:")
print(C)
print("Tamaño:", C.size())
print("\nTensor D:")
print(D)
print("Tamaño:", D.size())

**Función E**

Esta función permite crear un tensor $X \in R^{4 \times 4}$ lleno de ceros y la secuencia $[0, 1, 2, 3]$ a lo largo de la diagonal como lo mostrado a continuación:

\begin{equation}
  X = \begin{bmatrix}
  0 & 0 & 0 & 0 \\
  0 & 1 & 0 & 0 \\
  0 & 0 & 2 & 0 \\
  0 & 0 & 0 & 3 \\
  \end{bmatrix}
\end{equation}


In [None]:
def functionE():
  """
    Esta función retorna un tensor 2D lleno de ceros y la secuencia [0,1,2,3] en
    la diagonal

    Returns:
      - X: torch.Tensor
  """
  # TODO: Crear tensor de ceros del tipo long
  X = ...

  # TODO: Crear tensor con la secuencia [0,1,2,3], puede usar arange
  indices = ...

  # TODO: Usando indexación modificar el tensor X de tal forma que la diagonal
  #       contenga el tensor de indices
  X[..., ...] = ...

  return X

In [None]:
print(functionE())

**Función F**

Esta función recibe un tensor $X \in R^{4 \times 3}$ y cambia un elemento en cada fila:

`X[0,2] = -1`

`X[1,1] = 0`

`X[2,0] = 1`

`X[3,1] = 2`

Por lo tanto, si el tensor $X$ es:

\begin{equation}
  X = \begin{bmatrix}
  0 & 1 & 2 \\
  3 & 4 & 5 \\
  6 & 7 & 8 \\
  9 & 10 & 11 \\
  \end{bmatrix}
\end{equation}

Luego de cambiar los elementos de cada fila se obtiene:
\begin{equation}
  X = \begin{bmatrix}
  0 & 1 & -1 \\
  3 & 0 & 5 \\
  1 & 7 & 8 \\
  9 & 2 & 11 \\
  \end{bmatrix}
\end{equation}

Debe modificar los valores usando indexación

In [None]:
def functionF(X):
  """
    Esta función recibe un tensor de tamaño (4,3) y retorna el tensor
    modificando valores de las filas X[0,2] = -1, X[1,1] = 0, X[2,0] = 1
    y X[3,1] = 2

    Returns:
      - X: tensor modificado
  """
  # TODO: Crear tensor con la secuencia [0,1,2,3], puede usar arange
  indices = ...

  # TODO: Usando indexación modificar el tensor X
  X[..., ...] = ...

In [None]:
# TODO: Crear el tensor X usando arange y view o reshape
X = ...
print("Tensor X:")
print(X)
print("\n")

print("Tensor luego de cambiar valores:")
functionF(X)
print(X)

## 5. ¿Cuánto más rápidas son las GPU?

En este ejercicio medirá el tiempo de ejecuciones de algunas operaciones en CPU y GPU. A continuación se muestra la función auxiliar `timeFun(f, dim, iterations, device)` para medir el tiempo de ejecución.

In [None]:
import time

def timeFun(f, dim, iterations, device='cpu'):
  """
    Función auxiliar para calcular la cantidad de tiempo necesario por 
    instancia en CPU/GPU

    Args:
     - f: nombre de la función para la que se calcula la complejidad del tiempo 
          computacional
     - dim: número de dimensiones en la instancia en cuestión
     - iterations: número de iteraciones para la instancia en cuestión
     - device: dispositivo en el que se ejecutará el cálculo respectivo
  """
  t_total = 0
  for _ in range(iterations):
    start = time.time()
    f(dim, device)
    end = time.time()
    t_total += end - start

  if device == 'cpu':
    print(f"tiempo para {iterations} iteraciones de{f.__name__}({dim}, {device}): {t_total:.5f}")
  else:
    print(f"tiempo para {iterations} iteraciones de {f.__name__}({dim}, {device}): {t_total:.5f}")

### Función simple

A continuación se muestra una función simple `simpleFun`. Completar esta función de manera que realice las operaciones:

- Multiplicación por elementos
- Multiplicación de matrices

Las operaciones deberían poder realizarse en la CPU o GPU especificada por el parámetro `device`. Usaremos la función auxiliar `timeFun(f, dim, iterations, device)` para medir el tiempo de ejecución.

In [None]:
dim = 10000
iterations = 1

In [None]:
def simpleFun(dim, device):
  """
    Función para verificar la compatibilidad del dispositivo con los cálculos

    Args:
      - dim: entero representando las dimensiones
      - device: "cpu" or "cuda"
  """
  # TODO: tensor 2D conteniendo números aleatorios uniformes en [0,1)
  #       el tamaño del tensor es (dim, dim)
  #       No olvidarse de especificar el dispositivo donde se realizarán las
  #       operaciones, recordar método .to()
  x = ...

  # TODO: tensor 2D conteniendo números aleatorios uniformes en [0,1)
  #       el tamaño del tensor es (dim, dim)
  #       No olvidarse de especificar el dispositivo donde se realizarán las
  #       operaciones, recordar método .to()  
  y = ...

  # TODO: tensor 2D conteniendo el valor escalar 2
  #       el tamaño del tensor es (dim, dim)
  #       No olvidarse de especificar el dispositivo donde se realizarán las
  #       operaciones, recordar método .to()  
  z = ...

  # TODO: realizar la multiplicación elemento a elemento de x e y
  a = ...

  # TODO: realizar la multiplicación de matrices entre x y z
  b = ...

  del x
  del y
  del z
  del a
  del b


Especificar el dispositivo en el que se realizarán las operaciones, verificar si cuda está disponible:

In [None]:
device = ...

Probaremos el tiempo de ejecución del método implementado

In [None]:
timeFun(f=simpleFun, dim=dim, iterations=iterations)
timeFun(f=simpleFun, dim=dim, iterations=iterations, device=device)

**Referencia**

1. [Neuromatch Academy: Deep Learning](https://deeplearning.neuromatch.io/tutorials/intro.html)