# Tensor Operations

Algunas de las operaciones de tensores que podemos realizar son:

1. Suma y resta
2. Multiplicación por elemento
3. División
4. Multiplicación de matrices

Las redes neuronales utiliza estas operaciones para aprender de los datos

In [2]:
import torch

## Operaciones con Escalares

Las operaciones de un tensor con un escalar se realiza de la misma forma que tipos de datos primitivos:

In [3]:
tn = torch.tensor([1, 2, 3])
tn + 100

tensor([101, 102, 103])

In [4]:
tn - 10

tensor([-9, -8, -7])

In [5]:
tn * 5

tensor([ 5, 10, 15])

In [6]:
tn / 2

tensor([0.5000, 1.0000, 1.5000])

## Producto Hadamard

El producto Hadamard (también conocido como: producto elemento a elemento, componente a componente o punto a punto) es una operacion matricial para **matrices de las mismas dimensiones**, donde se multiplican los elementos de las mismas posiciones en cada matriz.

Sea A  = [2, 3, 4] y B = [5, 6 ,7] el producto Hadamard será de la siguiente forma:

[2x5, 3x6, 4x7] = [10, 18, 28]

Para calcular el producto Hadamard de 2 tensores A y B se utiliza: `A * B`

In [20]:
a_tn = torch.tensor([2, 3, 4])
b_tn = torch.tensor([5, 6, 7])

a_tn * b_tn

tensor([10, 18, 28])

In [21]:
c_tn = torch.tensor([[1, 2],
                     [3, 4]])

d_tn = torch.tensor([[5, 6], 
                     [7, 8]])

c_tn * d_tn

tensor([[ 5, 12],
        [21, 32]])

## Producto Punto (Escalar)

Para el producto escalar o producto punto se utiliza el método `torch.matmul()`

Para ser válido el producto escalar, los tensores tienen que ser de la forma:

A [=] m x n

B [=] n x p

De modo que el resultado será un tensor C [=] m x p

In [22]:
torch.matmul(a_tn, b_tn)

tensor(56)

In [23]:
torch.matmul(c_tn, d_tn)

tensor([[19, 22],
        [43, 50]])

También se puede usar la notación `A @ B`

In [25]:
a_tn @ b_tn

tensor(56)

In [26]:
c_tn @ d_tn

tensor([[19, 22],
        [43, 50]])

Si existe un método dentro de la librería para realizar una operación es recomendable usarlo en lugar de realizarlo a mano.

Debido a que, en la mayoría de los casos, estos métodos ya están optimizados por lo que serán más eficientes

Comparativa de eficiencia:

In [16]:
%%time
value = 0
for i in range(len(a_tn)):
    value += a_tn[i] * b_tn[i]
value

CPU times: user 2.35 ms, sys: 318 μs, total: 2.67 ms
Wall time: 1.51 ms


tensor(56)

In [17]:
%%time
torch.matmul(a_tn, b_tn)

CPU times: user 449 μs, sys: 0 ns, total: 449 μs
Wall time: 390 μs


tensor(56)

In [18]:
%%time
a_tn @ b_tn

CPU times: user 332 μs, sys: 19 μs, total: 351 μs
Wall time: 293 μs


tensor(56)

Evidentemente, es mucho más eficiente el método implementado en la librería de PyTorch. 

Al incrementar la cantidad de datos, esta diferencia incrementará de forma muy notable

No obstante, a pesar de que la notación para el producto escalar `@` no es tan legible o común, muestra una mayor eficiencia. Pero no la suficiente para sacrificar la legibilidad del código

Otra forma de realizar la operación es con el método `torch.mm()`

In [28]:
torch.mm(a_tn, b_tn)

RuntimeError: self must be a matrix

Sin embargo, este método no se puede realizar sobre vectores, debe tener por lo menos las dimensiones de una matriz para ser válido

In [27]:
torch.mm(c_tn, d_tn)

tensor([[19, 22],
        [43, 50]])

## Transpuesta

Para realizar la operación transpuesta sobre un tensor, podemos usar `.T` sobre nuestro tensor

Por ejemplo:

In [32]:
a_tn = torch.rand(2, 3)
a_tn

tensor([[0.0176, 0.7765, 0.6552],
        [0.5363, 0.1773, 0.7082]])

In [39]:
b_tn = torch.rand(2, 3)
b_tn

tensor([[0.3825, 0.2825, 0.9703],
        [0.7448, 0.3523, 0.9075]])

In [36]:
torch.matmul(a_tn, b_tn)

RuntimeError: mat1 and mat2 shapes cannot be multiplied (2x3 and 2x3)

Debido a que no se cumplen las dimensiones válidas para el producto punto, podemos arreglarlo usando la transpuesta de alguno de los tensores

In [40]:
b_tn.T

tensor([[0.3825, 0.7448],
        [0.2825, 0.3523],
        [0.9703, 0.9075]])

In [41]:
b_tn.shape, b_tn.T.shape

(torch.Size([2, 3]), torch.Size([3, 2]))

In [42]:
torch.matmul(a_tn, b_tn.T)

tensor([[0.8619, 0.8813],
        [0.9424, 1.1046]])

In [43]:
torch.matmul(a_tn, b_tn.T).shape

torch.Size([2, 2])

## Mínimo de un Tensor:

Para un tensor A, podemos utilizar `torch.min(A)` o `A.min()`

In [67]:
tn = torch.arange(10, 101, 10)
tn

tensor([ 10,  20,  30,  40,  50,  60,  70,  80,  90, 100])

In [68]:
torch.min(tn)

tensor(10)

In [69]:
tn.min()

tensor(10)

## Máximo de un Tensor:

Para un tensor A, podemos utilizar `torch.max(A)` o `A.max()`

In [70]:
torch.max(tn)

tensor(100)

In [71]:
tn.max()

tensor(100)

## Promedio de un Tensor:

Para calcular el promedio de los elementos de nuestro tensor A, podemos utilizar `torch.mean(A)` o `A.mean()`

Sin embargo, es necesario que el tipo de dato de nuestro tensor sea `float` o un dtype complejo

Revisar la documentación: https://pytorch.org/docs/stable/generated/torch.mean.html

In [72]:
torch.mean(tn)

RuntimeError: mean(): could not infer output dtype. Input dtype must be either a floating point or complex dtype. Got: Long

In [73]:
tn.dtype

torch.int64

Podemos cambiar el tipo de datos de un tensor A con el método `A.type()` y como parámetro pasar el tipo de dato deseado, en este caso `torch.float32`

In [74]:
torch.mean(tn.type(torch.float32))

tensor(55.)

In [75]:
tn.type(torch.float32).mean()

tensor(55.)

## Suma de los Elementos de un Tensor:

Para un tensor A, podemos usar `torch.sum(A)` o `A.sum()`

In [76]:
torch.sum(tn)

tensor(550)

In [77]:
tn.sum()

tensor(550)

## Posición del Mínimo y Máximo en un Tensor

Para encontrar la posición del mínimo en el tensor A utilizamos: `A.argmin()`

In [78]:
tn.argmin()

tensor(0)

In [79]:
tn[0]

tensor(10)

Para el máximo se usa: `A.argmax()`

In [80]:
tn.argmax()

tensor(9)

In [81]:
tn[9]

tensor(100)