<a href="https://colab.research.google.com/github/milioe/Deep-Learning-TF/blob/main/1_Introducci%C3%B3n_a_los_tensores.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Deep Learning: Redes Neuronales Artificiales con TensorFlow



# Introducción a los tensores
## Índice:
1. Creación de tensores
2. Atributos de tensores
3. Manipulación de tensores
4. Tensores y NumPy
5. `@tf.function`
6. Uso de GPU con TensorFlow
7. Ejercicios

## Creación de tensores

Lo primero que tendremos que hacer, es importar la librería de TensorFlow y revisar qué versión tenemos. Google Colab ya lo tiene resuelto para nosotros, incluso con las últimas versiones de cada librería.

🔑 **Nota**: La versión de TF 1.x y 2.x son totalmente diferentes.


In [1]:
import tensorflow as tf
print(tf.__version__) # conocer la versión

2.8.2


Si alguna vez has usado la librería de NumPy, debes de saber que los tensores son tipos de arrays de NumPy.

Como se ha visto en las diapositivas, los tensores se pueden entender como representaciones numéricas multidimensionales (o *n-dimensional* en inglés).

Algunos ejemplos de lo que podemos representar como tensores son:
* Precios de casas
* Pixeles de una imagen
* Texto
* Otros tipos de datos

La **principal** diferencia entre **tensores** de TensorFlow y **arrays** de NumPy es que los tensores pueden ser usados con GPUs (Graphical Processing Units) y TPUs (Tensors Processing Units), lo que significa que tendremos mayor velocidad de computación.

## Creación de tensores con `tf.constant`

El método `.constant()` es un modulo construido para convertir cualquier dato numérico en tensores y de esta forma, alimentar a nuestra red neuronal. 

In [2]:
# Crear un scalar
scalar = tf.constant(7)
scalar

<tf.Tensor: shape=(), dtype=int32, numpy=7>

Un escalar es un tensor con rank 0, dado que no tiene dimensiones (es sólo un número).

In [3]:
# Revisar el numero de dimensiones con .ndim
scalar.ndim

0

In [4]:
# Crear un vector (más de 0 dimensiones)
vector = tf.constant([10,10])
vector

<tf.Tensor: shape=(2,), dtype=int32, numpy=array([10, 10], dtype=int32)>

In [5]:
# Revisar el numero de dimensiones
vector.ndim

1

Observa cómo, a diferencia de un *scalar*, debemos de poner los valores de un vector entre corchetes, ya que de lo contrario, TF tomará el segundo `10` como un argumento, más no como un valor. Inténtalo en la siguiente celda.

In [6]:
vector_2 = tf.constant(10, 10)
vector_2

TypeError: ignored

Esto se debe a que la [documentación](https://www.tensorflow.org/api_docs/python/tf/constant?authuser=1) de TF en cuanto a `tf.constant()` nos dice que:

```
tf.constant(
    value, dtype=None, shape=None, name='Const'
)
```

por lo que el segundo `10` lo toma como un `dtype`

In [7]:
# Crear una matriz (más de 1 dimensión)
matrix = tf.constant([[10, 7],
                      [7, 10]])
matrix

<tf.Tensor: shape=(2, 2), dtype=int32, numpy=
array([[10,  7],
       [ 7, 10]], dtype=int32)>

In [8]:
matrix.ndim

2

Observa que ahora tenemos un `shape` distinto a los dos anteriores objetos.

* Scalar -> `shape()`
* Vector -> `shape(2,)`
* Matrix -> `shape(2,2)`

🔑 **Nota:** Por lo tanto, podemos saber que el primer dos (de izquierda a derecha) hace referencia al numero de **filas**, mientras que el segundo al número de **columnas**.

Además, tenemos un `dtype=int32` indicando el tipo de dato (entero de 32 bits) del cual se compone el tensor. Eso lo podemos cambiar como se muestra en la siguiente celda:



In [9]:
# Define el tipo de 
matrix_b = tf.constant([
                        [10., 7.],
                        [3., 2.],
                        [8., 9.]
                        ], dtype=tf.float16)

matrix_b

<tf.Tensor: shape=(3, 2), dtype=float16, numpy=
array([[10.,  7.],
       [ 3.,  2.],
       [ 8.,  9.]], dtype=float16)>

In [10]:
matrix_b.ndim

2

Observa cómo debemos de incluir varios `[]` cada que aumentamos de dimensión. 

🧠 **Recuerda:** un tensor de dimensión 0 es un escalar, de dimension 1 es un vector y de dimensión 2 es una matriz. Por eso llamábamos a un tensor un arreglo de *n-dimensiones*.

In [11]:
# Crear un tensor (más de dos dimensiones, por el momento)
tensor = tf.constant([[[1,2,3],
                       [4,5,6]],
                      [[7,8,9],
                       [10,11,12]],
                      [[13,14,15],
                       [16,17,18]]])
tensor

<tf.Tensor: shape=(3, 2, 3), dtype=int32, numpy=
array([[[ 1,  2,  3],
        [ 4,  5,  6]],

       [[ 7,  8,  9],
        [10, 11, 12]],

       [[13, 14, 15],
        [16, 17, 18]]], dtype=int32)>

In [12]:
# Revisa la dimension del tensor
tensor.ndim

3

El tensor anterior tiene 3 dimensiones con un `shape` de `(3,2,3)`, es decir, de izquierda a derecha son `3` grupos, con `2 filas` cada uno, y `3` columnas.

Observa el siguiente tensor para tener mayor claridad:

In [13]:
# Crear un nuevo tensor con un shape diferente
tensor_b = tf.constant([
                        [
                         [1, 2, 3, 4],
                         [5, 6, 7, 8]
                         ],
                      [
                       [9, 10, 11, 12],
                       [13, 14, 15, 16]
                       ],
                      [
                       [17, 18, 19, 20],
                       [21, 22, 23, 24]
                       ]
                        ])
tensor_b

<tf.Tensor: shape=(3, 2, 4), dtype=int32, numpy=
array([[[ 1,  2,  3,  4],
        [ 5,  6,  7,  8]],

       [[ 9, 10, 11, 12],
        [13, 14, 15, 16]],

       [[17, 18, 19, 20],
        [21, 22, 23, 24]]], dtype=int32)>

Nuevamente, podemos leer el shape como:
`3` grupos, `2` filas en cada grupo, con `3` columnas.

Ahora bien, observa qué pasa si copiamos la misma estructura de `tensor_b` y añadimos un 17 en el grupo dos, fila dos


In [14]:
# Lo siguiente marcará error
tensor_c = tf.constant([
                        [
                         [1, 2, 3, 4],
                         [5, 6, 7, 8]
                         ],
                      [
                       [9, 10, 11, 12],
                       [13, 14, 15, 16, 17]
                       ],
                      [
                       [18, 19, 20, 21],
                       [22, 23, 24, 25]
                       ]
                        ])
tensor_c

ValueError: ignored

Ocurre un `ValueError`, dado que TensorFlow reconoce al tensor como un arreglo no rectangular, es decir, debe de empatar el número de columnas y filas en todo el tensor.

Ahora bien, si quisieramos conocer la cantidad de elementos en un tensor, basta con aplicar un `tf.size()` (si aplicamos un `len()` nos devolverá el número de dimensiones).

In [15]:
# Numero de elementos en un tensor
tf.size(tensor)

<tf.Tensor: shape=(), dtype=int32, numpy=18>

In [16]:
# Imprimir únicamente el número
tf.size(tensor).numpy()

18

Peron observemos algo intereante, si multiplicamos los elementos en el shape de un tensor, obtenemos la cantididad $n$ de elementos en el mismo

In [17]:
# Conocer el shape de un tensor
tensor.shape

TensorShape([3, 2, 3])

In [18]:
3*2*3

18

In [19]:
3*2*3 == tf.size(tensor).numpy()

True

La aplicación más usual de un tensor, es cuando tenemos una imagen, de `224 x 224` pixeles con tres colores `RGB` (Red, Green, Blue) el cual podemos representar con un shape de `(224,224,3)`. 

Sabiendo eso, tendriamos `150528` pixeles en cada imagen.

# Creando tensores con `tf.Variable()`

Similar a los objetos mutables e inmutables de Python (listas y tuplas, por ejemplo) tenemos un método previamente construido llamado `tf.Variable()`.

La diferente entre `tf.Variable` y `tf.constant()` es que los últimos son inmutables (no pueden ser cambiados una vez dedclarados) mientras que aquellos con `tf.Variable()` sí pueden ser modificados.

In [20]:
# Crear el mismo tensor con tf.Variable() y tf.constant()
variable_tensor = tf.Variable([10, 7])
constant_tensor = tf.constant([10, 7])

In [21]:
# Imprime el tensor mutable
variable_tensor

<tf.Variable 'Variable:0' shape=(2,) dtype=int32, numpy=array([10,  7], dtype=int32)>

In [22]:
# Imprime el tensor inmutable
constant_tensor

<tf.Tensor: shape=(2,), dtype=int32, numpy=array([10,  7], dtype=int32)>

In [23]:
# La primer posición del tensor mutable
variable_tensor[0]

<tf.Tensor: shape=(), dtype=int32, numpy=10>

In [24]:
# Cambia esa primer posición por un 7
variable_tensor[0].assign(7)
variable_tensor

<tf.Variable 'Variable:0' shape=(2,) dtype=int32, numpy=array([7, 7], dtype=int32)>

Observa que no podemos asginar elementos como si fueran una lista. Ejemplo:

``` 
x = [1,2,3,4]
x [0] = 0
```
esto eventualmente imprimiría `x = [0,2,3,4]`.

Si nosotros hacemos lo mismo con un tensor, produciría un error, por lo que tenemos que ocupar el método `assign()`

In [25]:
# Ahora intenta cambiar un valor del tensor inmutable
constant_tensor[0].assign(7)
constant_tensor

AttributeError: ignored

Por lo tanto, ¿Cuál deberia de usar? ¿`tf.constant()` o `tf.Variable`?

Depende del problema a tratar, aunque la mayoría de las veces TensorFlow lo hará por nosotros de forma automática

## Creando tensores aleatorios

Los tensores aleatorios son arreglos con tamaños arbitrarios que contienen número aleatorios. ¿Por qué usar numeros aleatorios? Esto se debe a que para inicializar los pesos (*weights*) de una red neuronal, tendremos que partir de números aleatorios que durante el entrenamiento se irán ajustando. 

Podrías pensar en que los números aleatorios como ruido o como estática que poco a poco se convierte en una imagen. 

In [26]:
# Crear dos tensores aleatorios
random_1 = tf.random.Generator.from_seed(42)
random_1 = random_1.normal(shape=(3,2))
random_1

<tf.Tensor: shape=(3, 2), dtype=float32, numpy=
array([[-0.7565803 , -0.06854702],
       [ 0.07595026, -1.2573844 ],
       [-0.23193763, -1.8107855 ]], dtype=float32)>

In [27]:
# Crear dos tensores aleatorios
random_2 = tf.random.Generator.from_seed(42)
random_2 = random_2.normal(shape=(3,2))
random_2

<tf.Tensor: shape=(3, 2), dtype=float32, numpy=
array([[-0.7565803 , -0.06854702],
       [ 0.07595026, -1.2573844 ],
       [-0.23193763, -1.8107855 ]], dtype=float32)>

Observa como creamos dos tensores aleatorios que contienen los mismos números. Esto se debe a que pusimos una semilla aleatoria. En computación, es imposible generar números aleatorios, ya que sólo los proveen la naturaleza. Es por ello que a este tipo de aleatoriedad en los tensores se le conoce como **pseudoaleatorio** o **pseudorandom**.

La semilla que acabamos de colocar sirve para poder replicar los mismos tensores aquí y en cualquier parte y momento. Eso no significa que los números no sean aleatorios, pues se comportan como una distribución normal, sólo que son reproducibles. Ellos nos ayudará a poder replicar con exactitud las mismas arquitecturas entre todos, o por ejemplo, a hacer las mismas particiones aleatorias.

In [28]:
random_1 == random_2

<tf.Tensor: shape=(3, 2), dtype=bool, numpy=
array([[ True,  True],
       [ True,  True],
       [ True,  True]])>

In [29]:
# Crear dos tensores aleatorios diferentes
random_3 = tf.random.Generator.from_seed(42)
random_3 = random_3.normal(shape=(3, 2))
random_3

<tf.Tensor: shape=(3, 2), dtype=float32, numpy=
array([[-0.7565803 , -0.06854702],
       [ 0.07595026, -1.2573844 ],
       [-0.23193763, -1.8107855 ]], dtype=float32)>

In [30]:
random_4 = tf.random.Generator.from_seed(11)
random_4 = random_4.normal(shape=(3, 2))
random_4

<tf.Tensor: shape=(3, 2), dtype=float32, numpy=
array([[ 0.27305737, -0.29925638],
       [-0.3652325 ,  0.61883307],
       [-1.0130816 ,  0.28291714]], dtype=float32)>

In [31]:
# El tensor 1 y 3 son identicos dada su semilla de 42
random_1 == random_3

<tf.Tensor: shape=(3, 2), dtype=bool, numpy=
array([[ True,  True],
       [ True,  True],
       [ True,  True]])>

In [32]:
# Mientras que el tensor 3 y 4 no, ya que tienen 42 y 11 como semilla respectivamente
random_3 == random_4

<tf.Tensor: shape=(3, 2), dtype=bool, numpy=
array([[False, False],
       [False, False],
       [False, False]])>

## Barajeo de tensores 

El barajeo o *shuffle*, será una de las pocas pero esenciales transformaciones que se deben de hacer en los datos. Imagina que queremos entrenar una red neuronal para que logre predecir si la foto que metemos es de un perro o un gato. Si tenemos 10,000 imágenes, y las primeras 5,000 son de gato y el resto de perro, la red neuronal se sesgará y le dará más peso a las de gato, ya que fueron esas con las que se entrenó incialmente. 

Por eso es importante barajear nuetro dataset antes de pasarlo como input de una red neuronal.


Ejectua la siguiente celda cuantas veces necesites para observar cómo cambia.

In [33]:
# Crear un tensor que quieras barajear
not_shuffled = tf.constant([[10,7],
                            [3,4],
                            [2,5]])

tf.random.shuffle(not_shuffled)

<tf.Tensor: shape=(3, 2), dtype=int32, numpy=
array([[10,  7],
       [ 2,  5],
       [ 3,  4]], dtype=int32)>

Ahora bien, ejecuta la siguiente celda que contiene un `seed=42`. Cambiará, pero lo hará en el mismo orden.

In [34]:
# Barajeo en el mismo orden 
tf.random.shuffle(not_shuffled, seed=42)

<tf.Tensor: shape=(3, 2), dtype=int32, numpy=
array([[ 2,  5],
       [ 3,  4],
       [10,  7]], dtype=int32)>

La razón de que los números cambien a pesar de que ponemos un `seed` es dada la regla #4 de la documentación de [`tf.random.set_seed()`](https://www.tensorflow.org/api_docs/python/tf/random/set_seed)

> 4. If both the global and the operation seed are set: Both seeds are used in conjunction to determine the random sequence.

`tf.random.set_seed(42)` establece la semilla global y el parámetro `seed` en `tf.random.shuffle(seed=42)` establece la semilla de operación.




In [35]:
# Barajear en el mismo orden

# Establece la semilla global
tf.random.set_seed(42)

# Establece la semilla de operación
tf.random.shuffle(not_shuffled, seed=42)

<tf.Tensor: shape=(3, 2), dtype=int32, numpy=
array([[10,  7],
       [ 3,  4],
       [ 2,  5]], dtype=int32)>

Observa cómo no cambia los valores del tensor

In [36]:
# Establece semilla
tf.random.set_seed(42) # Intenta correr la celda comentando esta linea

# Establece la semilla de operación
tf.random.shuffle(not_shuffled)

<tf.Tensor: shape=(3, 2), dtype=int32, numpy=
array([[ 3,  4],
       [ 2,  5],
       [10,  7]], dtype=int32)>

## Tensores de unos y ceros

In [37]:
# Crear un tensor de unos
tf.ones(shape=(3,2))

<tf.Tensor: shape=(3, 2), dtype=float32, numpy=
array([[1., 1.],
       [1., 1.],
       [1., 1.]], dtype=float32)>

In [38]:
# Cambia el shape
tf.ones(shape=(5,6,3))

<tf.Tensor: shape=(5, 6, 3), dtype=float32, numpy=
array([[[1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.]],

       [[1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.]],

       [[1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.]],

       [[1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.]],

       [[1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.]]], dtype=float32)>

In [39]:
# Crea tensor de ceros
tf.zeros(shape=(4, 5))

<tf.Tensor: shape=(4, 5), dtype=float32, numpy=
array([[0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.]], dtype=float32)>

## NumPy y TensorFlow

También puede convertir arreglos de NumPy en tensores.

Recuerda que la principal diferencia es que los tensores pueden ser utilizados con un GPUs

🔑 **Nota:** una matriz o un tensor son usualmente representados por letras mayúsculas: `X` o `A`; mientras que los vectores son representados por letras minúsculas `y` o `b`

In [40]:
import numpy as np
numpy_A = np.arange(1, 25, dtype=np.int32)
numpy_A

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17,
       18, 19, 20, 21, 22, 23, 24], dtype=int32)

In [41]:
# Conviertelo en un tensor
A = tf.constant(numpy_A, shape=[2,4,3])
A

<tf.Tensor: shape=(2, 4, 3), dtype=int32, numpy=
array([[[ 1,  2,  3],
        [ 4,  5,  6],
        [ 7,  8,  9],
        [10, 11, 12]],

       [[13, 14, 15],
        [16, 17, 18],
        [19, 20, 21],
        [22, 23, 24]]], dtype=int32)>

Recuerda que el size debe de empatar con el shape, intenta correr la siguiente celda

In [42]:
B = tf.constant(numpy_A, shape=[2,4,5])
B

TypeError: ignored

El error es bastante implícito, tratamos de meter en un tensor de `40` elementos un arreglo de `24`.

## Obtener información de tensored (shape, rank, size)


* **Shape**: La longitud (número de elementos) de cada dimensión en un tensor
* **Rank**: El número de dimensiones del tensor. Un escalar tiene rank 0, un vector tiene rank 1, una matriz tiene rank 2 y un tensor tiene rank *n*.
* **Axis** O **dimension**: una dimensión particular del tensor
* **Size**: El número total de elementos en el tensor


Además, tenemos algunos atributos adicionales, como `ndim`.




In [43]:
# Crear un tensor con rank 4
rank_4_tensor = tf.zeros([2,3,4,5])
rank_4_tensor

<tf.Tensor: shape=(2, 3, 4, 5), dtype=float32, numpy=
array([[[[0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0.]],

        [[0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0.]],

        [[0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0.]]],


       [[[0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0.]],

        [[0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0.]],

        [[0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0.],
         [0., 0., 0., 0., 0.]]]], dtype=float32)>

In [44]:
# Get various attributes of tensor
print(f"Datatype de cada elemento: {rank_4_tensor.dtype}")
print(f"Número de dimensiones (rank): {rank_4_tensor.ndim}")
print(f"Shape del tensor: {rank_4_tensor.shape}")
print(f"Número total de elementos (2*3*4*5): {tf.size(rank_4_tensor).numpy()}") # .numpy() converts to NumPy array

Datatype de cada elemento: <dtype: 'float32'>
Número de dimensiones (rank): 4
Shape del tensor: (2, 3, 4, 5)
Número total de elementos (2*3*4*5): 120


## Indexing

In [45]:
# Crear un arreglo de números aleatorios con size=(5,5)
nump_E = np.arange(1, 61)
nump_E

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17,
       18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34,
       35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51,
       52, 53, 54, 55, 56, 57, 58, 59, 60])

In [46]:
E = tf.constant(nump_E, shape=(3,4,5))
E

<tf.Tensor: shape=(3, 4, 5), dtype=int64, numpy=
array([[[ 1,  2,  3,  4,  5],
        [ 6,  7,  8,  9, 10],
        [11, 12, 13, 14, 15],
        [16, 17, 18, 19, 20]],

       [[21, 22, 23, 24, 25],
        [26, 27, 28, 29, 30],
        [31, 32, 33, 34, 35],
        [36, 37, 38, 39, 40]],

       [[41, 42, 43, 44, 45],
        [46, 47, 48, 49, 50],
        [51, 52, 53, 54, 55],
        [56, 57, 58, 59, 60]]])>

Recuerda que para obtener un número, debemos de declarar el índice. Toda indexación comienza en `0`, y para obtener el último elemento se utiliza el `-1`

El shape del tensor `E` se puede leer como `3` grandes grupos, `4` filas cada uno y `5` columnas

In [47]:
# Obtener los primeros dos grupos completos
E[:2]

<tf.Tensor: shape=(2, 4, 5), dtype=int64, numpy=
array([[[ 1,  2,  3,  4,  5],
        [ 6,  7,  8,  9, 10],
        [11, 12, 13, 14, 15],
        [16, 17, 18, 19, 20]],

       [[21, 22, 23, 24, 25],
        [26, 27, 28, 29, 30],
        [31, 32, 33, 34, 35],
        [36, 37, 38, 39, 40]]])>

In [48]:
# Ahora obtener las primeras dos filas 
E[:2, :2]

<tf.Tensor: shape=(2, 2, 5), dtype=int64, numpy=
array([[[ 1,  2,  3,  4,  5],
        [ 6,  7,  8,  9, 10]],

       [[21, 22, 23, 24, 25],
        [26, 27, 28, 29, 30]]])>

In [49]:
# Obtenemos las primeras dos columnas
E[:2, :2, :2]

<tf.Tensor: shape=(2, 2, 2), dtype=int64, numpy=
array([[[ 1,  2],
        [ 6,  7]],

       [[21, 22],
        [26, 27]]])>

In [50]:
# La siguiente celda dará un error
E[:2, :2, :2, :2]

InvalidArgumentError: ignored

Esto se debe a que sólo tenemos 3 números en el shape, por lo que solo podemos indexar 3 veces. 

Por lo tanto el primer índice es de **grupos**, el segundo es de **filas** y el tercero es de **columnas**.

Observa los siguientes ejemplos:

In [51]:
E

<tf.Tensor: shape=(3, 4, 5), dtype=int64, numpy=
array([[[ 1,  2,  3,  4,  5],
        [ 6,  7,  8,  9, 10],
        [11, 12, 13, 14, 15],
        [16, 17, 18, 19, 20]],

       [[21, 22, 23, 24, 25],
        [26, 27, 28, 29, 30],
        [31, 32, 33, 34, 35],
        [36, 37, 38, 39, 40]],

       [[41, 42, 43, 44, 45],
        [46, 47, 48, 49, 50],
        [51, 52, 53, 54, 55],
        [56, 57, 58, 59, 60]]])>

✏️ **Ejercicio:** Intenta imprimir el número 50

In [52]:
# El 50 está en el grupo 3, pero como comenzamos en 0, lo declaramos como 2
E[2]

<tf.Tensor: shape=(4, 5), dtype=int64, numpy=
array([[41, 42, 43, 44, 45],
       [46, 47, 48, 49, 50],
       [51, 52, 53, 54, 55],
       [56, 57, 58, 59, 60]])>

In [53]:
# Se encuentra en la fila 2, la cual declaramos como 1
E[2, 1]

<tf.Tensor: shape=(5,), dtype=int64, numpy=array([46, 47, 48, 49, 50])>

In [54]:
# Finalmente, está en la última columna, la cual podemos declarar como -1
E[2,1,-1]

<tf.Tensor: shape=(), dtype=int64, numpy=50>

Además, podemos traer más de un número, por ejemplo, por fila:

In [55]:
# Obtener el último elemento de cada fila
E[:, :, -1]

<tf.Tensor: shape=(3, 4), dtype=int64, numpy=
array([[ 5, 10, 15, 20],
       [25, 30, 35, 40],
       [45, 50, 55, 60]])>

En la mayoría de las ocasiones tendremos que adecuar los tensores para poder tener dimensiones extras, pero sin modificar los valores que en él existen; similar a si metieramos dimensones sintéticas.

El hecho de aumentar dimensiones o quitar, será recurrente, ya que no sólo será una cuestión técnica, sino de la teoría de las redes neuronales

In [56]:
# Crear un tensor de rank 2 (2 dimensiones)
rank_2_tensor = tf.constant([[10,7],
                             [3,4]])

rank_2_tensor

<tf.Tensor: shape=(2, 2), dtype=int32, numpy=
array([[10,  7],
       [ 3,  4]], dtype=int32)>

In [57]:
# Añadir una dimensión extra al tensor de rank 2 con ...
rank_3_tensor = rank_2_tensor[..., tf.newaxis] # en python ... signfiica "todas las dimensiones previas"
rank_3_tensor

<tf.Tensor: shape=(2, 2, 1), dtype=int32, numpy=
array([[[10],
        [ 7]],

       [[ 3],
        [ 4]]], dtype=int32)>

Observa cómo añadimos una dimensión como columna en el `shape` sin afectar a nuestros valores.

Ahora bien, también podemos utilizar `tf.expand_dims()` para aumentar dimensiones

In [58]:
tf.expand_dims(rank_2_tensor, axis=-1) # "-1" significa el último eje

<tf.Tensor: shape=(2, 2, 1), dtype=int32, numpy=
array([[[10],
        [ 7]],

       [[ 3],
        [ 4]]], dtype=int32)>

# Manipulación de tensores (operaciones)

Ahora que sabemos cómo crear tensores, comenzaremos a modificarlos a través de operaciones y técnicas que nos serán útiles cuando hagamos nuestras redes neuronales

## Operaciones básicas

Podemos realizar operaciones tales como `+`, `-` o `*`


In [59]:
# Podemos añadir valores a los tensores
tensor = tf.constant([[10, 7], [3,4]])
tensor + 10

<tf.Tensor: shape=(2, 2), dtype=int32, numpy=
array([[20, 17],
       [13, 14]], dtype=int32)>

In [60]:
# Igualmente multiplicar
tensor * 10

<tf.Tensor: shape=(2, 2), dtype=int32, numpy=
array([[100,  70],
       [ 30,  40]], dtype=int32)>

In [61]:
# Así como resta
tensor - 10

<tf.Tensor: shape=(2, 2), dtype=int32, numpy=
array([[ 0, -3],
       [-7, -6]], dtype=int32)>

Además, podemos utilizar funciones de TensorFlow integradas, las cuales tienen una ventaja dado que logran una computación más rápida. Por ejemplo, podemos multiplicar cada uno de los valores por `10`

In [62]:
# Usa multiply como equivalente de '*'
tf.multiply(tensor, 10)

<tf.Tensor: shape=(2, 2), dtype=int32, numpy=
array([[100,  70],
       [ 30,  40]], dtype=int32)>

In [63]:
# Tensor original
tensor

<tf.Tensor: shape=(2, 2), dtype=int32, numpy=
array([[10,  7],
       [ 3,  4]], dtype=int32)>

Observa cómo cada valor es multiplicado por diez, lo cual es diferente a una multiplicación de matriz por escalar.

## Multiplicación de matrices

Siendo una de las operaciones más comunes en Machine Learning, la multiplicación de matrices se puede llevar a cabo de dos formas

* De forma nativa a python con operador `@`
* Con la función integrada de TF `tf.matmul()`

Existen dos reglas indispensables en la multiplicación de matrices:

1. Las dimensiones internas deben de ser iguales:
  * `(4,5) @ (5, 4)`

2. La matríz resultante tiene `shape` de las dimensiones exteriores
  * `(4,5) @ (5,4)` -> `(4,4)`

In [65]:
# Recuerda el tensor previo
tensor

<tf.Tensor: shape=(2, 2), dtype=int32, numpy=
array([[10,  7],
       [ 3,  4]], dtype=int32)>

In [66]:
# Multiplicación de matrices con @
tensor @ tensor

<tf.Tensor: shape=(2, 2), dtype=int32, numpy=
array([[121,  98],
       [ 42,  37]], dtype=int32)>

In [67]:
# Multiplicación de matrices en TensorFlow
tf.matmul(tensor, tensor)

<tf.Tensor: shape=(2, 2), dtype=int32, numpy=
array([[121,  98],
       [ 42,  37]], dtype=int32)>

Ambas multiplicaciones resultaron en un tensor con `shape(2,2)`. Ahora bien, intentemos multiplicar dos matrices que rompan con la regla numero 1 establecida anteriormente.

In [70]:
# Tensor de (3,2) 
X = tf.constant([[1,2],
                 [3,4],
                 [5,6]])

# Tensor de (3,2)
Y = tf.constant([[7,8],
                 [9,10],
                 [11,12]])

X, Y

(<tf.Tensor: shape=(3, 2), dtype=int32, numpy=
 array([[1, 2],
        [3, 4],
        [5, 6]], dtype=int32)>, <tf.Tensor: shape=(3, 2), dtype=int32, numpy=
 array([[ 7,  8],
        [ 9, 10],
        [11, 12]], dtype=int32)>)

In [71]:
# Intenta multiplicar ambos tensores con @
X @ Y

InvalidArgumentError: ignored

Esto se debe a que las dimensiones internas son diferentes.

Tenemos dos opciones:
  * Hacer un reshape de X a `(2,3)`
  * Hacer un reshape de Y a `(3,2)`

Esto se puede hacer, a su vez, de dos formas:
  * `tf.reshape()`
  * `tf.transpose()`

In [72]:
# Ejemplo de reshape (3,2) -> (2,3)
tf.reshape(Y, shape=(2,3))

<tf.Tensor: shape=(2, 3), dtype=int32, numpy=
array([[ 7,  8,  9],
       [10, 11, 12]], dtype=int32)>

In [73]:
# Multiplicación con nuevo shape de Y
X @ tf.reshape(Y, shape=(2,3))

<tf.Tensor: shape=(3, 3), dtype=int32, numpy=
array([[ 27,  30,  33],
       [ 61,  68,  75],
       [ 95, 106, 117]], dtype=int32)>

In [74]:
# Transpuesta de (3,2) -> (2,3)
tf.transpose(X)

<tf.Tensor: shape=(2, 3), dtype=int32, numpy=
array([[1, 3, 5],
       [2, 4, 6]], dtype=int32)>

In [75]:
# Multiplicación con transpuesta
tf.matmul(tf.transpose(X), Y)

<tf.Tensor: shape=(2, 2), dtype=int32, numpy=
array([[ 89,  98],
       [116, 128]], dtype=int32)>

In [76]:
# Multiplicación con parámetros usando tf.matmul
tf.matmul(a=X, b=Y, transpose_a=True, transpose_b=False)

<tf.Tensor: shape=(2, 2), dtype=int32, numpy=
array([[ 89,  98],
       [116, 128]], dtype=int32)>

Observa como existe una diferencia en shapes cuanto hacemos transpuesta de `X` o un reshape de `Y`.

Esto se debe a la segunda regla, la cual dice que:

 * `(3, 2) @ (2, 3)` -> `(3, 3)` resulta de `X @ tf.reshape(Y, shape=(2, 3))` 
 * `(2, 3) @ (3, 2)` -> `(2, 2)` resulta de `tf.matmul(tf.transpose(X), Y)`

## Producto punto (dot product)