# Paralelizacion de entrenamiento de redes neuronales con TensorFlow

En esta seccion dejaremos atras los rudimentos de las matematicas y nos centraremos en utilizar TensorFlow, la cual es una de las librerias mas populares de arpendizaje profundo y que realiza una implementacion mas eficaz de las redes neuronales que cualquier otra implementacion de Numpy.

TensorFlow es una interfaz de programacion multiplataforma y escalable para implementar y ejecutar algortimos de aprendizaje automatico de una manera mas eficaz ya que permite usar tanto la CPU como la GPU, la cual suele tener muchos mas procesadores que la CPU, los cuales, combinando sus frecuencias, presentan un rendimiento mas potente. La API mas desarrollada de esta herramienta se presenta para Python, por lo cual muchos desarrolladores se ven atraidos a este lenguaje.

## Primeros pasos con TensorFlow

https://jakevdp.github.io/PythonDataScienceHandbook/02.01-understanding-data-types.html


In [None]:
# Creando tensores
# =============================================
import tensorflow as tf
import numpy as np
np.set_printoptions(precision=3)

a = np.array([1, 2, 3], dtype=np.int32)
b = [4, 5, 6]

t_a = tf.convert_to_tensor(a)
t_b = tf.convert_to_tensor(b)

print(t_a)
print(t_b)

In [None]:
# Obteniendo las dimensiones de un tensor
# ===============================================
t_ones = tf.ones((2, 3))
print(t_ones)
t_ones.shape

In [None]:
# Obteniendo los valores del tensor como array
# ===============================================
t_ones.numpy()

In [None]:
# Creando un tensor de valores constantes
# ================================================
const_tensor = tf.constant([1.2, 5, np.pi], dtype=tf.float32)
print(const_tensor)

In [None]:
matriz = np.array([[2, 3, 4, 5], [6, 7, 8, 8]], dtype = np.int32)
matriz

In [None]:
matriz_tf = tf.convert_to_tensor(matriz)
print(matriz_tf, end = '\n'*2)
print(matriz_tf.numpy(), end = '\n'*2)
print(matriz_tf.shape)

## Manipulando los tipos de datos y forma de un tensor

In [None]:
# Cambiando el tipo de datos del tensor
# ==============================================
print(matriz_tf.dtype)

matriz_tf_n = tf.cast(matriz_tf, tf.int64)

print(matriz_tf_n.dtype)

In [None]:
# Transponiendo un tensor
# =================================================
t = tf.random.uniform(shape=(3, 5))
print(t, end = '\n'*2)

t_tr = tf.transpose(t)
print(t_tr, end = '\n'*2)

In [None]:
# Redimensionando un vector
# =====================================
t = tf.zeros((30,))
print(t, end = '\n'*2)
print(t.shape, end = '\n'*3)

t_reshape = tf.reshape(t, shape=(5, 6))
print(t_reshape, end = '\n'*2)
print(t_reshape.shape)

In [None]:
# Removiendo las dimensiones innecesarias
# =====================================================
t = tf.zeros((1, 2, 1, 4, 1))
print(t, end = '\n'*2)
print(t.shape, end = '\n'*3)

t_sqz = tf.squeeze(t, axis=(2, 4))
print(t_sqz, end = '\n'*2)
print(t_sqz.shape, end = '\n'*3)
print(t.shape, ' --> ', t_sqz.shape)

## Operaciones matematicas sobre tensores

In [None]:
# Inicializando dos tensores con numeros aleatorios
# =============================================================
tf.random.set_seed(1)
t1 = tf.random.uniform(shape=(5, 2), minval=-1.0, maxval=1.0)
t2 = tf.random.normal(shape=(5, 2), mean=0.0, stddev=1.0)

print(t1, '\n'*2, t2)

In [None]:
# Producto tipo element-wise: elemento a elemento
# =================================================
t3 = tf.multiply(t1, t2).numpy()
print(t3)

In [None]:
# Promedio segun el eje
# ================================================
t4 = tf.math.reduce_mean(t1, axis=None)
print(t4, end = '\n'*3)

t4 = tf.math.reduce_mean(t1, axis=0)
print(t4, end = '\n'*3)

t4 = tf.math.reduce_mean(t1, axis=1)
print(t4, end = '\n'*3)

In [None]:
# suma segun el eje
# =================================================
t4 = tf.math.reduce_sum(t1, axis=None)
print('Suma de todos los elementos:', t4, end = '\n'*3)

t4 = tf.math.reduce_sum(t1, axis=0)
print('Suma de los elementos por columnas:', t4, end = '\n'*3)

t4 = tf.math.reduce_sum(t1, axis=1)
print('Suma de los elementos por filas:', t4, end = '\n'*3)

In [None]:
# Desviacion estandar segun el eje
# =================================================
t4 = tf.math.reduce_std(t1, axis=None)
print('Suma de todos los elementos:', t4, end = '\n'*3)

t4 = tf.math.reduce_std(t1, axis=0)
print('Suma de los elementos por columnas:', t4, end = '\n'*3)

t4 = tf.math.reduce_std(t1, axis=1)
print('Suma de los elementos por filas:', t4, end = '\n'*3)

In [None]:
# Producto entre matrices
# ===========================================
t5 = tf.linalg.matmul(t1, t2, transpose_b=True)
print(t5.numpy(), end = '\n'*2)

In [None]:
# Producto entre matrices
# ===========================================
t6 = tf.linalg.matmul(t1, t2, transpose_a=True)
print(t6.numpy())

In [None]:
# Calculando la norma de un vector
# ==========================================
norm_t1 = tf.norm(t1, ord=2, axis=None).numpy()
print(norm_t1, end='\n'*2)

norm_t1 = tf.norm(t1, ord=2, axis=0).numpy()
print(norm_t1, end='\n'*2)

norm_t1 = tf.norm(t1, ord=2, axis=1).numpy()
print(norm_t1, end='\n'*2)

## Partir, apilar y concatenar tensores



In [None]:
# Datos a trabajar
# =======================================
tf.random.set_seed(1)
t = tf.random.uniform((6,))
print(t.numpy())

In [None]:
# Partiendo el tensor en un numero determinado de piezas
# ======================================================
t_splits = tf.split(t, num_or_size_splits = 3)
[item.numpy() for item in t_splits]

In [None]:
# Partiendo el tensor segun los tama√±os definidos
# ======================================================
tf.random.set_seed(1)
t = tf.random.uniform((6,))
print(t.numpy())
t_splits = tf.split(t, num_or_size_splits=[3, 3])
[item.numpy() for item in t_splits]

In [None]:
print(matriz_tf.numpy())
# m_splits = tf.split(t, num_or_size_splits = 0, axis = 1)
matriz_n = tf.reshape(matriz_tf, shape = (8,))
print(matriz_n.numpy())
m_splits = tf.split(matriz_n, num_or_size_splits = 2)
[item.numpy() for item in m_splits]

In [None]:
# Concatenando tensores
# =========================================
A = tf.ones((3,))
print(A, end ='\n'*2)

B = tf.zeros((2,))
print(B, end ='\n'*2)

C = tf.concat([A, B], axis=0)
print(C.numpy())

In [None]:
# Apilando tensores
# =========================================
A = tf.ones((3,))
print(A, end ='\n'*2)
B = tf.zeros((3,))
print(B, end ='\n'*2)
S = tf.stack([A, B], axis=1)
print(S.numpy())

Mas funciones y herramientas en:

https://www.tensorflow.org/versions/r2.0/api_docs/python/tf.

<div class="burk">
EJERCICIOS</div><i class="fa fa-lightbulb-o "></i>

1. Cree dos tensores de dimensiones (4, 6), de numeros aleatorios provenientes de una distribucion normal estandar con promedio 0.0 y dsv 1.0. Imprimalos.
2. Multiplique los anteriores tensores de las dos formas vistas, element-wise y producto matricial, realizando las dos transposiciones vistas. 
3. Calcule los promedios, desviaciones estandar y suma de sus elementos para los dos tensores.
4. Redimensione los tensores para que sean ahora de rango 1.
5. Calcule el coseno de los elementos de  los tensores (revise la documentacion).
6. Cree un tensor de rango 1 con 1001 elementos, empezando con el 0 y hasta el 30.
7. Realice un for sobre los elementos del tensor e imprimalos.
8. Realice el calculo de los factoriales de los numero del 1 al 30 usando el tensor del punto 6. Imprima el resultado como un DataFrame

# Creaci√≥n de *pipelines* de entrada con tf.data: la API de conjunto de datos de TensorFlow

Cuando entrenamos un modelo NN profundo, generalmente entrenamos el modelo de forma incremental utilizando un algoritmo de optimizaci√≥n iterativo como el descenso de gradiente estoc√°stico, como hemos visto en clases anteriores.

La API de Keras es un contenedor de TensorFlow para crear modelos NN. La API de Keras proporciona un m√©todo, `.fit ()`, para entrenar los modelos. En los casos en que el conjunto de datos de entrenamiento es bastante peque√±o y se puede cargar como un tensor en la memoria, los modelos de TensorFlow (que se compilan con la API de Keras) pueden usar este tensor directamente a trav√©s de su m√©todo .fit () para el entrenamiento. Sin embargo, en casos de uso t√≠picos, cuando el conjunto de datos es demasiado grande para caber en la memoria de la computadora, necesitaremos cargar los datos del dispositivo de almacenamiento principal (por ejemplo, el disco duro o la unidad de estado s√≥lido) en trozos, es decir, lote por lote. 

Adem√°s, es posible que necesitemos construir un *pipeline* de procesamiento de datos para aplicar ciertas transformaciones y pasos de preprocesamiento a nuestros datos, como el centrado medio, el escalado o la adici√≥n de ruido para aumentar el procedimiento de entrenamiento y evitar el sobreajuste.

Aplicar las funciones de preprocesamiento manualmente cada vez puede resultar bastante engorroso. Afortunadamente, TensorFlow proporciona una clase especial para construir *pipelines* de preprocesamiento eficientes y convenientes. En esta parte, veremos una descripci√≥n general de los diferentes m√©todos para construir un conjunto de datos de TensorFlow, incluidas las transformaciones del conjunto de datos y los pasos de preprocesamiento comunes.

## Creando un Dataset de TensorFlow desde tensores existentes

Si los datos ya existen en forma de un objeto tensor, una lista de Python o una matriz NumPy, podemos crear f√°cilmente un conjunto de datos usando la funci√≥n `tf.data.Dataset.from_tensor_slices()`. Esta funci√≥n devuelve un objeto de la clase Dataset, que podemos usar para iterar a trav√©s de los elementos individuales en el conjunto de datos de entrada:


In [2]:
import tensorflow as tf
# Ejemplo con listas
# ======================================================
a = [1.2, 3.4, 7.5, 4.1, 5.0, 1.0]
ds = tf.data.Dataset.from_tensor_slices(a)
print(ds)

<TensorSliceDataset shapes: (), types: tf.float32>


In [5]:
for item in ds:
    print(item)
    
for i in ds:
    print(i.numpy())

tf.Tensor(1.2, shape=(), dtype=float32)
tf.Tensor(3.4, shape=(), dtype=float32)
tf.Tensor(7.5, shape=(), dtype=float32)
tf.Tensor(4.1, shape=(), dtype=float32)
tf.Tensor(5.0, shape=(), dtype=float32)
tf.Tensor(1.0, shape=(), dtype=float32)
1.2
3.4
7.5
4.1
5.0
1.0


Si queremos crear lotes a partir de este conjunto de datos, con un tama√±o de lote deseado de 3, podemos hacerlo de la siguiente manera:

In [9]:
# Creando lotes de 3 elementos cada uno
# ===================================================
ds_batch = ds.batch(3)
for i, elem in enumerate(ds_batch, 1):
    print(f'batch {i}:', elem)

batch 1: tf.Tensor([1.2 3.4 7.5], shape=(3,), dtype=float32)
batch 2: tf.Tensor([4.1 5.  1. ], shape=(3,), dtype=float32)


Esto crear√° dos lotes a partir de este conjunto de datos, donde los primeros tres elementos van al lote n¬∞ 1 y los elementos restantes al lote n¬∞ 2. El m√©todo `.batch()` tiene un argumento opcional, `drop_remainder`, que es √∫til para los casos en los que el n√∫mero de elementos en el tensor no es divisible por el tama√±o de lote deseado. El valor predeterminado de `drop_remainder` es `False`.

## Combinar dos tensores en un Dataset

A menudo, podemos tener los datos en dos (o posiblemente m√°s) tensores. Por ejemplo, podr√≠amos tener un tensor para caracter√≠sticas y un tensor para etiquetas. En tales casos, necesitamos construir un conjunto de datos que combine estos tensores juntos, lo que nos permitir√° recuperar los elementos de estos tensores en tuplas.

Suponga que tenemos dos tensores, t_x y t_y. El tensor t_x contiene nuestros valores de caracter√≠sticas, cada uno de tama√±o 3, y t_y almacena las etiquetas de clase. Para este ejemplo, primero creamos estos dos tensores de la siguiente manera:

In [10]:
# Datos de ejemplo
# ============================================
tf.random.set_seed(1)
t_x = tf.random.uniform([4, 3], dtype=tf.float32)
t_y = tf.range(4)
print(t_x)
print(t_y)

tf.Tensor(
[[0.16513085 0.9014813  0.6309742 ]
 [0.4345461  0.29193902 0.64250207]
 [0.9757855  0.43509948 0.6601019 ]
 [0.60489583 0.6366315  0.6144488 ]], shape=(4, 3), dtype=float32)
tf.Tensor([0 1 2 3], shape=(4,), dtype=int32)


In [11]:
# Uniendo los dos tensores en un Dataset
# ============================================
ds_x = tf.data.Dataset.from_tensor_slices(t_x)
ds_y = tf.data.Dataset.from_tensor_slices(t_y)

ds_joint = tf.data.Dataset.zip((ds_x, ds_y))

for example in ds_joint:
    print('x:', example[0].numpy(),' y:', example[1].numpy())

x: [0.16513085 0.9014813  0.6309742 ]  y: 0
x: [0.4345461  0.29193902 0.64250207]  y: 1
x: [0.9757855  0.43509948 0.6601019 ]  y: 2
x: [0.60489583 0.6366315  0.6144488 ]  y: 3


In [13]:
ds_joint = tf.data.Dataset.from_tensor_slices((t_x, t_y))
for example in ds_joint:
    #print(example)
    print('x:', example[0].numpy(), ' y:', example[1].numpy())

ds_joint

x: [0.16513085 0.9014813  0.6309742 ]  y: 0
x: [0.4345461  0.29193902 0.64250207]  y: 1
x: [0.9757855  0.43509948 0.6601019 ]  y: 2
x: [0.60489583 0.6366315  0.6144488 ]  y: 3


<TensorSliceDataset shapes: ((3,), ()), types: (tf.float32, tf.int32)>

In [14]:
# Operacion sobre el dataset generado
# ====================================================
ds_trans = ds_joint.map(lambda x, y: (x*2-1.0, y))
for example in ds_trans: 
    print(' x:', example[0].numpy(), ' y:', example[1].numpy())

 x: [-0.6697383   0.80296254  0.26194835]  y: 0
 x: [-0.13090777 -0.41612196  0.28500414]  y: 1
 x: [ 0.951571   -0.12980103  0.32020378]  y: 2
 x: [0.20979166 0.27326298 0.22889757]  y: 3


## Mezclar, agrupar y repetir

Para entrenar un modelo NN usando la optimizaci√≥n de descenso de gradiente estoc√°stico, es importante alimentar los datos de entrenamiento como lotes mezclados aleatoriamente. Ya hemos visto arriba como crear lotes llamando al m√©todo `.batch()` de un objeto de conjunto de datos. Ahora, adem√°s de crear lotes, vamos a mezclar y reiterar sobre los conjuntos de datos:

In [None]:
# Mezclando los elementos de un tensor
# ===================================================
tf.random.set_seed(1)
ds = ds_joint.shuffle(buffer_size = len(t_x))
for example in ds:
    print(' x:', example[0].numpy(), ' y:', example[1].numpy())

donde las filas se barajan sin perder la correspondencia uno a uno entre las entradas en x e y. El m√©todo `.shuffle()` requiere un argumento llamado `buffer_size`, que determina cu√°ntos elementos del conjunto de datos se agrupan antes de barajar. Los elementos del b√∫fer se recuperan aleatoriamente y su lugar en el b√∫fer se asigna a los siguientes elementos del conjunto de datos original (sin mezclar). Por lo tanto, si elegimos un tama√±o de b√∫fer peque√±o, es posible que no mezclemos perfectamente el conjunto de datos.

Si el conjunto de datos es peque√±o, la elecci√≥n de un tama√±o de b√∫fer relativamente peque√±o puede afectar negativamente el rendimiento predictivo del NN, ya que es posible que el conjunto de datos no est√© completamente aleatorizado. En la pr√°ctica, sin embargo, por lo general no tiene un efecto notable cuando se trabaja con conjuntos de datos relativamente grandes, lo cual es com√∫n en el aprendizaje profundo.

Alternativamente, para asegurar una aleatorizaci√≥n completa durante cada √©poca, simplemente podemos elegir un tama√±o de b√∫fer que sea igual al n√∫mero de ejemplos de entrenamiento, como en el c√≥digo anterior (`buffer_size = len(t_x)`).

 Ahora, creemos lotes a partir del conjunto de datos ds_joint:

In [None]:
ds = ds_joint.batch(batch_size = 3, drop_remainder = False)
print(ds)
batch_x, batch_y = next(iter(ds))
print('Batch-x:\n', batch_x.numpy())

In [None]:
print('Batch-y: ', batch_y.numpy())

Adem√°s, al entrenar un modelo para m√∫ltiples √©pocas, necesitamos mezclar e iterar sobre el conjunto de datos por el n√∫mero deseado de √©pocas. Entonces, repitamos el conjunto de datos por lotes dos veces:

In [None]:
ds = ds_joint.batch(3).repeat(count = 2)
for i,(batch_x, batch_y) in enumerate(ds):
    print(i, batch_x.numpy(), batch_y.numpy(), end = '\n'*2)

Esto da como resultado dos copias de cada lote. Si cambiamos el orden de estas dos operaciones, es decir, primero lote y luego repetimos, los resultados ser√°n diferentes:

In [None]:
ds = ds_joint.repeat(count=2).batch(3)
for i,(batch_x, batch_y) in enumerate(ds):
    print(i, batch_x.numpy(), batch_y.numpy(), end = '\n'*2)

Finalmente, para comprender mejor c√≥mo se comportan estas tres operaciones (batch, shuffle y repeat), experimentemos con ellas en diferentes √≥rdenes. Primero, combinaremos las operaciones en el siguiente orden: (1) shuffle, (2) batch y (3) repeat:

In [None]:
# Orden 1: shuffle -> batch -> repeat
tf.random.set_seed(1)
ds = ds_joint.shuffle(4).batch(2).repeat(3)
for i,(batch_x, batch_y) in enumerate(ds):
    print(i, batch_x, batch_y.numpy(), end = '\n'*2)

In [None]:
# Orden 2: batch -> shuffle -> repeat
tf.random.set_seed(1)
ds = ds_joint.batch(2).shuffle(4).repeat(3)
for i,(batch_x, batch_y) in enumerate(ds):
    print(i, batch_x, batch_y.numpy(), end = '\n'*2)

In [None]:
# Orden 2: batch -> repeat-> shuffle
tf.random.set_seed(1)
ds = ds_joint.batch(2).repeat(3).shuffle(4)
for i,(batch_x, batch_y) in enumerate(ds):
    print(i, batch_x, batch_y.numpy(), end = '\n'*2)

## Obteniendo conjuntos de datos disponibles de la biblioteca tensorflow_datasets

La biblioteca tensorflow_datasets proporciona una buena colecci√≥n de conjuntos de datos disponibles gratuitamente para entrenar o evaluar modelos de aprendizaje profundo. Los conjuntos de datos est√°n bien formateados y vienen con descripciones informativas, incluido el formato de caracter√≠sticas y etiquetas y su tipo y dimensionalidad, as√≠ como la cita del documento original que introdujo el conjunto de datos en formato BibTeX. Otra ventaja es que todos estos conjuntos de datos est√°n preparados y listos para usar como objetos tf.data.Dataset, por lo que todas las funciones que cubrimos se pueden usar directamente:

In [None]:
# pip install tensorflow-datasets

In [None]:
import tensorflow_datasets as tfds
print(len(tfds.list_builders()))
print(tfds.list_builders()[:5])

In [None]:
# Trabajando con el archivo mnist
# ===============================================
mnist, mnist_info = tfds.load('mnist', with_info=True, shuffle_files=False)

In [None]:
print(mnist_info)

In [None]:
print(mnist.keys())

In [None]:
ds_train = mnist['train']
ds_train = ds_train.map(lambda item:(item['image'], item['label']))
ds_train = ds_train.batch(10)
batch = next(iter(ds_train))
print(batch[0].shape, batch[1])

In [None]:
import matplotlib.pyplot as plt

fig = plt.figure(figsize=(15, 6))
for i,(image,label) in enumerate(zip(batch[0], batch[1])):
    ax = fig.add_subplot(2, 5, i+1)
    ax.set_xticks([]); ax.set_yticks([])
    ax.imshow(image[:, :, 0], cmap='gray_r')
    ax.set_title('{}'.format(label), size=15)
plt.show()

# Construyendo un modelo NN en TensorFlow

## La API de TensorFlow Keras (tf.keras)

Keras es una API NN de alto nivel y se desarroll√≥ originalmente para ejecutarse sobre otras bibliotecas como TensorFlow y Theano. Keras proporciona una interfaz de programaci√≥n modular y f√°cil de usar que permite la creaci√≥n de prototipos y la construcci√≥n de modelos complejos en solo unas pocas l√≠neas de c√≥digo. Keras se puede instalar independientemente de PyPI y luego configurarse para usar TensorFlow como su motor de backend. Keras est√° estrechamente integrado en TensorFlow y se puede acceder a sus m√≥dulos a trav√©s de tf.keras.

En TensorFlow 2.0, tf.keras se ha convertido en el enfoque principal y recomendado para implementar modelos. Esto tiene la ventaja de que admite funcionalidades espec√≠ficas de TensorFlow, como las canalizaciones de conjuntos de datos que usan tf.data.

La API de Keras (tf.keras) hace que la construcci√≥n de un modelo NN sea extremadamente f√°cil. El enfoque m√°s utilizado para crear una NN en TensorFlow es a trav√©s de `tf.keras.Sequential()`, que permite apilar capas para formar una red. Se puede dar una pila de capas en una lista de Python a un modelo definido como tf.keras.Sequential(). Alternativamente, las capas se pueden agregar una por una usando el m√©todo .add().

Adem√°s, tf.keras nos permite definir un modelo subclasificando tf.keras.Model.

Esto nos da m√°s control sobre la propagacion hacia adelante al definir el m√©todo call() para nuestra clase modelo para especificar la propagacion hacia adelante explicitamente. 

Finalmente, los modelos construidos usando la API tf.keras se pueden compilar y entrenar a trav√©s de los m√©todos .compile() y .fit().

## Construyendo  un modelo de regresion lineal



In [None]:
X_train = np.arange(10).reshape((10, 1))
y_train = np.array([1.0, 1.3, 3.1, 2.0, 5.0, 6.3, 6.6, 7.4, 8.0, 9.0])

In [None]:
X_train, y_train

In [None]:
import matplotlib.pyplot as plt

fig, ax = plt.subplots()
ax.plot(X_train, y_train, 'o', markersize=10)
ax.set_xlabel('x')
ax.set_ylabel('y')

In [None]:
import tensorflow as tf

X_train_norm = (X_train - np.mean(X_train))/np.std(X_train)
ds_train_orig = tf.data.Dataset.from_tensor_slices((tf.cast(X_train_norm, tf.float32),tf.cast(y_train, tf.float32)))

for i in ds_train_orig:
    print(i[0].numpy(), i[1].numpy())

Ahora, podemos definir nuestro modelo de regresi√≥n lineal como $ùëß = ùë§x + ùëè$. Aqu√≠, vamos a utilizar la API de Keras. `tf.keras` proporciona capas predefinidas para construir modelos NN complejos, pero para empezar, usaremos un modelo desde cero:

In [None]:
class MyModel(tf.keras.Model):
    def __init__(self):
        super(MyModel, self).__init__()
        self.w = tf.Variable(0.0, name='weight')
        self.b = tf.Variable(0.0, name='bias')

    def call(self, x):
        return self.w * x + self.b

In [None]:
model = MyModel()
model.build(input_shape=(None, 1))
model.summary()