# Ex05 Introducción a TensorFlow

Hasta ahora, hemos utilizado numpy para construir redes neuronales. Ahora comenzaremos a utilizar TensorFlow como framework para construir redes neuronales profundas de una forma más rápida. Los frameworks como TensorFlow, Caffe y Keras pueden acelerar significativamente el desarrollo de modelos de aprendizaje automático. En esta actividad, aprenderemos realizar los siguiente en TensorFlow:

- Uso de elementos básicos (constantes, variables, sesiones, placeholders)
- Algoritmos de entrenamiento
- Implementar una red neuronal

$\textbf{Nota}$: los frameworks puede reducir el tiempo de codificación, pero también pueden tener optimizaciones que mejoren la velocidad de ejecución del código.

$\textbf{Observación}$: esta actividad ha sido diseñada para TensorFlow r1.14, si utliza otra versión podría encontrar algunos detalles de sintaxis o en el uso de funciones.

## 1. Elementos básicos de TensorFlow

### 1.1 Uso de liberías

Comencemos por importar la librería `tensorflow` como `tf`. En caso de que aun no tenga instalado TensorFlow, se puede optar por las siguientes opciones:

- [Utilizar un docker](https://www.tensorflow.org/install#run-a-tensorflow-container).
- [Utilizar Google colab](https://www.tensorflow.org/install#google-colab58-an-easy-way-to-learn-and-use-tensorflow)


Adicionalmente, para esta actividad vamos a necesitar la librería `numpy`.

In [None]:
import numpy as np
import tensorflow as tf

%matplotlib inline

# Con el fin de poder comparar los resultados
np.random.seed(2)


### 1. 2 Uso de constantes, variables, sesiones y placeholders

Ahora que hemos importado las librerías, comencemos con un ejercicio sencillo para implementar en Tensorflow. Escribamos el código que permita realizar el cálculo del error en la predicción de la salida $\hat{Y}$ para un ejemplo de entrenamiento con respecto a la salida esperada $Y$. Esto es:

$loss = \mathcal{L}(\hat{y}, y) = (\hat y^{(i)} - y^{(i)})^2$

Para este ejercicio:
- Definamos `y_hat = 25` y `y=29` como constantes. Podemos definir constantes en tensorflow de la siguiente manera `nom_constante = tf.constant(valor, name = 'nom_constante')`.

- Definamos la variable `loss`que debe almacenar el resultado del cálculo. Podemos definir variables en tensorflow de la siguiente manera `nom_variable = tf.Variable(valor, name='nom_variable')`

- Inicialicemos las variables. Para inicializar las variables, existen diversas funciones, una de ellas es: `init = tf.global_variables_initializer()`

- Definamos una sesión. Para definir una sesión podemos utilizar: `session_name = tf.Session()`.

- Ejecutemos la inicialización y el cálculo de `loss`. Para esto, utilizamos la sesión previamente definida, por ejemplo: `session.run(init)`, `session.run(loss)`.

Para profundizar en el tema de uso de constantes, variables y sesiones se recomienda consultar las siguientes los siguiente enlaces:

- [tf.Variable](https://www.tensorflow.org/api_docs/python/tf/Variable)
- [tf.constant](https://www.tensorflow.org/api_docs/python/tf/constant)
- [tf.Session](https://www.tensorflow.org/api_docs/python/tf/Session)

Complete el código faltante en la siguiente celda, ejecute y verifique que el resultado concuerda con la salida esperada.

In [None]:
y_hat = None             #Definir una constante y_hat = 25
y = None                 #Definir una constante y = 29
loss = None              #Definir una variable y asignar (y-y_hat)**2
init = None              #Definir la inicialización de variables
session = None           #Crear una sesión e imprimir la salida
session.run(init)        #Ejecutar la inicializión de las variables
r = session.run(loss)    #Ejecutar el cálculo de loss
print(f"loss = {r}")                  

$\textbf{Salida esperada: }$

`loss = 16`

¿Le parece mucho código para un problema tan sencillo? Recordemos que escribir y ejecutar programas en TensorFlow requiere seguir los siguientes pasos:

1. Crear Tensors (por ejemplo, constantes y variables) que serán ejecutas/evaluadas posteriormente.
2. Definir operaciones entre los Tensores.
3. Inicializat los Tensores.
4. Crear una sesión.
5. Ejecutar la sesión. Esto ejecutará las operaciones definidas que fueron definidas.

Por eso, cuando creamos la variable para el error, simplemente se define $loss$ en función de otros elementos, pero no se evalua su valor. Para evaluarla, primero tenemos que ejecutar `session.run(init)`. Esta instrucción inicializa la variable $loss$, y con la instrucción `session.run(loss)` finalmente podemos evaluar el valor de $loss$.

Veamos otro ejemplo sencillo. En este caso, escribamos un programa con TensorFlow que realice la multiplicación de dos constantes. `a = 2` y `b = 10`. Almacene el resultado en una variable llamada `c` y al final imprima el resultado.

Tip:
- Para realizar la multiplicación en TensorFlow, podemos utilizar `tf.multiply(   ,   )`.

In [None]:
a = None
b = None
c = None
print(f"c = {c}")
session = tf.Session()
print(f"c = {session.run(c)}")

$\textbf{Salida esperada:}$

`c = Tensor("Mul:0", shape=(), dtype=int32)`

`c = 20`

Observe que la primer instrucción `print` no imprime el valor de la variable `c` (aun no ha sido evaluada). En resumen, recuerde inicializar sus variables, crear su sesión y ejecutar las operaciones dentro de la sesión.

Es tiempo de utilizar los `placeholders` y su uso. Un `placeholder` es un objeto cuyo valor puedes especificar  posteriormente. Para especificar valores para un `placeholder`, se pueden asignar valores utilizando un "feed dictionary". Veamos un ejemplo del uso de `placeholders` en TensorFlow.

En la siguiente celda, se crea un `placeholder` para `z`. Esto nos permitirá asignarle un número posteriormente, cuando se ejecute la sesión.

In [None]:
z = tf.placeholder(tf.int32, name='z')
r = session.run(3*z, feed_dict = {z: 3})
print(f"r = {r}")
session.close()

En el ejemplo anterior, cuando definimos `z` no se tiene que especificar su valor. Un `placeholder` es simplemente una variable a la que asignaras un valor posteriormente, cuando se ejecute `Session`. Normalmente se alimentan los datos al `placeholder` mediante un `feed_dictionary` en el momento que se ejecuta `Session`.

En resumen, el uso de `placeholders` permite a TensorFlow especificar las operaciones necesarias para un cálculo, es decir, construir un gráfo de cálculo pero en donde los valores se especificarán más adelante.

## 2.  Algunos problemas para calentar motores

### 2.1. Implementación de una función lineal

Implemente una función (método si prefiere POO) que utilice TensorFlow para calcular la siguiente ecuación: $Y = WX + b$, donde $W$ y $X$ son matrices aleatorias y $b$ es un vector aleatorio.

Para este ejercicio, considere las siguientes dimensiones: $W$:(4, 3), $X$: (3, 1), y $b$:(4, 1). A manera de ejemplo, observe la definición de la constante $X$ que tiene la forma (3, 1):
```python
X = tf.constant(np.random.randn(3,1), name = "X")
```

$\textbf{Nota}$: pueden resultar útil el uso de las siguientes funciones:
- `tf.mul(   ,   )` para realizar la multiplicación de dos matrices
- `tf.add(   ,   )` para realizar la suma
- `tf.random.randn(  )` para inicializar de manera aleatoria

In [None]:
def linear_function():
    np.random.seed(1)
    
    #Inicialice las constantes X, W, b
    X = None
    W = None
    b = None

    #Defina las operaciones del grafo de cómputo
    Y = None
    
    #Crear la sesión y ejecutarla
    session = None
    result = None
    session.close()
    
    return result

print(f"result = {linear_function()}")

$\textbf{Salida esperada: }$

`result = [[-2.15657382]`

` [ 2.95891446]`

` [-1.08926781]`

` [-0.84538042]]`

### 2.2. Cálculo de la sigmoidal

TensorFlow provee un variedad de funciones comúnmente utilizadas para redes neuronales como:
- `tf.sigmoid()`
- `tf.softmax()`

Para este ejercicio, implemente una función para calcular la función sigmoidal de una entrada. Para implementar el ejercico, utilicemos el `placeholder` $x$. Cuando ejecutemos la sesión, utilicemos un `feed dictionary` para asignar el valor de entrada $z$. En resumen, tenemos que seguir los siguientes pasos:

- Crear un `placeholder` llamado x
- Definir las operaciones necesarias para calcular la función sigmoidal
- Ejecutar la sesión.

In [None]:
def sigmoid(z):
    # Crear el placeholder para x, nombrarla x
    x = None

    # Definir el cálculo de la sigmoidal
    sigmoid = None
    
    session = None
    result = None
    
    return result

print(f"sigmoid(0) = {sigmoid(0)}")
print(f"sigmoid(12) = {sigmoid(12)}")

$\textbf{Salida esperada:}$

`sigmoid(0) = 0.5`

`sigmoid(12) = 0.9999938011169434`

## 2.3. Calcular la función de costo

Anteriormente implementamos la función de costo desde cero: 

$J = - \frac{1}{m}  \sum_{i = 1}^m  \large ( \small y^{(i)} \log \sigma(z^{[2](i)}) + (1-y^{(i)})\log (1-\sigma(z^{[2](i)})\large )\small$

sin embargo, en TensorFlow no es necesario.

En este ejercicio, implementemos una función que calcule el costo, para esto utilizaremos la función: `tf.nn.sigmoid_cross_entropy_with_logits(logits = ...,  labels = ...)`

Tu implementación debe recibir `logits` (nuestros valores `z`), calcular la sigmoidal para obtener la activación y entonces calcular la función de costo.

In [None]:
def cost(logits, labels):
    """
    Parámetros:
    
    logits  vector que contiene las entradas a la unidad de activación (antes de la activación sigmoidal final)
    labels  vector de etiquetas (1 o 0)
    """
    
    #Crear los placeholders para Z y las etiquetas
    z = None
    y = None
    
    # Utilice la función de costo
    cost = None
    
    #crear una sesión
    session = None
    
    #Ejecutar la sesión
    cost = None
    
    #Cerrar la sesión
    session.close()
    
    return cost

logits = sigmoid(np.array([0.2,0.4,0.7,0.9]))
cost = cost(logits, np.array([0,0,1,1]))
print (f"cost = {cost}")

$\textbf{Salida esperada:}$

`cost = [1.0053872  1.0366409  0.41385433 0.39956614]`

## 2.4. Representación One Hot

Muchas veces en aprendizaje profundo tendremos un vector con números que van desde 0 a $C$-1, donde $C$ es el número de clases. Si $C$ es 4, por ejemplo, entonces podría tener el siguiente vector y que deberá convertir de la siguiente manera:

<img src="images/one_hot.png" style="width:600px;height:150px;">

A esto se le llama representación `One Hot`, porque en la nueva representación únicamente un elemento por columna se encuentra encendido (valor a 1). La implementación de esta transformación puede requerir alguna lineas de código en `numpy`, sin embargo, en TensorFlow podemos utilizar la siguiente función:

- tf.one_hot(labels, depth, axis) 

Implementemos una función que reciba un vector de etiquetas y el número de clases. La función debe retornar una representación "One Hot".

In [None]:
def one_hot_encoding(label, C):
    C = None
    
    one_hot_encode = tf.one_hot(labels, C, axis=0)
    
    session = None
    one_hot = None
    session.close()
    
    return one_hot

labels = np.array([1,2,0,2,1,0])
one_hot = one_hot_encoding(labels, C = 3)
print (f"{one_hot}")

$\textbf{Salida esperada:}$

`[[0. 0. 1. 0. 0. 1.]`

` [1. 0. 0. 0. 1. 0.]`

` [0. 1. 0. 1. 0. 0.]]`

## 2.5. Inicializar un vector con ceros y unos

Para inicializar un vector con ceros y unos. La función que utilizaremos es `tf.ones ()`. Para inicializar con ceros, puede usar `tf.zeros ()` en su lugar. Estas funciones toma un `shape` y retorna una matriz con la misma dimensiones pero llena de ceros y unos, respectivamente.

Implementemos la siguiente función para basados en un `shape`, devolver una matriz (de la misma dimensión con unos).

In [None]:
def ones(shape):
    
    ones = None
    
    session = None
    
    ones = session.run(None)
    session.close()
    
    return ones

print (f"{ones([3])}")

$\textbf{Salida esperada:}$

`[1. 1. 1.]`