<img src="./imgs/tensorflow_head.png" />

# Práctica 3.1. Introducción a Tensorflow

**TensorFlow** (https://www.tensorflow.org/) es una librería de software desarrollada por Google Brain con el propósito de realizar investigación en Machine Learning y Deep Neural Network. **Keras** es una API de abstracción de TensorFlow, por ello veremos algunos conceptos básicos aquí. 

## 1. Principales características de Tensorflow

* Definir, optimizar, y calcular de forma eficiente expresiones matemáticas que involucran arrays multidimensionales (**tensores**).

* Soporte para la programación de ML y Deep Neural Networks.

* Uso transparente de computación con GPU, proporcionando gestión automática y optimización de la memoria y de los datos usados. Se puede ejecutar el mismo código en CPUs o GPUs. Más específicamente, TF decide qué partes de la computación deben ser trasladadas a la GPU.

* Alta escalabilidad de la computación tanto a nivel de máquina como de conjuntos de datos.

TensorFlow está disponible para uso directo desde Python y C++, aunque la API para Python está mejor documentada y es más sencilla.

## 2. Un ejemplo preliminar

In [None]:
# Un ejemplo de cálculo en Python
x = 1
y = x + 10
print(y)

In [None]:
# Previamente, tensorflow debe estar instalado: pip3 install tensorflow (requiere python en 64 bits)
import tensorflow as tf

In [None]:
# El "mismo" cálculo en TF
x = tf.constant(1, name='x')
y = tf.Variable(x+10, name='y')
print(y)

1. ¿Qué diferencia sustancial se ve entre los dos códigos?
2. ¿Está calculando el valor de y en el código de TF?

## 3. Sesiones y modelos

Para calcuar el valor de la variable `y` y evaluar la expresión necesitamos **inicializar** las variables y, entonces, crear una **sesión** donde se ejecuta la computación.

In [None]:
# necesario para asignar los valores a las variables inicializadas con tf.Variable
model = tf.global_variables_initializer() 

In [None]:
with tf.Session() as session:
    session.run(model)
    print(session.run(y))

## 4. Grafo del Flujo de Datos

Una aplicación de Machine Learning es el resultado de la computación repetitiva de expresiones matemáticas complejas, por lo que podemos describir esta computación como un **Grafo de Flujo de Datos**.

Un **Grafo de Flujo de Datos** es un grafo donde:
  * cada Nodo representa la *instancia* de una operación matemática básica: *multiplicar*, *sumar*, *dividir*
  * cada Arista es un dato multi-dimensional (`tensor`) sobre el que se ejecuta la operación.

<img src="./imgs/dfg.gif" />

## 5. Modelo de Grafo de Tensorflow

* **Nodo**: En TensorFlow cada nodo representa la instanciación de una operación. 
    - Cada operación tiene entradas (`>= 2`) y salidas `>= 0`.
    
* **Aristas**: En TensorFlow hay dos tipos de aristas:
    - **Aristas de Datos**: son transportadores de estructuras de datos (`tensores`), donde una salida de una operación (que sale de un nodo) se convierte en la entrada de otra operación.
    - **Aristas de dependencia**: indican un *dependencia* entre dos nodos (es decir, una relación del tipo "sucede antes"). 
        + Si `A` y `B` son nodos y hay una dependencia de `A` a `B`, entonces `B` comenzará su operación solo cuando la de `A` haya acabado. 
        
* **Operación**: representa una computación abstracta, como sumar o multiplicar matrices. Manipula tensores, y puede ser polimórfica, es decir, puede manipular tensores de distinto tipo. 
  + Por ejemplo, la suma de dos tensores int32, la suma de dos tensores float, etc.

* **Kernel**: representa la implementación concreta de una operación. 
  + Por ejemplo, una operación `add matrix` puede tener una implementación CPU y otra GPU.

## 6. Sesiones del Modelo de Grafos de Tensorflow

Para que el programa cliente pueda establecer comunicación con el sistema de ejecución de TF se debe crear una sesión y, en ese momento, se crea un grafo inicial vacío, que tiene dos métodos principales: 

* `session.extend`: usado durante una computación para añadir más operaciones (nodos) o datos (aristas).

* `session.run`: se ejecuta el grafo para obtener las salidas (a veces, subgrafos del grafo principal se pueden ejecutar miles de veces usando este tipo de llamadas).

<img src="./imgs/TF.png" />

## 7. Tensorboard

**TensorBoard** es una herramienta de visualización que tiene como fin analizar el Grafo de Flujo de Datos y poder comprender mejor cómo funciona. Puede mostrar diferentes tipos de métricas estadísticas acerca de los parámetros y detalles de cualquier parte de un grafo. Previamente a lanzar tensorboard, hay que anotar qué nodos se quieren anotar mediente operaciones de `tf.summary`.

<img src="./imgs/tensorboard.png" />

## 8. Tipos de Datos (Tensores)

Un tensor es un contenedor de datos, usualmente números. Por ejemplo, una matriz es un tensor de 2 dimensiones. Los tensores son generalizaciones de las matrices a un número arbitrario de dimensiones. En el contexto de tensores, una dimensión se denomina eje (axis).

Un tensor se define por 3 atributos principales:
* Número de ejes (rank). Por ejemplo, una matriz o tensor 2D itene 2 ejes.
* Forma (shape). Una tupla de enteros que describen cuantas dimensiones tiene el tensor en cada eje. Un escalar tiene un shape igual a (). Una matriz de 3x4 tiene un shape (3, 4).
* Tipo de dato (dtype). Es el tipo de dato contenido en el tensor, por ejemplo `float32`, `uint8`, `float64`, etc. Normalmente no hay tensores de cadenas de texto, ya que los tensores viven en segmentos de memoria pre-reservados y contiguos.

### Tensores 0D (Escalares)

In [None]:
import numpy as np
tensor_0d = np.array(24.5)
tf_tensor=tf.convert_to_tensor(tensor_0d,dtype=tf.float64)
print(tf_tensor.shape)
with tf.Session() as sess: 
    print(sess.run(tf_tensor))

### Tensores 1D (Vectores)

In [None]:
import numpy as np
tensor_1d = np.array([1, 2.5, 4.6, 5.75, 9.7])
tf_tensor=tf.convert_to_tensor(tensor_1d,dtype=tf.float64)
print(tf_tensor)

In [None]:
with tf.Session() as sess: 
    print(sess.run(tf_tensor))
    print(sess.run(tf_tensor[0]))
    print(sess.run(tf_tensor[2]))

### Tensores 2D (Matrices)

In [None]:
tensor_2d = np.arange(16).reshape(4, 4)
print(tensor_2d)
tf_tensor = tf.placeholder(tf.float32, shape=(4, 4))
with tf.Session() as sess:
    print(sess.run(tf_tensor, feed_dict={tf_tensor: tensor_2d}))

## 9. Operaciones Básicas (Ejemplos)

In [None]:
# Creación de matrices con numpy
matrix1 = np.array([(2,2,2),(2,2,2),(2,2,2)],dtype='float32') 
matrix2 = np.array([(1,1,1),(1,1,1),(1,1,1)],dtype='float32')

In [None]:
# Inicialización de constantes
tf_mat1 = tf.constant(matrix1) 
tf_mat2 = tf.constant(matrix2)

In [None]:
# Multiplicación de matrices
matrix_product = tf.matmul(tf_mat1, tf_mat2)
# Suma de matrices
matrix_sum = tf.add(tf_mat1, tf_mat2)

In [None]:
# Determinante de una matriz
matrix_det = tf.matrix_determinant(matrix2)

In [None]:
# Evaluación
with tf.Session() as sess: 
    prod_res = sess.run(matrix_product) 
    sum_res = sess.run(matrix_sum) 
    det_res = sess.run(matrix_det)

In [None]:
print("matrix1*matrix2 : \n", prod_res)
print("matrix1+matrix2 : \n", sum_res)
print("det(matrix2) : \n", det_res)

## 10. Manipulando Tensores

Vamos a ver algunas operaciones que se pueden realizar con TensorFlow utilizando el logo de Keras como ejemplo.

In [None]:
# Requiere tener instalados matplotlib y pillow
%matplotlib inline

In [None]:
import matplotlib.image as mp_image
filename = "imgs/keras-logo-small.jpg"
input_image = mp_image.imread(filename)

In [None]:
#dimension
print('input dim = {}'.format(input_image.ndim))
#shape
print('input shape = {}'.format(input_image.shape))

In [None]:
import matplotlib.pyplot as plt
plt.imshow(input_image)
plt.show()

### Recorte (Slicing)

In [None]:
# Hasta ahora hemos visto como manejar datos con variables
# Un placeholder es una variable al cual se le asignará los datos más tarde (en session.run)
my_image = tf.placeholder("uint8",[None,None,3])
slice = tf.slice(my_image,begin=[10,0,0],size=[16,-1,-1])

In [None]:
# Al no haber variables, no es necesario ejecutar global_variables_initializer()
with tf.Session() as session:
    # Recordar asignar ahora los datos a los placeholders mediante un diccionario en la llamada a run
    result = session.run(slice,feed_dict={my_image: input_image})
    print(result.shape)

In [None]:
plt.imshow(result)
plt.show()

### Transponer (Transpose)

In [None]:
x = tf.Variable(input_image,name='x')
model = tf.global_variables_initializer()

with tf.Session() as session:
    x = tf.transpose(x, perm=[1,0,2]) # perm indica como se permutan las dimensiones
    session.run(model)
    result=session.run(x)

In [None]:
plt.imshow(result)
plt.show()

### Cálculo del Gradiente

In [None]:
x = tf.placeholder(tf.float32)
y = tf.log(x)  
# TF usa la acumulación hacia atrás (basado en la regla de la cadena) para calcular el gradiente en un punto.
var_grad = tf.gradients(y, x)
with tf.Session() as session:
    var_grad_val = session.run(var_grad, feed_dict={x:2})
    print(var_grad_val)

## 11. Dispositivos de Computación

En un sistema habitual hay múltiples dispositivos de computación:
* El procesador del sistema, o CPU. Suelen tener varios núcleos de computación (del orden de 2 a 8). Se les denomina multicore.
* El procesador gráfico, o GPU. Suelen tener de cientos a miles de núcleos de computación (pero menos "potentes" que los núcleos de una CPU). Se les denomina manycore
* Procesador específico para tensores, o TPU. Es un hardware que se vende aparte y es específico para Deep Learning y tareas con tensores.

TF soporta **CPU**, **GPU**, y **TPU**, que vienen representados como cadenas, por ejemplo:

* `"/cpu:0"`: La CPU de tu máquina.
* `"/gpu:0"`: La GPU de tu máquina, si tienes una.
* `"/gpu:1"`: Una segunda GPU.

Si una operación TF tiene implementaciones para **CPU** y **GPU**, los dispositivos GPU tendrán prioridad en la asignación de tareas. Por ejemplo, `matmul` tiene ambas implementaciones, por lo que en un sistema con dispositivos `cpu:0` y `gpu:0`, `gpu:0` será el seleccionado para ejecutar `matmul`.

### Un ejemplo ejecutado en una máquina con una GeForce GTX 760

```python
# Creates a graph.
a = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[2, 3], name='a')
b = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[3, 2], name='b')
c = tf.matmul(a, b)
# Creates a session with log_device_placement set to True.
sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))
# Runs the op.
print(sess.run(c))
```

```
Device mapping:
/job:localhost/replica:0/task:0/gpu:0 -> device: 0, name: GeForce GTX 760, pci bus
id: 0000:05:00.0
b: /job:localhost/replica:0/task:0/gpu:0
a: /job:localhost/replica:0/task:0/gpu:0
MatMul: /job:localhost/replica:0/task:0/gpu:0
[[ 22.  28.]
 [ 49.  64.]]
```

### Un ejemplo ejecutado en una máquina con dos GeForce GTX 760

```python
# Creates a graph.
c = []
for d in ['/gpu:0', '/gpu:1']:
  with tf.device(d):
    a = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[2, 3])
    b = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[3, 2])
    c.append(tf.matmul(a, b))
with tf.device('/cpu:0'):
  sum = tf.add_n(c)
# Creates a session with log_device_placement set to True.
sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))
# Runs the op.
print sess.run(sum)
```

```
Device mapping:
/job:localhost/replica:0/task:0/gpu:0 -> device: 0, name: GeForce GTX 760, pci bus
id: 0000:02:00.0
/job:localhost/replica:0/task:0/gpu:1 -> device: 1, name: GeForce GTX 760, pci bus
id: 0000:03:00.0
Const_3: /job:localhost/replica:0/task:0/gpu:0
Const_2: /job:localhost/replica:0/task:0/gpu:0
MatMul_1: /job:localhost/replica:0/task:0/gpu:0
Const_1: /job:localhost/replica:0/task:0/gpu:1
Const: /job:localhost/replica:0/task:0/gpu:1
MatMul: /job:localhost/replica:0/task:0/gpu:1
AddN: /job:localhost/replica:0/task:0/cpu:0
[[  44.   56.]
 [  98.  128.]]
```