## CAPÍTULO 2 - TENSORFLOW ESSENTIALS

### Representando Tensors
<p>Una manera conveniente de describir un objeto en el mundo real es a través del listado de sus propiedades o características. Por ejemplo, se puede describir un auto por su color, modelo, tipo de motor, y mucho más. Una lista ordenada de características es un <b><i>feature vector</i></b>(vector de características) y es lo que exactamente se representa en el código de Tensorflow.</p>
<p>Los feature vectors son los "dispositivos" mas usados en machine learning, por su simplicidad (son solo una lista de numeros). Una matriz concisamente representa una lista de vectores, donde cada columna de la matriz es una caracteristica de un vector</p>

<p>Se puede acceder a un elemento de un matriz especificando el indice de su fila y columna. A veces es conveniente usar mas de dos indices, como cuando se quiere referenciar un pixel en una imagen de colores no solo se realiza usando la fila y columna, sino tambien por el canal (rojo/azul/verde). Un tensor es una generalizacion de una matriz que especifica un elemento por un numero arbitracio de indices.</p>

<p>El rango de un tensor es el numero de indices que se necesita para acceder a un elemento especifico</p>


In [1]:
ejemplo = [[[1,2],[3,4],[5,6]],[[7,8],[9,10],[11,12]]]

In [5]:
ejemplo[0][0][0]

1

<p>El tensor "ejemplo" es de un tensor de rango 3, porque se necesito de 3 indices para especificar un elemento especifico.</p>

### Diferentes formas de representar un tensor

In [10]:
import tensorflow as tf
import numpy as np

#Tres formas de definir un matriz 2x2
m1 = [[1.0,2.0],[3.0,4.0]] #mediante listas

m2 = np.array([[1.0,2.0],[3.0,4.0]], dtype=np.float32) #mediante ndarray de NumPy

m3 = tf.constant([[1.0,2.0],[3.0,4.0]]) #Mediante tensores de TensorFlow

print(type(m1))
print(type(m2))
print(type(m3))

#Crear objetos tensor a partir de varios tipos
t1 = tf.convert_to_tensor(m1, dtype=tf.float32)
t2 = tf.convert_to_tensor(m2, dtype=tf.float32)
t3 = tf.convert_to_tensor(m3, dtype=tf.float32)

print(type(t1))
print(type(t2))
print(type(t3))


<class 'list'>
<class 'numpy.ndarray'>
<class 'tensorflow.python.framework.ops.Tensor'>
<class 'tensorflow.python.framework.ops.Tensor'>
<class 'tensorflow.python.framework.ops.Tensor'>
<class 'tensorflow.python.framework.ops.Tensor'>


<p>Despues de importar la libreria de TensorFlow, se puede usar el operador tf.constant como a continuacion</p>


In [11]:
import tensorflow as tf

m1 = tf.constant([[1.,2.]])

m2 = tf.constant([[1],[2]])

m3 = tf.constant([ [[1,2],
                    [3,4],
                    [5,6],
                    [7,8],
                    [9,10]] ])

print(m1)
print(m2)
print(m3)

Tensor("Const_7:0", shape=(1, 2), dtype=float32)
Tensor("Const_8:0", shape=(2, 1), dtype=int32)
Tensor("Const_9:0", shape=(1, 5, 2), dtype=int32)


<p>Cada objeto tensor tiene una etiqueta unica(name), una dimension(shape) que definen su estructura, y un tipo de dato (dtype) para especificar el tipo de valores que se manipularan.</p>

<p>Se puede iniciar un tensor con ceros <b><i> tf.zeros(shape)</i></b>, con unos <b><i>tf.ones(shape)</i></b>. El valor del argumento <i><b>shape</b></i> es de una dimension (1D), tensor de tipo int32</p>

### Creando operadores

Hay que tener en cuenta que definir una operación como por ejemplo la negación, es diferente de hacerla correr.

In [14]:
import tensorflow as tf

x = tf.constant([[1,2]])
print(x)
negMatrix = tf.negative(x)
print(negMatrix)

Tensor("Const_12:0", shape=(1, 2), dtype=int32)
Tensor("Neg_2:0", shape=(1, 2), dtype=int32)


En la impresion no figura [[-1,-2]]. Esto es porque se esta imprimiendo la definicion de la negacion y no asi la actual evaluacion. 

### Operadores útiles TensorFlow
Los operadores son los siguientes:
<ul>
    <li><b>tf.add(x,y)</b>: Suma dos tensores del mismo tipo.</li>
    <li><b>tf.substract(x,y)</b>: Resta dos tensores del mismo tipo.</li>
    <li><b>tf.multiply(x,y)</b>: Multiplica dos tensores.</li>
    <li><b>tf.pow(x,y)</b>: Toma el elemento-sabio(?) y a 'y' como potencia (x^y)</li>
    <li><b>tf.exp(x)</b>: Equivale al pow pero acá se usa 'e' (Euler), (x^e).</li>
    <li><b>tf.sqrt(x)</b>: Equivalente a pow(x,0.5)</li>
    <li><b>tf.div(x,y)</b>: Divide x entre y (x/y)</li>
    <li><b>tf.truediv(x,y)</b>: Lo mismo que div pero acá los vuelve floats (?).</li>
    <li><b>tf.floordiv(x,y)</b>: Lo mismo que div pero acá los redondea a ints (?).</li>
    <li><b>tf.mod(x,y)</b>: Saca el modulo de x entre y.</li>
</ul>

### Ejecutando operadores con sesiones
Una sesion es un espacio del sistema de software que se detalla en lineas de codigo se va a correr.
En TensorFlow, una sesion establece como los dispositivos de hardware hablan uno con otro. De esta manera puedes diseñar tu algoritmo de Machine Learning sin preocuparte sobre <i>micromanaging</i> el hardware donde corre. 

Para ejecutar una operacion y recibir su valor calculado, TensorFlow requiere una sesión. Para hacelo solo necesita ser creado una clase <i>session</i> usando <b>tf.Session()</b> y decirle que se ejecute como operador. El resultado será un valor que despues se podra usar en los calculos.

#### Usando una sesion

In [18]:
import tensorflow as tf

#Se define una matrix arbitraria
x = tf.constant([[1.0,2.0]])

#Se ejecuta la operación de negación en ella
neg_op = tf.negative(x)

#Se inicia una sescion para habilitar las ejecuciones de las operaciones
with tf.Session() as sess:
    result = sess.run(negMatrix) #le dice a la sesion que evalue negMatrix

    #imprime el resultado
print(result)

[[-1 -2]]


Una sesion no solo configura donde el codigo sera "computado" en la maquina, tambien explica como se distribuirá el computo para paralelizar el computo (?).

Todos los objetos Tensor tiene un <b>eval()</b> que evalua las operaciones matematicas que definen el valor. Pero la funcion <b>eval()</b> requiere una <b>session</b> definida para la libreria para entender como seria el mejor uso del hardware(?).

A continuación se utilizará <b>sess.run(...)</b>, el cual es un equivalente a invocar <b>eval()</b> en el contexto de sesión.

Cuando se ejecuta un código TensorFlow a traves del entorno interactivo es a menudo facil crear una sesion en modo interactivo, donde la sesion es parte implicita de todas las llamadas  a <i><b>eval( )</b></i>. De esa manera, la variable <i><b>session</b></i> no necesita ser pasado a traves del codigo, haciendo facil el concetrarse en las partes relevantes del algoritmo.

#### Usando el modo interactivo

In [20]:
import tensorflow as tf

#Se inicia un sesion interactiva, tal que la variable sess no necesita mas ser pasado
sess = tf.InteractiveSession()

#Se define una matriz arbitraria y se la vuelve negativa
x = tf.constant([[1.0,2.0]])
negMatrix = tf.negative(x)

#Ahora se puede evaluar la matriz negativa sin especificar implicitamente a la session 
result = negMatrix.eval()
print(result)

#Se cierra la sesion para no gastar recursos
sess.close()

[[-1. -2.]]


### Entendiendo el código como un gráfico
Se puede pensar en cada operación como un nodo en un gráfico. Los <b>edges</b> entre estos nodos representan la composición de las funciones matemáticas. Especificamente, el operador negativo que hemos estado estudiando es un nodo, y los <b>edges</b> de entrada y salida de este nodo representan como el nodo se transforma. Un tensor fluye (flows) a través del gráfico, lo cual es la razon de su nombre (TensorFlow).

Cada operador es una función fuertemente tipada que toma como entrada un tensor de una dimension y da como salida un tesnor de la misma dimension. La funcion es representada como un gráfico en donde <b>los operadores son nodos y los edges son representados como las interacciones entre los nodos.</b>

![TensorFlow Graph](img/tensorflow_graph.png)

Los algoritmos de TensorFlow son visibles facilmente. Estos pueden ser facilmente descritos por diagramas de flujo. En terminos tecnicos un diagrama de flujo es un <i><b>dataflow graph</b></i>. Como ya se menciono antes, cada flecha en el <i><b>dataflow graph</b></i> es llamado edge, y cada estado en el  <i><b>dataflow graph</b></i> es llamado un nodo.

El objetico de una sesion es de interpretar el codigo de Python en un  <i><b>dataflow graph</b></i> y despues asociar el "calculo" de cada nodo de el grafico a un CPU o un GPU.

### Ajustando configuraciones de session
Tambien se puede pasar opciones a <b>tf.Session</b>. Por ejemplo TensorFlow automaticamente determina la mejor manera de asignar un dispositivo GPU o CPU a una operacion, dependiendo en la disponibilidad. Se puede pasar una opcion adicional, <b> log_device_placement = True</b>, cuando se crea una sesión, como se verá a continuación donde se mostrará en donde exactamente en el hardware los "calculos" son evocados.

#### Registrar una sesión

In [26]:
import tensorflow as tf

#Definimos la matriz y la negamos
x = tf.constant([[1.,2.]])
negMatrix = tf.negative(x)

# Iniciamos una sesion con una configuracion especial pasada a el constructor para habilitar el registro
with tf.Session(config=tf.ConfigProto(log_device_placement = True)) as sess:
    result = sess.run(negMatrix)

print(result)

[[-1. -2.]]


Las sesiones son escenciales en el codigo de TensorFlow. Se necesita llamar a una sesión a que "corra" la matemática. Una sesión no solo "corre" una operacion gráfica, sino que tambien puede tomar <i>placeholders, variables y constantes como entradas</i>. Hasta el momento ya se uso las constantes, más adelante se vera el uso de <i>variables y placeholders.</i>

<li>
    <ol><i><b>Placeholder:- </b></i>Es un valor que no esta asignado pero será inicializado por la session cuando esta se ejecute. Tipicamente, los placeholders son la entrada y salida de los modelos.</ol>
    <ul><i><b>Variable:-</b></i>Es un valor que puede cambiar, como los parametros de un modelo de machine learning. Las variables deben ser iniciadas por la session antes de ser usadas.</ul>
    <ul><i><b>Constantes:-</b></i> Son valores que no cambian, como los hiperparametros o los settings</ul>
</li>