<h1>INTRODUCCION A TENSORFLOW</h1>
<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/1/11/TensorFlowLogo.svg/1200px-TensorFlowLogo.svg.png">

TensorFlow es una biblioteca de código abierto para aprendizaje automático a través de un rango de tareas, y desarrollado por Google para satisfacer sus necesidades de sistemas capaces de construir y entrenar redes neuronales para detectar y descifrar patrones y correlaciones, análogos al aprendizaje y razonamiento usados por los humanos. Actualmente es utilizado tanto en la investigación como en los productos de Google.
TensorFlow puede correr en múltiple CPUs y GPUs (con extensiones opcionales de CUDA para informática de propósito general en unidades de procesamiento gráfico). TensorFlow está disponible para Windows, Linux, macOS, y plataformas móviles que incluyen Android e iOS.

El nombre TensorFlow deriva de las operaciones que tales redes neuronales realizan sobre arrays multidimensionales de datos. Estos arrays multidimensionales son referidos como "tensores". En una primera versión los computos de TensorFlow se expresaban como stateful dataflow graphs , sin embargo, con la evolución de la biblioteca la forma de codificar estas redes se ha vuelto más imperativa.
TensorFlow 2.012 se centra en la simplicidad y la facilidad de uso, con actualizaciones importantes como (1) el modelo de ejecución (modo eager), consolidar el uso de una API intuitivas de alto nivel (basada en Keras) y el despliegue flexible de modelos en cualquier plataforma.

<img src="https://www.adictosaltrabajo.com/wp-content/uploads/2018/03/tensorflow_programming_environment.png">

<img src="https://developers.google.com/machine-learning/crash-course/images/TFHierarchy.svg?hl=es-419">

Su principio básico es simple: primero define en Python un gráfico de cómputos para realizar (por ejemplo, el de la Figura 9-1), y luego TensorFlow toma ese gráfico y lo ejecuta de manera eficiente utilizando el código de C ++ optimizado. 

<img src="https://miro.medium.com/max/1816/0*uLG6xpaZISYSSHkD">

<img src="https://www.gmv.com/blog_gmv/wp-content/uploads/Tools1.gif">

<img src="https://d1m75rqqgidzqn.cloudfront.net/wp-data/2020/03/06094458/image-1024x508.png">

Lo más importante es que es posible dividir el gráfico en varios fragmentos y ejecutarlos en paralelo en múltiples CPU o GPU (como se muestra en la Figura 9-2). TensorFlow también admite la computación distribuida, por lo que puede entrenar redes neuronales colosales en conjuntos de capacitación gigantescos en un tiempo razonable dividiendo los cálculos en cientos de servidores (consulte el Capítulo 12). TensorFlow puede entrenar una red con millones de parámetros en un conjunto de entrenamiento compuesto de miles de millones de instancias con millones de funciones cada uno. Esto no debería ser una sorpresa, ya que TensorFlow fue desarrollado por el equipo de Google Brain y potencia muchos de los servicios a gran escala de Google, como Google Cloud Speech, Google Photos y Google Search.

<img src="https://preview.redd.it/zumj51eh01g41.png?width=529&format=png&auto=webp&s=4905a3ca77867326c72e86223c964a41ddf8a12d">

Cuando TensorFlow fue de código abierto en noviembre de 2015, ya existían muchas bibliotecas de código abierto populares para el Aprendizaje Profundo (la Tabla 9-1 enumera algunas), y para ser justos, la mayoría de las funciones de TensorFlow ya existían en una biblioteca u otra. Sin embargo, el diseño limpio, la escalabilidad, la flexibilidad 1 de TensorFlow y la excelente documentación (sin mencionar el nombre de Google) lo llevaron rápidamente a la cima de la lista. En resumen, TensorFlow fue diseñado para ser flexible, escalable y listo para la producción, y los marcos existentes probablemente solo alcanzan a dos de los tres. Éstos son algunos de los aspectos más destacados de TensorFlow:<br>
• Se ejecuta no solo en Windows, Linux y macOS, sino también en dispositivos móviles, incluidos iOS y Android.
1 TensorFlow no se limita a redes neuronales o incluso a Aprendizaje automático; Podrías ejecutar simulaciones de física cuántica si quisieras.<br>
• Proporciona una API de Python muy simple llamada TF.Learn2 (tensorflow.con trib.learn), compatible con Scikit-Learn. Como verá, puede usarlo para entrenar varios tipos de redes neuronales en solo unas pocas líneas de código. Anteriormente era un proyecto independiente llamado Scikit Flow (o skflow).<br>
• También proporciona otra API simple llamada TF-slim (tensorflow.contrib.slim) para simplificar la construcción, entrenamiento y evaluación de redes neuronales.<br>
• Varias otras API de alto nivel se han construido de manera independiente sobre TensorFlow, como Keras o Pretty Tensor.<br>
• Su API principal de Python ofrece mucha más flexibilidad (a costa de una mayor complejidad) para crear todo tipo de cálculos, incluida cualquier arquitectura de red neuronal que se pueda imaginar.<br>
• Incluye implementaciones en C ++ altamente eficientes de muchas operaciones de LD, en particular las necesarias para construir redes neuronales. También hay una API de C ++ para definir sus propias operaciones de alto rendimiento.<br>
• Proporciona varios nodos de optimización avanzada para buscar los parámetros que minimizan una función de costo. Son muy fáciles de usar, ya que TensorFlow se encarga automáticamente de calcular los gradientes de las funciones que define. Esto se denomina diferenciación automática (o autodiff).<br>
• También viene con una gran herramienta de visualización llamada TensorBoard que le permite navegar por el gráfico de cómputo, ver las curvas de aprendizaje y más.<br>
• Google también lanzó un servicio en la nube para ejecutar gráfos TensorFlow.<br>
• Por último, pero no menos importante, tiene un equipo dedicado de desarrolladores apasionados y serviciales, y una comunidad en crecimiento que contribuye a mejorarlo. Es uno de los proyectos de código abierto más populares en GitHub, y se están construyendo cada vez más grandes proyectos (por ejemplo, visite la página de recursos en https://www.tensorflow.org/, o https: //github.com/jtoy/awesome-tensorflow). Para hacer preguntas técnicas, debe usar http://stackoverflow.com/ y etiquetar su pregunta con "tensorflow". Puede archivar errores y solicitudes de características a través de GitHub.<br>
Para discusiones generales, únete al grupo de Google.<br>
En este capítulo, veremos los conceptos básicos de TensorFlow, desde la instalación hasta la creación, ejecución, guardado y visualización de gráficos computacionales simples. Dominar estos conceptos básicos es importante antes de construir su primera red neuronal (lo cual haremos en el próximo capítulo).


Instalación
¡Empecemos! Suponiendo que instaló Jupyter y Scikit Learn siguiendo las instrucciones de instalación en el Capítulo 2, simplemente puede usar pip para instalar TensorFlow. Si creó un entorno aislado usando virtualenv, primero debe activarlo:

A continuación, instale TensorFlow:<br>
<b>$ pip3 install --upgrade tensorflow<br></b>
    
Para el soporte de GPU, necesita instalar tensorflow-gpu en lugar de tensorflow. Vea el Capítulo 12 para más detalles.<br>
Para probar su instalación, escriba el siguiente comando. Debe mostrar la versión de TensorFlow que instaló.<br>
<b>python3 -c 'import tensorflow; print(tensorflow.__version__)'

<h3>Creando tu primer gráfico y ejecutándolo en una sesión</h3><br>
El siguiente código crea el gráfico representado en la Figura 1

In [63]:
import tensorflow as tf
print(tf.__version__)

1.15.0


In [284]:
help(tf)
tf?
print(type(tf))



































































































































































































































































































Instructions for updating:
Use `tf.GraphKeys.GLOBAL_VARIABLES` instead.
Help on package tensorflow:

NAME
    tensorflow - TensorFlow root package

PACKAGE CONTENTS
    _api (package)
    app (package)
    audio (package)
    autograph (package)
    bitwise (package)
    compat (package)
    compiler (package)
    config (package)
    contrib (package)
    core (package)
    data (package)
    debugging (package)
    distribute (package)
    distributions (package)
    dtypes (package)
    errors (package)
    estimator (package)
    examples (package)
    experimental (package)
    feature_column (package)
    gfile (package)
    graph_util (package)
    image (package)
    initializers (package)
    io (package)
    keras (package)
    layers (package)
    linalg (package)
    lite (package)
    logging (package)
    lookup (package)
    losses (package)
    manip (package)
    math (package)
    metrics (package)
    nest (package)
    nn (package)
    profiler (package)
    pytho

In [64]:
x = tf.Variable(3, name="x")
y = tf.Variable(4, name="y")
f = x*x*y + y + 2
print("x",x)
print("tipo de x",type(x))
print("f",f)
print("tipo de x",type(f))

x <tf.Variable 'x:0' shape=() dtype=int32_ref>
tipo de x <class 'tensorflow.python.ops.variables.RefVariable'>
f Tensor("add_3:0", shape=(), dtype=int32)
tipo de x <class 'tensorflow.python.framework.ops.Tensor'>


¡Eso es todo al respecto! Lo más importante que hay que entender es que <b>este código no realiza ningún cálculo</b>, a pesar de que parece que lo hace (especialmente la última línea). Simplemente <b>crea un gráfico de cálculo. De hecho, incluso las variables aún no están inicializadas.</b> Para evaluar este gráfico, necesita abrir una sesión de TensorFlow y usarla para inicializar las variables y evaluar f. <b>Una sesión de TensorFlow se encarga de colocar las operaciones en dispositivos como CPU y GPU y de ejecutarlas, y contiene todos los valores de las variables.

Atencion:--->Grafos y sus ventajas<br>
Un componente esencial para entender TensorFlow es el grafo. Es importante destacar que con TensorFlow 2.0 se va a mover hacia el modelo de Eager Execution.

Asi de esta manera hay que tener en cuenta que para trabajar en tensorlfor hay que elaborar un grafo, 
este grafo se elabora con unas variables de entradas y unos nodos, donde los nodos son las operaciones entre los 
diferentes elementos del grafo

## Eval vs Run

In [66]:
tf.reset_default_graph()

x = tf.Variable(3, name="x")
y = tf.Variable(4, name="y")
z = x + y
f = x*x*y + y - z + 1

with tf.Session() as sess:
    x.initializer.run()
    y.initializer.run()
    resultz = z.eval()
    resultf1 = f.eval()
    resultf2 = sess.run(f)
    print('z =',resultz)
    print('f =',resultf1)
    print('f =',resultf2)

z = 7
f = 34
f = 34


In [67]:
tf.reset_default_graph()

x = tf.Variable(3, name="x")
y = tf.Variable(4, name="y")
z = x + y
f = x*x*y + y - z + 1

init = tf.global_variables_initializer()
with tf.Session() as sess:
    init.run()
    resultf,resultz = sess.run([f,z],feed_dict={x:1,y:1,z:1})
    print('z =',resultz)
    print('f =',resultf)

z = 1
f = 2


El siguiente código crea una sesión, inicializa las variables y las evalúa, y luego de f cierra la sesión ( lo que libera recursos):

In [68]:
sess = tf.Session()
sess.run(x.initializer)
sess.run(y.initializer)
result = sess.run(f)
print(result)
sess.close()

34


Tener que repetir sess.run () todo el tiempo es un poco engorroso, pero afortunadamente hay una mejor manera:

In [69]:
with tf.Session() as sess:
    x.initializer.run()
    y.initializer.run()
    result = f.eval()
print(result)

34


Dentro del <b>bloque with,</b> la sesión se establece como la sesión predeterminada. Llamar a x.initializer.run () es equivalente a llamar a tf.get_default_session().Run (x.initializer), y de manera similar f.eval() es equivalente a llamar a tf.get_default_session().Run (f). Esto hace que el código sea más fácil de leer. Además, la sesión se cierra automáticamente al final del bloque.

En lugar de ejecutar manualmente el inicializador para cada variable, puede usar la función <b>global_variables_initializer().</b> Tenga en cuenta que en realidad no realiza la inicialización de inmediato, sino que crea un nodo en el gráfico que inicializará todas las variables cuando se ejecute:

In [70]:
init = tf.global_variables_initializer() #inicializa todas las variables y no una por una como antes
#asi init prepara un nodo que se va a inicializar
with tf.Session() as sess:
    init.run() #inicializa el nodo e inicializa todas las variables
    result = f.eval()
print(result)

34


Dentro de Jupyter o dentro de un shell de Python, puede preferir crear una sesión interactiva. La única diferencia con una sesión regular es que cuando se crea una sesión interactiva, se configura automáticamente como la sesión predeterminada, por lo que no necesita un bloque (pero necesita cerrar la sesión manualmente cuando haya terminado): 

In [71]:
sess = tf.InteractiveSession()
init.run()
result = f.eval()
print(result)
sess.close()

34


Un programa TensorFlow generalmente se divide en dos partes:<br>
la primera parte construye un gráfico de cómputo (esto se llama la fase de construcción), <br>
y la segunda parte lo ejecuta (esta es la fase de ejecución).<br>
La fase de construcción generalmente construye un gráfico de cálculo que representa el modelo ML y los cálculos necesarios para entrenarlo. La fase de ejecución generalmente ejecuta un ciclo que evalúa un paso de entrenamiento repetidamente (por ejemplo, un paso por mini lote), mejorando gradualmente los parámetros del modelo. Vamos a pasar por un ejemplo en breve.

A manera de conlusion tenga en cuenta que tensorflow se divide en dos partes:
La primera parte es la fase de construccion del grafico donde usted declara las variables de entrada 
y sus respectivas operaciones que se van a realizar entre ellas las cuales son los nodos 
En el grafo, los nodos representan operaciones, variables y constantes.
Las aristas, las conexiones entre los nodos, son tensores. Los tensores representan datos y fluyen a través del grafo. 
Los datos llegan a nodos que realizan operaciones con ellos. 
Es por eso que se llama TensorFlow.
La segunda parte despues de haber declarado y construido el grafo de tensorflow consiste en la ejecucion del grafo, lo cual corresponde a realizar las diversas operaciones que se impusieron en los nodos.
Para que los valores fluyan a través del grafo, se debe hacer con una sesión.

In [72]:
tf.reset_default_graph() #reinicar un grafo  y sus variables
w=tf.constant([[3,2]],name="w",dtype=float) #creamos un nodo
u=w+5 #creamos un nodo encargado de sumar dos variables
v=3*u+w #creamos un nodo encargado de multiplicar y sumar dos variables
print(w)
print(u)
init = tf.global_variables_initializer() # creo un nodo que inicializa todas las variables anteriores
with tf.Session() as sess: #elaboramos un bloque with que me permite realizar la fase de ejecucion del grafo
#con tf.Session() llamar sess:
    init.run() #el nodo init lo inicializo y corro
    #ahora es posible aplicando el metodo eval() ver el valor de cada una de mis variables
    z=w.eval()
    print(z)
    u=u.eval()
    print(u)
    v=v.eval()
    print(v)
#al finalizar el bloque la sess se cierra automaticamente
print(w)

Tensor("w:0", shape=(1, 2), dtype=float32)
Tensor("add:0", shape=(1, 2), dtype=float32)
[[3. 2.]]
[[8. 7.]]
[[27. 23.]]
Tensor("w:0", shape=(1, 2), dtype=float32)


<h3>Manejo de grafos</h3>

Cualquier nodo que cree se agregará automáticamente al gráfico predeterminado:

In [73]:
x1 = tf.Variable(1)
x1.graph is tf.get_default_graph() #grafico predeterminado 

True

En la mayoría de los casos, esto está bien, pero a veces es posible que desee administrar múltiples gráficos independientes. Puedes hacer esto creando un nuevo gráfico y convirtiéndolo temporalmente en el gráfico predeterminado dentro de un bloque with, de esta manera:

In [74]:
graph1 = tf.Graph()
with graph1.as_default():
    x2 = tf.Variable(2)
    print(x2)
x2.graph is graph1

<tf.Variable 'Variable:0' shape=() dtype=int32_ref>


True

In [75]:
x2.graph is tf.get_default_graph()

False

<b>---OJO---</b> <br>
En Jupyter (o en un shell de Python), es común ejecutar los mismos comandos más de una vez mientras está experimentando. Como resultado, puede terminar con un gráfico predeterminado que contiene muchos nodos duplicados. Una solución es reiniciar el kernel de Jupyter (o el shell de Python), pero una solución más conveniente es simplemente restablecer el gráfico predeterminado ejecutando tf.reset_default_graph ().

In [76]:
tf.reset_default_graph() #ojo siempre va el inicio de todo grafo para evitar duplicar el grafo a volver a correr celdas en jupyter

In [77]:
x1.graph is tf.get_default_graph()

False

In [78]:
tf.reset_default_graph() #reinicar un grafo  y sus variables
Migrafo=tf.Graph() #nombre mi grafo predetermiando
with Migrafo.as_default(): #creo un bloque donde voy a construir mi grafo
    w=tf.constant([[3,2]],name="w",dtype=float) #creamos un nodo
    u=w+5 #creamos un nodo encargado de sumar dos variables
    v=3*u+w #creamos un nodo encargado de multiplicar y sumar dos variables
    print(w)
    print(u)
    init = tf.global_variables_initializer() # creo un nodo que inicializa todas las variables anteriores
    with tf.Session() as sess: #elaboramos un bloque with que me permite realizar la fase de ejecucion del grafo
#con tf.Session() llamar sess:
        init.run() #el nodo init lo inicializo y corro
    #ahora es posible aplicando el metodo eval() ver el valor de cada una de mis variables
        z=w.eval()
        print(z)
        u=u.eval()
        print(u)
        v=v.eval()
        print(v)
#al finalizar el bloque la sess se cierra automaticamente
print("valor de variables")
print(w)
print(z)

Tensor("w:0", shape=(1, 2), dtype=float32)
Tensor("add:0", shape=(1, 2), dtype=float32)
[[3. 2.]]
[[8. 7.]]
[[27. 23.]]
valor de variables
Tensor("w:0", shape=(1, 2), dtype=float32)
[[3. 2.]]


Vea la documentación de la clase Graph para como manejar explícitamente múltiples grafos.

In [79]:
#ejemplo de un contador con tensorflow
tf.reset_default_graph()

contador=tf.Variable(0, name="conta")
uno=tf.constant(1,name="constante")
suma=contador+uno
actualizacion=tf.assign(contador,suma)

init=tf.global_variables_initializer()

with tf.Session() as sess:
    init.run()
    print(suma.eval())
    print("valor de actualiacion", actualizacion.eval())
    
    for i in range(5):
        resultadofinal=actualizacion.eval()
        print(resultadofinal)



1
valor de actualiacion 1
2
3
4
5
6


Otra forma de extraer las salidas de los tensores y de observar sus valores aparte 
del metodo .eval sobre los tensores, es aplicar el metodo run sobre el objeto sess y pasarle como argumento el
tensor del cual quiere el resultado

In [80]:
#ejemplo de un contador con tensorflow
tf.reset_default_graph()

contador=tf.Variable(0, name="conta")
uno=tf.constant(1,name="constante")
suma=contador+uno
actualizacion=tf.assign(contador,suma)

init=tf.global_variables_initializer()

with tf.Session() as sess:
    init.run()
    print(suma.eval())
    print("valor de actualiacion", actualizacion.eval())
    
    for i in range(5):
        resultadofinal,sumato=sess.run([actualizacion,suma])
        print(resultadofinal)
        print(sumato)

1
valor de actualiacion 1
2
2
3
3
4
4
5
5
6
6


<h3>Ciclo de vida de un valor de nodo </h3>

Cuando evalúa un nodo, TensorFlow determina automáticamente el conjunto de nodos de los que depende y primero evalúa estos nodos. Por ejemplo, considere el siguiente código:

In [81]:
w = tf.constant(3)
x = w + 2
y = x + 5
z = x * 3
with tf.Session() as sess:
    print(y.eval()) # 10
    print(z.eval()) # 15

10
15


Primero, este código define un gráfico muy simple. Luego inicia una sesión y ejecuta el gráfico para evaluar y: TensorFlow detecta automáticamente que y depende de w, que depende de x, por lo que primero evalúa w, luego x, luego y, y devuelve el valor de y.<br>
Finalmente, el código ejecuta el gráfico para evaluar z. Una vez más, TensorFlow detecta que primero debe evaluar w y x. Es importante tener en cuenta que no reutilizará el resultado de la evaluación previa de w y x. En resumen, el código anterior evalúa w y x dos veces.

<b>Todos los valores de los nodos se eliminan entre las ejecuciones del gráfico, excepto los valores variables, que la sesión mantiene en las ejecuciones del gráfico</b> (las colas y los lectores también mantienen cierto estado, como veremos en el Capítulo 12).<br>
Una variable comienza su vida útil cuando se ejecuta su inicializador, y termina cuando se cierra la sesión.

Si desea evaluar y y z eficientemente, sin evaluar wyx dos veces como en el código anterior, debe solicitar a TensorFlow que evalúe tanto y como z en solo una ejecución de gráfico, como se muestra en el siguiente código:

In [82]:
with tf.Session() as sess:
    y_val, z_val = sess.run([y, z])
    print(y_val) # 10
    print(z_val) # 15

10
15


<h3>Regresión lineal con TensorFlow</h3>

Las operaciones de TensorFlow (también llamadas ops para abreviar) pueden tomar cualquier cantidad de entradas y producir cualquier cantidad de salidas. Por ejemplo, las operaciones de suma y multiplicación toman dos entradas y producen una salida. Las constantes y las variables no toman ninguna entrada (se denominan operaciones de origen). Las entradas y salidas son matrices multidimensionales, llamadas tensores (de ahí el nombre de "flujo tensor"). Al igual que las matrices NumPy, los tensores tienen un tipo y una forma. De hecho, en la API de Python, los tensores están representados simplemente por NumPy ndarrays. Por lo general, contienen flotadores, pero también puede usarlos para transportar cadenas (matrices de bytes arbitrarias).

Hasta ahora, en los ejemplos, los tensores solo contenían un único valor escalar, pero, por supuesto, puede realizar cálculos en arreglos de cualquier forma. Por ejemplo, el siguiente código manipula matrices 2D para realizar Regresión lineal en el conjunto de datos de vivienda de California (presentado en el Capítulo 2). Comienza por buscar el conjunto de datos; luego agrega una función de entrada de sesgo adicional (x0 = 1) a todas las instancias de entrenamiento (lo hace usando NumPy para que se ejecute inmediatamente); luego crea dos nodos constantes de TensorFlow, X y y, para mantener estos datos y los objetivos, 4 y utiliza algunas de las operaciones de matriz proporcionadas por Tensor-Flow para definir theta. Estas funciones matriciales (transpose (), matmul () y matrix_inverse ()) se explican por sí mismas, pero como de costumbre no realizan ningún cálculo de inmediato; en su lugar, crean nodos en el gráfico que los realizarán cuando se ejecute el gráfico. Puede reconocer que la definición de theta corresponde a la Ecuación Normal (θ = XT · X) –1 · XT · y; ver capítulo 4). Finalmente, el código crea una sesión y la utiliza para evaluar theta.

In [86]:
#REGRESION LINEAL 
import numpy as np
from sklearn.datasets import fetch_california_housing
housing = fetch_california_housing() #buscamos el conjunto de datos
m, n = housing.data.shape
housing_data_plus_bias = np.c_[np.ones((m, 1)), housing.data] #vector de interseccion  y datos
X = tf.constant(housing_data_plus_bias, dtype=tf.float32, name="X") #creamos nodo constante
y = tf.constant(housing.target.reshape(-1, 1), dtype=tf.float32, name="y") #vector de etiquetas
XT = tf.transpose(X) #transpuesta
theta = tf.matmul(tf.matmul(tf.matrix_inverse(tf.matmul(XT, X)), XT), y) #matriz de paramrtros
with tf.Session() as sess:
    theta_value = theta.eval()
print(theta_value)

[[-3.6894890e+01]
 [ 4.3661433e-01]
 [ 9.4453208e-03]
 [-1.0704148e-01]
 [ 6.4345831e-01]
 [-3.9632569e-06]
 [-3.7880042e-03]
 [-4.2093179e-01]
 [-4.3400639e-01]]


<h3>Implementando Gradiente Descendente</h3>

Intentemos utilizar el Descenso por Gradiente de lotes (presentado en el Capítulo 4) en lugar de la Ecuación Normal. Primero, lo haremos al calcular manualmente los gradientes, luego usaremos la función Autodiff de TensorFlow para permitir que TensorFlow calcule los gradientes automáticamente, y finalmente usaremos un par de optimizadores listos para usar de TensorFlow.
Cuando use Gradient Descent, <b>recuerde que es importante normalizar primero los vectores de entidades de entrada, o el entrenamiento puede ser mucho más lento.</b> Puede hacer esto utilizando TensorFlow, NumPy, StandardScaler de Scikit-Learn o cualquier otra solución que prefiera. El siguiente código asume que esta normalización ya se ha realizado.

<h3>Computando manualmente los gradientes</h3>

<img src="https://miro.medium.com/max/2110/1*f3AVL6VGeoQDKyjl8Bw9KA.png">

Recuerde que J(theta) es la funcion de costo que depende de la variable theta que es la matriz de parametros a entrenar

El siguiente código debe ser bastante autoexplicativo, excepto por algunos elementos nuevos:<br>
• La función random_uniform () crea un nodo en el gráfico que generará un tensor que contiene valores aleatorios, dada su forma y rango de valores, al igual que la función rand () de NumPy.<br>
• La función assign () crea un nodo que asignará un nuevo valor a una variable.<br>
En este caso, implementa el paso de Descenso de degradado por lotes θ (siguiente paso) = θ –η∇θMSE (θ).<br>
• El bucle principal ejecuta el paso de entrenamiento una y otra vez (n_epochs veces), y cada 100 iteraciones imprime el error cuadrático medio actual (mse). Debería ver el MSE bajar en cada iteración. 

In [87]:
#normalizando datos
print(housing_data_plus_bias)
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
print(scaler.fit(housing_data_plus_bias))
scaled_housing_data_plus_bias=scaler.transform(housing_data_plus_bias)

[[   1.            8.3252       41.         ...    2.55555556
    37.88       -122.23      ]
 [   1.            8.3014       21.         ...    2.10984183
    37.86       -122.22      ]
 [   1.            7.2574       52.         ...    2.80225989
    37.85       -122.24      ]
 ...
 [   1.            1.7          17.         ...    2.3256351
    39.43       -121.22      ]
 [   1.            1.8672       18.         ...    2.12320917
    39.43       -121.32      ]
 [   1.            2.3886       16.         ...    2.61698113
    39.37       -121.24      ]]
StandardScaler(copy=True, with_mean=True, with_std=True)


In [88]:
#implementando gradiente descendente
n_epochs = 1000
learning_rate = 0.01
X = tf.constant(scaled_housing_data_plus_bias, dtype=tf.float32, name="X")
y = tf.constant(housing.target.reshape(-1, 1), dtype=tf.float32, name="y")
theta = tf.Variable(tf.random_uniform([n + 1, 1], -1.0, 1.0), name="theta")#creamos un nodo en el grafico que contiene un tensor aleatorio
y_pred = tf.matmul(X, theta, name="predictions")
error = y_pred - y
mse = tf.reduce_mean(tf.square(error), name="mse") #error cuadratico medio
gradients = 2/m * tf.matmul(tf.transpose(X), error)
training_op = tf.assign(theta, theta - learning_rate * gradients)#crea un nodo que asignara un nuevo valor a la variable theta (entrenamiento)
init = tf.global_variables_initializer()
with tf.Session() as sess:
    sess.run(init)
    for epoch in range(n_epochs):
        if epoch % 100 == 0:
            print("Epoch", epoch, "MSE =", mse.eval())
        sess.run(training_op)
    best_theta = theta.eval()
print(best_theta)

Epoch 0 MSE = 8.753064
Epoch 100 MSE = 5.078356
Epoch 200 MSE = 4.978504
Epoch 300 MSE = 4.9330473
Epoch 400 MSE = 4.9000673
Epoch 500 MSE = 4.875754
Epoch 600 MSE = 4.857771
Epoch 700 MSE = 4.84443
Epoch 800 MSE = 4.834498
Epoch 900 MSE = 4.827076
[[ 0.36067486]
 [ 0.87087566]
 [ 0.16627048]
 [-0.26906425]
 [ 0.27589747]
 [ 0.01224804]
 [-0.04422565]
 [-0.51474535]
 [-0.48660278]]


<h3>Utilizando autodiff (MUY IMPORTANTE)</h3>

El código anterior funciona bien, pero requiere derivar matemáticamente los gradientes de la función de costo (MSE). En el caso de la Regresión Lineal, es razonablemente fácil, pero si tuviera que hacer esto con redes neuronales profundas, tendría un gran dolor de cabeza: sería tedioso y propenso a errores. Podría usar la diferenciación simbólica para encontrar automáticamente las ecuaciones para las derivadas parciales, pero el código resultante no sería necesariamente muy eficiente.

Afortunadamente, la función Autodiff de TensorFlow viene al rescate: puede calcular los gradientes de forma automática y eficiente. Simplemente reemplace la línea de gradientes = ... en el código de Descenso de degradado en la sección anterior con la siguiente línea, y el código continuará funcionando bien:

In [89]:
n_epochs = 1000
learning_rate = 0.01
X = tf.constant(scaled_housing_data_plus_bias, dtype=tf.float32, name="X")
y = tf.constant(housing.target.reshape(-1, 1), dtype=tf.float32, name="y")
theta = tf.Variable(tf.random_uniform([n + 1, 1], -1.0, 1.0), name="theta")#creamos un nodo en el grafico que contiene un tensor aleatorio
y_pred = tf.matmul(X, theta, name="predictions")
error = y_pred - y
mse = tf.reduce_mean(tf.square(error), name="mse") #ERROR CUADRATICO MEDIO
gradients = tf.gradients(mse, [theta])[0] #calcula los gradientes respecto a una variable
training_op = tf.assign(theta, theta - learning_rate * gradients)#crea un nodo que asginara un nuevo valor a la variable
init = tf.global_variables_initializer()
with tf.Session() as sess:
    sess.run(init)
    for epoch in range(n_epochs):
        if epoch % 100 == 0:
            print("Epoch", epoch, "MSE =", mse.eval())
        sess.run(training_op)
    best_theta = theta.eval()
print(best_theta)

Epoch 0 MSE = 10.505316
Epoch 100 MSE = 4.9801135
Epoch 200 MSE = 4.913315
Epoch 300 MSE = 4.8833055
Epoch 400 MSE = 4.861843
Epoch 500 MSE = 4.846231
Epoch 600 MSE = 4.8348503
Epoch 700 MSE = 4.8265414
Epoch 800 MSE = 4.8204656
Epoch 900 MSE = 4.8160143
[[-0.27464008]
 [ 0.8313095 ]
 [ 0.15279107]
 [-0.20564707]
 [ 0.22844288]
 [ 0.00785827]
 [-0.04224183]
 [-0.65016365]
 [-0.6179643 ]]


<b>La función gradientes () toma una op (en este caso mse) y una lista de variables (en este caso solo theta), y crea una lista de ops (una por variable) para calcular los gradientes de la op con respecto a cada una variable. Por lo tanto, el nodo de gradientes calculará el vector de gradiente del MSE con respecto a theta.</b><br>
Hay cuatro enfoques principales para calcular gradientes automáticamente. Se resumen en la Tabla 9-2. 
TensorFlow usa el modo automático de modo inverso, que es perfecto (eficiente y preciso) cuando hay muchas entradas y pocas salidas, como suele ser el caso en las redes neuronales. Calcula todas las derivadas parciales de las salidas con respecto a todas las entradas en solo noutputs + 1 gráfico de recorridos. Si está interesado en cómo funciona esta magia, consulte el Apéndice D.

<img src="https://lh3.googleusercontent.com/proxy/wsvJKuevOy13wUzISr51f41lVvxMV9Wf1_OfFRoBA0s4V1FmvlKJW4aqiC8tRjFoE2bpDG3wmhUHr0jnPEnOllxqj7MGW3BnNXccDwt2AiWZw9N0xXWLAQ">

In [90]:
tf.reset_default_graph()
valx=3
x = tf.Variable(valx,dtype=tf.float32)
f=x**2
df=2*x
init = tf.global_variables_initializer()
with tf.Session() as sess:
    init.run()
    for i in range(1000):
        resf,resd=sess.run([f,df],feed_dict={x:valx})
        valx-=0.01*resd
    print(valx)

5.048902061818402e-09


## Autodiff

In [91]:
tf.reset_default_graph()
valx=3
valy=-3
x = tf.Variable(valx,dtype=tf.float32)
y = tf.Variable(valy,dtype=tf.float32)
f=(x-5)**2+(y+5)**2
df=tf.gradients(f, [x,y])

init = tf.global_variables_initializer()
with tf.Session() as sess:
    init.run()
    for i in range(1000):
        resf,resd=sess.run([f,df],feed_dict={x:valx,y:valy})
        valx-=0.01*resd[0]
        valy-=0.01*resd[1]
    print(valx,valy)

4.999999771118144 -4.999999771118144


<h3>Utilizando un optimizador</h3>

Entonces TensorFlow calcula los gradientes por ti. Pero se vuelve aún más fácil: también proporciona una serie de optimizadores listos para usar, incluido un optimizador de gradiente de pendiente. Simplemente puede reemplazar los gradientes anteriores = ... y training_op = ... líneas con el siguiente código, y una vez más, todo funcionará bien: 

In [92]:
n_epochs = 1000
learning_rate = 0.01
X = tf.constant(scaled_housing_data_plus_bias, dtype=tf.float32, name="X")
y = tf.constant(housing.target.reshape(-1, 1), dtype=tf.float32, name="y")
theta = tf.Variable(tf.random_uniform([n + 1, 1], -1.0, 1.0), name="theta")#creamos un nodo en el grafico que contiene un tensor aleatorio
y_pred = tf.matmul(X, theta, name="predictions")
error = y_pred - y
mse = tf.reduce_mean(tf.square(error), name="mse")
optimizer = tf.train.GradientDescentOptimizer(learning_rate=learning_rate)
training_op = optimizer.minimize(mse)
init = tf.global_variables_initializer()
with tf.Session() as sess:
    sess.run(init)
    for epoch in range(n_epochs):
        if epoch % 100 == 0:
            print("Epoch", epoch, "MSE =", mse.eval())
        sess.run(training_op)
    best_theta = theta.eval()
print(best_theta)

Epoch 0 MSE = 6.775647
Epoch 100 MSE = 4.9083295
Epoch 200 MSE = 4.8687673
Epoch 300 MSE = 4.8534102
Epoch 400 MSE = 4.84228
Epoch 500 MSE = 4.8338013
Epoch 600 MSE = 4.827287
Epoch 700 MSE = 4.8222556
Epoch 800 MSE = 4.818348
Epoch 900 MSE = 4.8152986
[[ 0.5699029 ]
 [ 0.8962492 ]
 [ 0.15066113]
 [-0.35509664]
 [ 0.36379096]
 [ 0.00623999]
 [-0.04344617]
 [-0.6047029 ]
 [-0.58135617]]


Si desea utilizar un tipo diferente de optimizador, solo necesita cambiar una línea. Por ejemplo, puede usar un optimizador de impulso (que a menudo converge mucho más rápido que Gradient Descent; consulte el Capítulo 11) definiendo el optimizador de esta manera:

In [93]:
n_epochs = 1000
learning_rate = 0.01
X = tf.constant(scaled_housing_data_plus_bias, dtype=tf.float32, name="X")
y = tf.constant(housing.target.reshape(-1, 1), dtype=tf.float32, name="y")
theta = tf.Variable(tf.random_uniform([n + 1, 1], -1.0, 1.0), name="theta")#creamos un nodo en el grafico que contiene un tensor aleatorio
y_pred = tf.matmul(X, theta, name="predictions")
error = y_pred - y
mse = tf.reduce_mean(tf.square(error), name="mse")
optimizer = tf.train.MomentumOptimizer(learning_rate=learning_rate,momentum=0.9) #optimizador en gradiente descendente
training_op = optimizer.minimize(mse)
init = tf.global_variables_initializer()
with tf.Session() as sess:
    sess.run(init)
    for epoch in range(n_epochs):
        if epoch % 100 == 0:
            print("Epoch", epoch, "MSE =", mse.eval())
        sess.run(training_op)
    best_theta = theta.eval()
print(best_theta)

Epoch 0 MSE = 8.651561
Epoch 100 MSE = 4.809506
Epoch 200 MSE = 4.803724
Epoch 300 MSE = 4.80331
Epoch 400 MSE = 4.8032613
Epoch 500 MSE = 4.8032546
Epoch 600 MSE = 4.803254
Epoch 700 MSE = 4.8032537
Epoch 800 MSE = 4.8032546
Epoch 900 MSE = 4.803254
[[ 0.6296239 ]
 [ 0.8296268 ]
 [ 0.11875302]
 [-0.26554105]
 [ 0.3057079 ]
 [-0.00450267]
 [-0.03932653]
 [-0.89986926]
 [-0.8705251 ]]


<h3>Alimentando datos al algoritmo de entrenamiento (muy importante)</h3>

Intentemos modificar el código anterior para implementar Mini-batch Gradient Descent. Para esto, necesitamos una manera de reemplazar X e y en cada iteración con el siguiente mini lote. La forma más sencilla de hacer esto es <b>usar nodos de marcadores de posición (placeholder).</b>

Estos nodos son especiales porque en realidad no realizan ningún cálculo, simplemente emiten los datos que usted les indica que generen en tiempo de ejecución. Normalmente se utilizan para pasar los datos de entrenamiento a TensorFlow durante el entrenamiento. Si no especifica un valor en tiempo de ejecución para un encaje, obtendrá una excepción.

Para crear un nodo de marcador de posición, debe llamar a la función de PLACEHOLDER() y especificar el tipo de datos del tensor de salida. Opcionalmente, también puede especificar su forma, si desea imponerla. Si especifica Ninguno (None) para una dimensión, significa "cualquier tamaño". Por ejemplo, el siguiente código crea un nodo marcador de posición A, y también un nodo B = A + 5. Cuando evaluamos B, pasamos un feed_dict a eval( ) Método que especifica el valor de A.
Tenga en cuenta que A debe tener rango 2 (es decir, debe ser bidimensional) y debe haber tres columnas (o, de lo contrario, se genera una excepción), pero puede tener cualquier número de filas.

In [94]:
A = tf.placeholder(tf.float32, shape=(None, 3))
B = A + 5
with tf.Session() as sess:
    B_val_1 = B.eval(feed_dict={A: [[1, 2, 3]]})
    B_val_2 = B.eval(feed_dict={A: [[4, 5, 6], [7, 8, 9]]})
print(B_val_1)
print(B_val_2)

[[6. 7. 8.]]
[[ 9. 10. 11.]
 [12. 13. 14.]]


Realmente puede alimentar la salida de cualquier operación, no solo marcadores de posición.En este caso, TensorFlow no intenta evaluar estas operaciones; Utiliza los valores que le das.

Para implementar Mini-batch Gradient Descent, solo necesitamos modificar un poco el código existente. Primero cambie la definición de X e y en la fase de construcción para convertirlos en nodos de marcadores de posición:

In [95]:
import numpy as np
from sklearn.datasets import fetch_california_housing
housing = fetch_california_housing() #buscamos el conjunto de datos
m, n = housing.data.shape
n_epochs = 1000
learning_rate = 0.01
X = tf.placeholder(tf.float32, shape=(None, n + 1), name="X")
y = tf.placeholder(tf.float32, shape=(None, 1), name="y")
theta = tf.Variable(tf.random_uniform([n + 1, 1], -1.0, 1.0), name="theta")#creamos un nodo en el grafico que contiene un tensor aleatorio
y_pred = tf.matmul(X, theta, name="predictions")
error = y_pred - y
mse = tf.reduce_mean(tf.square(error), name="mse")
optimizer = tf.train.MomentumOptimizer(learning_rate=learning_rate,momentum=0.9)
training_op = optimizer.minimize(mse)
init = tf.global_variables_initializer()


Luego defina el tamaño del lote y calcule el número total de lotes:

In [96]:
batch_size = 2064
n_batches = int(np.ceil(m / batch_size))
print(n_batches)

10


In [97]:
import numpy.random as rnd
def fetch_batch(epoch, batch_index, batch_size):

    rnd.seed(epoch * n_batches + batch_index)
    indices = rnd.randint(m, size=batch_size)

    X_batch = scaled_housing_data_plus_bias[indices]
    y_batch = housing.target.reshape(-1, 1)[indices]

    return X_batch, y_batch

Finalmente, en la fase de ejecución, obtenga los mini lotes uno por uno, luego proporcione el valor de X e y mediante el parámetro feed_dict al evaluar un nodo que depende de cualquiera de ellos.

In [98]:
with tf.Session() as sess:
    sess.run(init)
    for epoch in range(n_epochs):
        for batch_index in range(n_batches):
            X_batch1, y_batch1 = fetch_batch(epoch, batch_index, batch_size)
            sess.run(training_op, feed_dict={X: X_batch1, y: y_batch1})
        if epoch % 100 == 0:
            print("Epoch", epoch, "MSE =", mse.eval(feed_dict={X: X_batch1, y: y_batch1}))
    best_theta = theta.eval()
    print(best_theta )

Epoch 0 MSE = 5.058105
Epoch 100 MSE = 4.788532
Epoch 200 MSE = 4.8319993
Epoch 300 MSE = 4.7781167
Epoch 400 MSE = 4.8066754
Epoch 500 MSE = 4.8184795
Epoch 600 MSE = 4.7169046
Epoch 700 MSE = 4.689725
Epoch 800 MSE = 4.919059
Epoch 900 MSE = 4.7802706
[[-0.50042367]
 [ 0.82605994]
 [ 0.1323493 ]
 [-0.27672535]
 [ 0.3296239 ]
 [-0.01730829]
 [-0.03424422]
 [-0.89796126]
 [-0.88873976]]


ATENCION: No necesitamos pasar el valor de X e y al evaluar theta, ya que no depende de ninguno de ellos.

<H3>Guardando y restaurando modelos</H3>

Una vez que haya entrenado a su modelo, debe guardar sus parámetros en el disco para poder volver a él cuando lo desee, usarlo en otro programa, compararlo con otros modelos, etc. Además, es probable que desee guardar los puntos de control (checkpoints) a intervalos regulares durante el entrenamiento, de modo que si su computadora falla durante el entrenamiento, puede continuar desde el último punto de control en lugar de comenzar de cero.
TensorFlow hace que guardar y restaurar un modelo sea muy fácil. Simplemente cree un nodo Saver al final de la fase de construcción (después de crear todos los nodos variables); luego, en la fase de ejecución, simplemente llame a su método save () cuando quiera guardar el modelo, pasándole la sesión y la ruta del archivo de punto de control:

In [99]:
tf.reset_default_graph()
import numpy as np
from sklearn.datasets import fetch_california_housing
housing = fetch_california_housing() #buscamos el conjunto de datos
m, n = housing.data.shape
n_epochs = 1000
learning_rate = 0.01
X = tf.placeholder(tf.float32, shape=(None, n + 1), name="X")
y = tf.placeholder(tf.float32, shape=(None, 1), name="y")
theta = tf.Variable(tf.random_uniform([n + 1, 1], -1.0, 1.0), name="theta")#creamos un nodo en el grafico que contiene un tensor aleatorio
y_pred = tf.matmul(X, theta, name="predictions")
error = y_pred - y
mse = tf.reduce_mean(tf.square(error), name="mse")
optimizer = tf.train.AdamOptimizer(learning_rate=learning_rate) #Optimizador
training_op = optimizer.minimize(mse) 
init = tf.global_variables_initializer()
saver = tf.train.Saver() #importante poner nodo saver al final de grafo para guardar modelo

In [100]:
with tf.Session() as sess:
    sess.run(init)
    for epoch in range(n_epochs):
        for batch_index in range(n_batches):
            X_batch1, y_batch1 = fetch_batch(epoch, batch_index, batch_size)
            sess.run(training_op, feed_dict={X: X_batch1, y: y_batch1})
        if epoch % 100 == 0:
            print("Epoch", epoch, "MSE =", mse.eval(feed_dict={X: X_batch1, y: y_batch1}))
    best_theta = theta.eval()
    print(best_theta)
    save_path = saver.save(sess, "/home/andres/Escritorio/modelo_guardado.ckpt") #guardar modelo se le pasa la sesion y la ruta
    #saver = tf.train.Saver({"pesos": theta})


Epoch 0 MSE = 6.821538
Epoch 100 MSE = 4.786411
Epoch 200 MSE = 4.8272457
Epoch 300 MSE = 4.7731595
Epoch 400 MSE = 4.810421
Epoch 500 MSE = 4.816365
Epoch 600 MSE = 4.7150335
Epoch 700 MSE = 4.687723
Epoch 800 MSE = 4.918627
Epoch 900 MSE = 4.778976
[[ 0.10532928]
 [ 0.8271039 ]
 [ 0.12446978]
 [-0.28168753]
 [ 0.30975032]
 [-0.02107869]
 [-0.03479116]
 [-0.89592403]
 [-0.88862276]]


In [101]:
print(best_theta)

[[ 0.10532928]
 [ 0.8271039 ]
 [ 0.12446978]
 [-0.28168753]
 [ 0.30975032]
 [-0.02107869]
 [-0.03479116]
 [-0.89592403]
 [-0.88862276]]


Restaurar un modelo es igual de fácil: crea un Saver al final de la fase de construcción como antes, pero al comienzo de la fase de ejecución, en lugar de inicializar las variables con el nodo de inicio, llama al método restore () del objeto Saver:

Por defecto, un Saver guarda y restaura todas las variables con su propio nombre, pero si necesita más control, puede especificar qué variables guardar o restaurar, y qué nombres usar. Por ejemplo, el siguiente Saver guardará o restaurará solo la variable theta bajo los pesos de nombre: 

In [104]:
tf.reset_default_graph()
import numpy as np
from sklearn.datasets import fetch_california_housing
housing = fetch_california_housing() #buscamos el conjunto de datos
m, n = housing.data.shape
n_epochs = 1000
learning_rate = 0.01
X = tf.placeholder(tf.float32, shape=(None, n + 1), name="X")
y = tf.placeholder(tf.float32, shape=(None, 1), name="y")
theta = tf.Variable(tf.random_uniform([n + 1, 1], -1.0, 1.0), name="theta")#creamos un nodo en el grafico que contiene un tensor aleatorio
y_pred = tf.matmul(X, theta, name="predictions")
error = y_pred - y
mse = tf.reduce_mean(tf.square(error), name="mse")
optimizer = tf.train.AdamOptimizer(learning_rate=learning_rate) #Optimizador
training_op = optimizer.minimize(mse) 
init = tf.global_variables_initializer()
saver = tf.train.Saver() #importante poner nodo saver al final de grafo para guardar modelo

In [105]:
with tf.Session() as sess:
    saver.restore(sess, "/home/andres/Escritorio/modelo_guardado.ckpt")
    mejortheta=theta.eval()
    print(mse.eval(feed_dict={X: scaled_housing_data_plus_bias, y: housing.target.reshape(-1, 1)}))
    print(theta.eval())


INFO:tensorflow:Restoring parameters from /home/andres/Escritorio/modelo_guardado.ckpt
4.8043704
[[ 0.10532928]
 [ 0.8271039 ]
 [ 0.12446978]
 [-0.28168753]
 [ 0.30975032]
 [-0.02107869]
 [-0.03479116]
 [-0.89592403]
 [-0.88862276]]


<h3>Visualización del gráfico y las curvas de entrenamiento con TensorBoard</h3> 

<img src="https://guru99.es/wp-content/uploads/2020/02/080618_0516_Tensorboard1.png">

Así que ahora tenemos un gráfico de cómputo que entrena un modelo de regresión lineal usando un descenso de gradiente de mini lotes, y estamos guardando puntos de control a intervalos regulares.
Suena sofisticado, ¿no? Sin embargo, todavía estamos confiando en la función de imprimir () para visualizar el progreso durante el entrenamiento. Hay una mejor manera: entrar en TensorBoard. Si lo alimenta con algunas estadísticas de entrenamiento, mostrará agradables visualizaciones interactivas de estas estadísticas en su navegador web (por ejemplo, curvas de aprendizaje). También puede proporcionarle la definición del gráfo y le dará una gran interfaz para navegar a través de él. Esto es muy útil para identificar errores en el gráfo, para encontrar cuellos de botella, etc.

El primer paso es ajustar un poco su programa para que escriba la definición del gráfo y algunas estadísticas de entrenamiento, por ejemplo, el error de entrenamiento (MSE), en un directorio de registro del que TensorBoard leerá. <b>Debe usar un directorio de registro diferente cada vez que ejecute su programa, de lo contrario, TensorBoard combinará las estadísticas de diferentes ejecuciones, lo que desordenará las visualizaciones. La solución más sencilla para esto es incluir una marca de tiempo en el nombre del directorio de registro.</b> Agregue el siguiente código al inicio del programa:

In [52]:
#Visualizando el grafo y las curvas de entrenamiento usando TensorBoard
from datetime import datetime
now = datetime.utcnow().strftime("%Y%m%d%H%M%S")
root_logdir = "tf_logs"
logdir = "{}/run-{}/".format(root_logdir, now)


A continuación, agregue el siguiente código al final de la fase de construcción:

In [53]:
tf.reset_default_graph()
import numpy as np
from sklearn.datasets import fetch_california_housing
housing = fetch_california_housing() #buscamos el conjunto de datos
m, n = housing.data.shape
n_epochs = 1000
learning_rate = 0.01
X = tf.placeholder(tf.float32, shape=(None, n + 1), name="X")
y = tf.placeholder(tf.float32, shape=(None, 1), name="y")
theta = tf.Variable(tf.random_uniform([n + 1, 1], -1.0, 1.0), name="PESOS")#creamos un nodo en el grafico que contiene un tensor aleatorio
y_pred = tf.matmul(X, theta, name="PREDICCIONES")
error = y_pred - y
mse = tf.reduce_mean(tf.square(error), name="MSE-JULI")
optimizer = tf.train.MomentumOptimizer(learning_rate=learning_rate,momentum=0.9,name="OPTIMIZADOR")
training_op = optimizer.minimize(mse,name="TRAINING")
mse_summary = tf.summary.scalar('MSE-JULIAN', mse) #nueva linea
file_writer = tf.summary.FileWriter(logdir, tf.get_default_graph()) #nueva linea
init = tf.global_variables_initializer()
saver = tf.train.Saver()

La primera línea crea un nodo en el gráfico que evaluará el valor de MSE y lo escribirá en una cadena de registro binario compatible con TensorBoard llamada resumen. La segunda línea crea un FileWriter que utilizará para escribir resúmenes en los archivos de registro en el directorio de registro.

El primer parámetro indica la ruta del directorio de registro (en este caso, algo como tf_logs / run-20160906091959 /, relativo al directorio actual). El segundo parámetro (opcional) es el gráfico que desea visualizar. Tras la creación, el Escritor de archivos crea el directorio de registro si aún no existe (y sus directorios principales, si es necesario), y escribe la definición del gráfico en un archivo de registro binario llamado archivo de eventos.

A continuación, debe actualizar la fase de ejecución para evaluar el nodo mse_summary regularmente durante el entrenamiento (por ejemplo, cada 10 mini lotes). Esto generará un resumen que luego puede escribir en el archivo de eventos usando el file_writer. Aquí está el código actualizado:

In [54]:
with tf.Session() as sess:
    sess.run(init)
    for epoch in range(n_epochs):
        for batch_index in range(n_batches):
            X_batch, y_batch = fetch_batch(epoch, batch_index, batch_size)
            if batch_index % 10 == 0: #nuevas lineas
                summary_str = mse_summary.eval(feed_dict={X: X_batch, y: y_batch})#nuevas lineas
                step = epoch * n_batches + batch_index#nuevas lineas
                file_writer.add_summary(summary_str, step)#nuevas lineas
            sess.run(training_op, feed_dict={X: X_batch, y: y_batch})
        if epoch % 100 == 0:
            print("Epoch", epoch, "MSE =", mse.eval(feed_dict={X: X_batch1, y: y_batch1}))
    print(theta.eval())
    save_path = saver.save(sess, "/home/andres/Escritorio/guardando_modelo.ckpt")
    #saver = tf.train.Saver({"pesos": theta})


Epoch 0 MSE = 6.0267043
Epoch 100 MSE = 4.735941
Epoch 200 MSE = 4.734802
Epoch 300 MSE = 4.733837
Epoch 400 MSE = 4.746954
Epoch 500 MSE = 4.738476
Epoch 600 MSE = 4.7392836
Epoch 700 MSE = 4.73564
Epoch 800 MSE = 4.7425833
Epoch 900 MSE = 4.752271
[[-0.7243414 ]
 [ 0.82605994]
 [ 0.1323493 ]
 [-0.27672535]
 [ 0.3296239 ]
 [-0.01730829]
 [-0.03424422]
 [-0.89796126]
 [-0.88873976]]


Evite registrar estadísticas de entrenamiento en cada paso de entrenamiento, ya que esto ralentizaría significativamente el entrenamiento.

Finalmente, desea cerrar el FileWriter al final del programa: 

In [55]:
file_writer.close()

Ahora ejecute este programa: <br>
creará el directorio de registro y escribirá un archivo de eventos en este directorio, que contiene tanto la definición del grafo como los valores de MSE. Abra un shell y vaya a su directorio de trabajo, luego escriba ls -l tf_logs / run * para listar los contenidos del directorio de registro:

$cd $ML_PATH
#Your ML working directory (e.g., $HOME/ml)
$ls -l tf_logs/run*

Si ejecuta el programa por segunda vez, debería ver un segundo directorio en el directorio tf_logs /:

¡Genial! Ahora es el momento de encender el servidor TensorBoard. Debe activar su entorno virtualenv si creó uno, luego inicie el servidor ejecutando el comando tensor board, apuntándolo al directorio de registro raíz. Esto inicia el servidor web TensorBoard, escuchando en el puerto 6006 (que es "goog" escrito al revés):

$ source env/bin/activate
$ tensorboard --logdir tf_logs/
Starting TensorBoard on port 6006
(You can navigate to http://0.0.0.0:6006)

A continuación, abra un navegador y vaya a http://0.0.0.0:6006/ (o http: // localhost: 6006 /). Bienvenido a TensorBoard! En la pestaña Eventos, debería ver MSE a la derecha. Si hace clic en él, verá una gráfica del MSE durante el entrenamiento, para ambas ejecuciones (Figura 9-3). Puede marcar o desmarcar las ejecuciones que desea ver, acercar o alejar, desplazarse sobre la curva para obtener detalles, etc.

Ahora haga clic en la pestaña Gráficos. 

Para reducir el desorden, los nodos que tienen muchos bordes (es decir, las conexiones a otros nodos) se separan en un área auxiliar a la derecha (puede mover un nodo de un lado a otro entre el gráfico principal y el área auxiliar haciendo clic con el botón derecho en eso). Algunas partes del gráfico también están colapsadas por defecto. Por ejemplo, intente pasar el cursor sobre el nodo de gradientes, luego haga clic en el icono para expandir este subgrafo. A continuación, en este subgrafo, intente expandir el subgrafo mse_grad.

Si desea echar un vistazo al gráfico directamente dentro de Jupyter, puede usar la función show_graph () disponible en el cuaderno para este capítulo. Originalmente fue escrito por A. Mordvintsev en su gran cuaderno de tutoriales Deepdream. Otra opción es instalar la herramienta de depuración TensorFlow de E. Jang que incluye una extensión de Jupyter para visualización de gráficos (y más).

Nombre de los ámbitos

Cuando se trata de modelos más complejos, como las redes neuronales, el gráfico se puede saturar fácilmente con miles de nodos. Para evitar esto, puede crear ámbitos de nombres para agrupar nodos relacionados. Por ejemplo, modifiquemos el código anterior para definir el error y mse ops dentro de un ámbito de nombre llamado "pérdida"

In [57]:
#Nombres de los ambitos 
with tf.name_scope("loss") as scope:
    error = y_pred - y
    mse = tf.reduce_mean(tf.square(error), name="mse")

El nombre de cada operación definida dentro del alcance ahora tiene el prefijo "pérdida /"

In [58]:
print(error.op.name)

print(mse.op.name)

loss/sub
loss/mse


En TensorBoard, los nodos mse y error ahora aparecen dentro del espacio de nombres de pérdida, que aparece colapsado de forma predeterminada 

Supongamos que desea crear un gráfico que agregue la salida de dos unidades lineales rectificadas (ReLU). Una ReLU calcula una función lineal de las entradas y genera el resultado si es positivo, y 0 de lo contrario, 

El siguiente código hace el trabajo, pero es bastante repetitivo: 

In [277]:
#modularidad
n_features = 3
X = tf.placeholder(tf.float32, shape=(None, n_features), name="X")
w1 = tf.Variable(tf.random_normal((n_features, 1)), name="weights1")
w2 = tf.Variable(tf.random_normal((n_features, 1)), name="weights2")
b1 = tf.Variable(0.0, name="bias1")
b2 = tf.Variable(0.0, name="bias2")
z1 = tf.add(tf.matmul(X, w1), b1, name="z1")
z2 = tf.add(tf.matmul(X, w2), b2, name="z2")
relu1 = tf.maximum(z1, 0., name="relu1")
relu2 = tf.maximum(z1, 0., name="relu2")
output = tf.add(relu1, relu2, name="output")

Este código repetitivo es difícil de mantener y es propenso a errores (de hecho, este código contiene un error de cortar y pegar; ¿lo vio?). Sería incluso peor si quisiera agregar algunas ReLU más. Afortunadamente, TensorFlow le permite mantenerse SECO (no se repita): simplemente cree una función para construir una ReLU. El siguiente código crea cinco ReLU y genera su suma (tenga en cuenta que add_n () crea una operación que calculará la suma de una lista de tensores):

In [278]:
def relu(X):
    w_shape = (int(X.get_shape()[1]), 1)
    w = tf.Variable(tf.random_normal(w_shape), name="weights")
    b = tf.Variable(0.0, name="bias")
    z = tf.add(tf.matmul(X, w), b, name="z")
    return tf.maximum(z, 0., name="relu")
n_features = 3
X = tf.placeholder(tf.float32, shape=(None, n_features), name="X")
relus = [relu(X) for i in range(5)]
output = tf.add_n(relus, name="output")

Tenga en cuenta que cuando crea un nodo, TensorFlow comprueba si su nombre ya existe y, si lo hace, agrega un guión bajo seguido de un índice para que el nombre sea único. Así que la primera ReLU contiene nodos denominados "pesos", "sesgo", "z" y "relu" (además de muchos más nodos con su nombre predeterminado, como "MatMul"); la segunda ReLU contiene nodos denominados "pesos_1", "sesgo_1", etc. la tercera ReLU contiene nodos denominados "pesos_2", "sesgo_2", etc. TensorBoard identifica dichas series y las colapsa para reducir el desorden

Usando los ámbitos de nombres, puedes hacer el gráfico mucho más claro. Simplemente mueva todo el contenido de la función relu () dentro de un ámbito de nombre. La figura 9-7 muestra el gráfico resultante. Tenga en cuenta que TensorFlow también le da a los ámbitos de nombres nombres únicos al agregar _1, _2, etc.

In [None]:
def relu(X):
    with tf.name_scope("relu"):

Hasta aca tenemos el tema de introduccion a la libreria tensorflow. Si tienes alguna duda no olvides escribir a <br>
<b>andres.programacion123@gmail.com</b>