<a href="https://colab.research.google.com/github/juancaalcaraz/practicaML/blob/main/CNN_y_RNN_en_TensorFlow1x.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Modelo CNN para clasificación de imagenes.

In [4]:
import tensorflow as tf
from tensorflow.keras import datasets, layers, models
from tensorflow import keras
import numpy as np


In [5]:
# Cargar el conjunto de datos MNIST
(X_train, y_train), (X_test, y_test) = datasets.mnist.load_data()

# Imprimir la forma de los datos de entrenamiento
print(X_train.shape)  # Salida: (60000, 28, 28)

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz
[1m11490434/11490434[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0us/step
(60000, 28, 28)


In [None]:
shape = (28, 28, 1)
model = models.Sequential([
    keras.Input(shape=shape),
    layers.Conv2D(32, (5, 5), activation='relu'),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (5, 5), activation='relu'),
    layers.MaxPooling2D((2, 2)),
    layers.Flatten(),
    layers.Dense(128, activation='relu'),
    layers.Dropout(0.5),
    layers.Dense(10, activation='softmax')
])
# Compilar el modelo
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

In [None]:
model.summary()

In [None]:
from keras.callbacks import ReduceLROnPlateau, EarlyStopping

reduce_lr = ReduceLROnPlateau(monitor='val_loss', factor=0.5, patience=1, min_lr=0.00001)
early_stopping = EarlyStopping(monitor='accuracy', patience=5, restore_best_weights=True, verbose=1)

model.fit(X_train, y_train, epochs=10, batch_size=64, callbacks=[reduce_lr, early_stopping])

Epoch 1/10
[1m938/938[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m65s[0m 68ms/step - accuracy: 0.7777 - loss: 2.0077 - learning_rate: 0.0010
Epoch 2/10
[1m938/938[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m78s[0m 64ms/step - accuracy: 0.9641 - loss: 0.1327 - learning_rate: 0.0010
Epoch 3/10
[1m938/938[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m84s[0m 66ms/step - accuracy: 0.9723 - loss: 0.0950 - learning_rate: 0.0010
Epoch 4/10
[1m938/938[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m83s[0m 68ms/step - accuracy: 0.9786 - loss: 0.0733 - learning_rate: 0.0010
Epoch 5/10
[1m938/938[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m80s[0m 65ms/step - accuracy: 0.9796 - loss: 0.0690 - learning_rate: 0.0010
Epoch 6/10
[1m938/938[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m81s[0m 65ms/step - accuracy: 0.9828 - loss: 0.0644 - learning_rate: 0.0010
Epoch 7/10
[1m938/938[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m83s[0m 66ms/step - accuracy: 0.9831 - loss: 0.0606 - 

<keras.src.callbacks.history.History at 0x7e01154b2ec0>

In [None]:
# Evaluación del modelo
test_loss, test_acc = model.evaluate(X_test, y_test)

print('Test accuracy:', test_acc)

[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 11ms/step - accuracy: 0.9836 - loss: 0.0693
Test accuracy: 0.9869999885559082


# Implementar una CNN con la API de bajo nivel de TensorFlow

In [6]:
# Vamos a crear una función para iterar a travez los minilotes de datos.
def batch_generator(X, y, batch_size=64, shuffle=False, random_seed=None):
  """
  Generador de mini lotes de datos.

  Esta función devuelve un generador que itera a través de los mini lotes de datos
  de entrada `X` y las etiquetas `y`. Es útil para entrenar modelos de Machine Learning
  cuando se desea procesar los datos en mini lotes en lugar de todo el conjunto de datos
  de una vez.

  Parámetros:
  X: np.ndarray
      Matriz de características de entrada, donde cada fila corresponde a una muestra de datos.
  y: np.ndarray
      Vector de etiquetas correspondientes a las muestras de `X`.
  batch_size: int, opcional (default=64)
      El tamaño de cada mini lote. Determina cuántas muestras se devuelven en cada iteración.
  shuffle: bool, opcional (default=False)
      Si es `True`, las muestras se barajan aleatoriamente antes de la creación de los mini lotes.
  random_seed: int, opcional (default=None)
      Semilla para el generador de números aleatorios. Se usa solo si `shuffle=True` para asegurar
      la reproducibilidad del orden aleatorio.

  Yields:
  tuple (X_batch, y_batch)
      - X_batch: np.ndarray
        Un mini lote de datos de entrada, con forma `(batch_size, X.shape[1])`.
      - y_batch: np.ndarray
        Un mini lote de etiquetas, con forma `(batch_size,)`.

  Notas:
  - La función no devuelve una lista completa de mini lotes, sino que usa `yield` para
    generar los mini lotes uno por uno, lo que la hace adecuada para trabajar con grandes
    conjuntos de datos que no caben completamente en memoria.
  """
  idx = np.arange(y.shape[0])
  if shuffle:
    rng = np.random.RandomState(random_seed)
    rng.shuffle(idx)
    X = X[idx]
    y = y[idx]
  for i in range(0, X.shape[0], batch_size):
    yield (X[i:i+batch_size, :], y[i:i+batch_size])

## Para implementar una CNN en TensorFlow definimos dos funciones de envoltorio que harán la construcción de la red más sencilla. Una función de envoltorio para una capa convolucional y otra para la capa completamente conectada.

In [7]:
def conv_layer(input_tensor, name, kernel_size, n_output_channels, padding_mode='SAME', strides=(1, 1, 1, 1)):
  """
  #################################################################################
  # Esta función crea una capa convolucional.                                     #
  #################################################################################
  parameters:
  input_tensor: tf.tensor, tensor de enrtada
  name: str Nombre de la capa
  kernel_size: int tamaño del kernel
  n_output_channels: int Número de canales de salida
  padding_mode: str, tipo de padding 'SAME', 'EXPLICIT' o 'VALID' (default='SAME')
  strides: tuple (default=(1, 1, 1,))
  returns:
  tf.tensor: tensor de salida
  """
  with tf.compat.v1.variable_scope(name):
    ## obtener n_inputs_channels:
    ## Forma del tensor de entrada
    ## [batch_size x width x height x channels_in]
    input_shape = input_tensor.get_shape().as_list()
    n_input_channels = input_shape[-1]

    weight_shape = list(kernel_size) + [n_input_channels, n_output_channels]
    weights = tf.Variable(tf.random.truncated_normal(weight_shape, stddev=0.01), name='_weights')
    print(weights)

    biases = tf.Variable(tf.zeros(shape=[n_output_channels]), name='_biases')
    print(biases)
    conv = tf.nn.conv2d(input=input_tensor, filters=weights, strides=strides, padding=padding_mode)
    print(conv)
    conv = tf.nn.bias_add(conv, biases, name='net_pre_activation')
    print(conv)
    conv = tf.nn.relu(conv, name='activation')
    print(conv)
    return conv

In [8]:
# probamos la funcion con un simple gráfico
g = tf.Graph()
with tf.compat.v1.Graph().as_default() as g:
  x = tf.compat.v1.placeholder(tf.float32, shape=[None, 28, 28, 1])
  conv_layer(x, name='conv_test', kernel_size=(3, 3), n_output_channels=20)

<tf.Variable 'conv_test/_weights:0' shape=(3, 3, 1, 20) dtype=float32>
<tf.Variable 'conv_test/_biases:0' shape=(20,) dtype=float32>
Tensor("conv_test/Conv2D:0", shape=(None, 28, 28, 20), dtype=float32)
Tensor("conv_test/net_pre_activation:0", shape=(None, 28, 28, 20), dtype=float32)
Tensor("conv_test/activation:0", shape=(None, 28, 28, 20), dtype=float32)


In [9]:
del g, x

## Mismo codigo anterior pero optimizado para tensorFlow 2.x

In [None]:
import tensorflow as tf
@tf.function
def conv_layer(input_tensor, name, kernel_size, n_output_channels, padding_mode='same', strides=(1, 1, 1, 1)):
    """
    Esta función crea una capa convolucional en TensorFlow 2.x.

    Parameters:
    input_tensor: tf.Tensor, tensor de entrada.
    name: str, nombre de la capa.
    kernel_size: int, tamaño del kernel.
    n_output_channels: int, número de canales de salida.
    padding_mode: str, tipo de padding ('same' o 'valid'). Default es 'same'.
    strides: tuple, pasos (default es (1, 1, 1, 1)).

    Returns:
    tf.Tensor, tensor resultante de la capa convolucional.
    """
    with tf.name_scope(name):
        # Obtener número de canales de entrada
        input_shape = input_tensor.shape.as_list()
        n_input_channels = input_shape[-1]

        # Definir la forma de los pesos
        weight_shape = list(kernel_size) + [n_input_channels, n_output_channels]

        # Inicializar los pesos y sesgos
        weights = tf.Variable(tf.random.normal(weight_shape), name='_weights')
        biases = tf.Variable(tf.zeros([n_output_channels]), name='_biases')

        # Realizar la convolución
        conv = tf.nn.conv2d(input_tensor, filters=weights, strides=strides, padding=padding_mode)

        # Sumar el sesgo
        conv = tf.nn.bias_add(conv, biases, name='net_pre_activation')

        # Aplicar ReLU como función de activación
        conv = tf.nn.relu(conv, name='activation')

        return conv


## La siguiente función sirve para definir nuestras capas completamente conectadas.

In [10]:
def fc_layer(input_tensor, name, n_output_units, activation_fn=None):
  """
  #################################################################################
  # Esta función crea una capa completamente conectada.                           #
  #################################################################################
  """
  with tf.name_scope(name):
    input_shape = input_tensor.get_shape().as_list()[1:]
    n_inputs_units = np.prod(input_shape)
    if len(input_shape) > 1:
      input_tensor = tf.reshape(input_tensor, shape=(-1, n_inputs_units))
    weights_shape = [n_inputs_units, n_output_units]
    weights = tf.Variable(initial_value=tf.random.normal(weights_shape), name="weights")
    print(weights)
    biases = tf.Variable(tf.zeros(shape=[n_output_units]), name='biases')
    print(biases)
    layer = tf.matmul(input_tensor, weights)
    print(layer)
    layer = tf.nn.bias_add(layer, biases)
    print(layer)
    if activation_fn is None:
      return layer
    layer = activation_fn(layer, name='activation')
    print(layer)
    return layer

## La función *fc_layers* construye los pesos y los sesgos, los inicializa y luego realiza una multiplicación de matrices mediante la función *tf.matmul*.
## La función fc_layers cuenta con tres argumentos obligatorios:
1. *input_tensor*: El tensor de entrada.
2. *name*: El nombre de la capa, que se utiliza como nombre del alcance.
3. *n_output_units*: El número de unidades de salida.

In [11]:
# probamos la funcion con un simple gráfico
g = tf.Graph()
with tf.compat.v1.Graph().as_default() as g:
  x = tf.compat.v1.placeholder(tf.float32, shape=[None, 28, 28, 1])
  fc_layer(x, name='fc_test', n_output_units=32, activation_fn=tf.nn.relu)

<tf.Variable 'fc_test/weights:0' shape=(784, 32) dtype=float32>
<tf.Variable 'fc_test/biases:0' shape=(32,) dtype=float32>
Tensor("fc_test/MatMul:0", shape=(None, 32), dtype=float32)
Tensor("fc_test/BiasAdd:0", shape=(None, 32), dtype=float32)
Tensor("fc_test/activation:0", shape=(None, 32), dtype=float32)


## Ahora podemos utilizar estas funciones de envoltorio para construir toda la red convolucional. Definimos una función denominada *buid_cnn* para gestionar la construcción del modelo.

In [19]:
def build_cnn():
  ## Marcadores de posiones para X e y:
  tf_x = tf.compat.v1.placeholder(tf.float32, shape=[None, 784], name='tf_x')
  tf_y = tf.compat.v1.placeholder(tf.int32, shape=None, name='tf_y')
  # Remodelar tf_x en u tensor 4D:
  # [batch_size, width, height, 1]
  tf_x_image = tf.reshape(tf_x, shape=[-1, 28, 28, 1], name='tf_x_reshaped')
  # Codificacion one-hot:
  tf_y_onehot = tf.one_hot(indices=tf_y, depth=10, dtype=tf.float32, name='tf_y_onehot')
  # 1. capa: Conv_1
  print('\n Construyendo la 1. capa: ')
  h1 = conv_layer(tf_x_image, name='conv_1', kernel_size=(5, 5), padding_mode='VALID', n_output_channels=32)
  ## Agrupación máxima:
  h1_pool = tf.nn.max_pool(h1, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')
  # 2. capa: Conv_2
  print('\n Construyendo la 2. capa: ')
  h2  = conv_layer(h1_pool, name='conv_2', kernel_size=(5, 5), padding_mode='VALID', n_output_channels=64)
  ## Agrupació máxima:
  h2_pool = tf.nn.max_pool(h2, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')
  ## Capa: 3 completamente conectada:
  print('\n Contruyendo la 3. capa: ')
  h3 = fc_layer(h2_pool, name='fc_3', n_output_units=1024, activation_fn=tf.nn.relu)
  ## Dropout:
  keep_prob = tf.compat.v1.placeholder(tf.float32, name='fc_keep_prob')
  h3_drop = tf.nn.dropout(h3, rate=1-keep_prob, name='dropout_3')
  #h3_drop = tf.nn.dropout(h3, keep_prob=keep_prob, name='dropout_layer')
  ## 4. capa: Completamente conectada (Activación líneal)
  print('\n Construyendo la 4. capa: ')
  h4 = fc_layer(h3_drop, name='fc_4', n_output_units=10, activation_fn=None)
  ## Predicciones:
  predictions = {'probabilities': tf.nn.softmax(h4, name='probabilities'),
                 'labels': tf.cast(tf.argmax(h4, axis=1), tf.int32, name='labels')}
  ## Función de pérdida y optimización
  cross_entropy_loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=h4, labels= tf_y_onehot), name='cross_entropy_loss')
  ## Optimizador:
  optimizer = tf.compat.v1.train.AdamOptimizer(learning_rate)
  optimizer = optimizer.minimize(cross_entropy_loss, name='train_op')
  ## Calcular la precisió de la predicción:
  correct_predictions = tf.equal(predictions['labels'], tf_y, name='correct_preds')
  accuracy = tf.reduce_mean(tf.cast(correct_predictions, tf.float32), name='accuracy')

## Ahora defineremos 4 funciones más: *save* y *load* para guardar y cargar los puntos de control del modelo entrenado, *training_set* y *predict* para obtener probabilidades de predicciones o etiquetas de predicción de los datos de prueba.

In [13]:
import os
def save(saver, sess, epoch, path='./model/'):
  """
  Función para guardar los pesos, las variables y el estado
  del modelo entrenado en tensorFlow 1.x
  """
  if not os.path.isdir(path):
    os.mkdir('path')
  print(f'guardando el modelo en {path}')
  saver.save(sess, os.path.join(path, 'cnn-model.ckpt'), global_step=epoch)
  print('modelo guardado')


In [14]:
def load(saver, sess, path, epoch):
  """
  Función para cargar los pesos, las variables y el estado
  del modelo entrenado en tensorFlow 1.x
  """
  print(f'cargando el modelo desde {path}')
  saver.restore(sess, os.path.join(path, f'cnn-model.ckpt-{epoch}'))

In [26]:
def train(sess, training_set, validation_set=None, initializer= True, epoch=20, shuffle=True, dropout=0.5, random_seed=None):
  """
  Función para entrenar el modelo en tensorFlow 1.x
  """
  X_data = np.array(training_set[0])
  y_data = np.array(training_set[1])
  training_loss = []
  ## Inicializar variables:
  if initializer:
    sess.run(tf.compat.v1.global_variables_initializer())
  np.random.seed(random_seed) #para Shuffle en batch_generator.
  for epoch in range(1, epoch + 1):
    batch_gen = batch_generator(X_data, y_data, shuffle=shuffle)
    avg_loss = 0.0
    for i, (batch_x, batch_y) in enumerate(batch_gen):
      batch_x = batch_x.reshape(batch_x.shape[0], -1)
      feed_dict = {'tf_x: 0': batch_x, 'tf_y: 0': batch_y, 'fc_keep_prob: 0':dropout}
      loss, _ = sess.run(['cross_entropy_loss:0', 'train_op'], feed_dict=feed_dict)
      avg_loss += loss
    training_loss.append(avg_loss/(i+1))
    print(f'epoch: {epoch} training_loss: {training_loss[-1]:.4f}')
    if validation_set is not None:
      feed = {'tf_x:0': validation_set[0], 'tf_y:0': validation_set[1], 'fc_keep_prob:0': 1.0}
      valid_acc = sess.run('accuracy:0', feed_dict=feed)
      print(f'valid_acc: {valid_acc:.3f}')
    else :
      print()

In [16]:
def predict(sess, X_test, return_proba=False):
  """
  Función para realizar predicciones en tensorFlow 1.x
  """
  feed_dict = {'tf_x:0': X_test, 'fc_keep_prob:0': 1.0}
  if return_proba:
    return sess.run('probabilities:0', feed_dict=feed_dict)
  else:
    return sess.run('labels:0', feed_dict=feed_dict)

## Ahora podemos crear un grafo, establecer la disposición aleatoria y construir el modelo CNN.  

In [20]:
## definir parámetros.
learning_rate = 1e-4
random_seed = 123

## Crear el grafo:
g = tf.Graph()
with g.as_default():
  tf.compat.v1.set_random_seed(random_seed)
  build_cnn()
  ## Guardar:
  saver = tf.compat.v1.train.Saver()


 Construyendo la 1. capa: 
<tf.Variable 'conv_1/_weights:0' shape=(5, 5, 1, 32) dtype=float32>
<tf.Variable 'conv_1/_biases:0' shape=(32,) dtype=float32>
Tensor("conv_1/Conv2D:0", shape=(None, 24, 24, 32), dtype=float32)
Tensor("conv_1/net_pre_activation:0", shape=(None, 24, 24, 32), dtype=float32)
Tensor("conv_1/activation:0", shape=(None, 24, 24, 32), dtype=float32)

 Construyendo la 2. capa: 
<tf.Variable 'conv_2/_weights:0' shape=(5, 5, 32, 64) dtype=float32>
<tf.Variable 'conv_2/_biases:0' shape=(64,) dtype=float32>
Tensor("conv_2/Conv2D:0", shape=(None, 8, 8, 64), dtype=float32)
Tensor("conv_2/net_pre_activation:0", shape=(None, 8, 8, 64), dtype=float32)
Tensor("conv_2/activation:0", shape=(None, 8, 8, 64), dtype=float32)

 Contruyendo la 3. capa: 
<tf.Variable 'fc_3/weights:0' shape=(1024, 1024) dtype=float32>
<tf.Variable 'fc_3/biases:0' shape=(1024,) dtype=float32>
Tensor("fc_3/MatMul:0", shape=(None, 1024), dtype=float32)
Tensor("fc_3/BiasAdd:0", shape=(None, 1024), dtype=fl

## El siguiente paso consiste en etrenar nuestro modelo CNN. Para ello debemos crear una sesión de tensorFlow e iniciar el grafo, despues llamamos a la función *train*.

In [21]:
## division de los datos
from sklearn.model_selection import train_test_split
X_train, X_valid, y_train, y_valid = train_test_split(X_train, y_train, test_size=0.2, random_state=123)

## centrado medio y división por desviacion estandar:
mean_vals = np.mean(X_train, axis=0)
std_val = np.std(X_train)
X_train_centered = (X_train - mean_vals)/std_val
X_valid_centered = (X_valid - mean_vals)/std_val
X_test_centered = (X_test - mean_vals)/std_val

In [29]:
## crear una sesión
## y entrenar el modelo CNN:
with tf.compat.v1.Session(graph=g) as sess:
  # Reshape X_train y X_valid a (num_samples, 784)
  X_train_reshaped = X_train.reshape(-1, 784)  # -1 infiere el número de muestras.
  X_valid_reshaped = X_valid.reshape(-1, 784)
  train(sess, training_set=(X_train_reshaped, y_train), validation_set=(X_valid_reshaped, y_valid), initializer=True, random_seed=123)
  save(saver, sess, epoch=20)

epoch: 1 training_loss: 28.1348
valid_acc: 0.211
epoch: 2 training_loss: 2.1146
valid_acc: 0.232
epoch: 3 training_loss: 2.0637
valid_acc: 0.239
epoch: 4 training_loss: 2.0154
valid_acc: 0.250
epoch: 5 training_loss: 1.9675
valid_acc: 0.272
epoch: 6 training_loss: 1.9208
valid_acc: 0.325
epoch: 7 training_loss: 1.8803
valid_acc: 0.317
epoch: 8 training_loss: 1.8475
valid_acc: 0.332
epoch: 9 training_loss: 1.7986
valid_acc: 0.331
epoch: 10 training_loss: 1.7768
valid_acc: 0.372
epoch: 11 training_loss: 1.7222
valid_acc: 0.401
epoch: 12 training_loss: 1.6190
valid_acc: 0.455
epoch: 13 training_loss: 1.4495
valid_acc: 0.556
epoch: 14 training_loss: 1.1654
valid_acc: 0.759
epoch: 15 training_loss: 0.8671
valid_acc: 0.826
epoch: 16 training_loss: 0.6891
valid_acc: 0.826
epoch: 17 training_loss: 0.5607
valid_acc: 0.890
epoch: 18 training_loss: 0.4757
valid_acc: 0.897
epoch: 19 training_loss: 0.4113
valid_acc: 0.919
epoch: 20 training_loss: 0.3596
valid_acc: 0.932
guardando el modelo en ./mod

In [30]:
del g

In [None]:
"""
# Ahora el mismo entrenamiento con los datos preprocesados:
## crear una sesión
## y entrenar el modelo CNN:
with tf.compat.v1.Session(graph=g) as sess:
  # Reshape X_train y X_valid a (num_samples, 784)
  X_train_centered_reshaped = X_train_centered.reshape(-1, 784)  # -1 infiere el numero de muestras.
  X_valid_centered_reshaped = X_valid_centered.reshape(-1, 784)
  train(sess, training_set=(X_train_centered_reshaped, y_train), validation_set=(X_valid_centered_reshaped, y_valid), initializer=True, random_seed=123)
  save(saver, sess, epoch=20)

"""

In [33]:
## Calcular la precisión en el conjunto de prueba
## restaurando el modelo guardado

## Crear un nuevo grafo
## y construir el modelo.
g2 = tf.Graph()
with g2.as_default():
  tf.compat.v1.set_random_seed(random_seed)
  ## construir el modelo
  build_cnn()
  ## Guardar
  saver = tf.compat.v1.train.Saver()

## Crear una nueva sesión
## Y restaurar el modelo.

with tf.compat.v1.Session(graph=g2) as sess:
  load(saver, sess, epoch=20, path='./model/')
  X_test_reshaped = X_test.reshape(-1, 784)
  preds = predict(sess, X_test_reshaped, return_proba=False)
  print('Test de precisión: %.3f%%'%(100* np.sum(preds == y_test)/len(y_test)))


 Construyendo la 1. capa: 
<tf.Variable 'conv_1/_weights:0' shape=(5, 5, 1, 32) dtype=float32>
<tf.Variable 'conv_1/_biases:0' shape=(32,) dtype=float32>
Tensor("conv_1/Conv2D:0", shape=(None, 24, 24, 32), dtype=float32)
Tensor("conv_1/net_pre_activation:0", shape=(None, 24, 24, 32), dtype=float32)
Tensor("conv_1/activation:0", shape=(None, 24, 24, 32), dtype=float32)

 Construyendo la 2. capa: 
<tf.Variable 'conv_2/_weights:0' shape=(5, 5, 32, 64) dtype=float32>
<tf.Variable 'conv_2/_biases:0' shape=(64,) dtype=float32>
Tensor("conv_2/Conv2D:0", shape=(None, 8, 8, 64), dtype=float32)
Tensor("conv_2/net_pre_activation:0", shape=(None, 8, 8, 64), dtype=float32)
Tensor("conv_2/activation:0", shape=(None, 8, 8, 64), dtype=float32)

 Contruyendo la 3. capa: 
<tf.Variable 'fc_3/weights:0' shape=(1024, 1024) dtype=float32>
<tf.Variable 'fc_3/biases:0' shape=(1024,) dtype=float32>
Tensor("fc_3/MatMul:0", shape=(None, 1024), dtype=float32)
Tensor("fc_3/BiasAdd:0", shape=(None, 1024), dtype=fl

## Podemos seguir entrenando el modelo para conseguir un total de 30 epocas. Esto lo hacemos con *initializer=False*

In [34]:
## Crear una nueva sesión, restaurar
## y entrenar el modelo:
with tf.compat.v1.Session(graph=g2) as sess:
  load(saver, sess, epoch=20, path='./model/')
  train(sess, training_set=(X_train_reshaped, y_train), validation_set=(X_valid_reshaped, y_valid), initializer=False, epoch=10, random_seed=123)
  save(saver, sess, epoch=30, path='./model/')
  preds = predict(sess, X_test_reshaped, return_proba=False)
  print('Test de precisión: %.3f%%'%(100* np.sum(preds == y_test)/len(y_test)))

cargando el modelo desde ./model/
epoch: 1 training_loss: 0.3203
valid_acc: 0.934
epoch: 2 training_loss: 0.2846
valid_acc: 0.945
epoch: 3 training_loss: 0.2501
valid_acc: 0.956
epoch: 4 training_loss: 0.2306
valid_acc: 0.956
epoch: 5 training_loss: 0.2125
valid_acc: 0.958
epoch: 6 training_loss: 0.1916
valid_acc: 0.957
epoch: 7 training_loss: 0.1773
valid_acc: 0.962
epoch: 8 training_loss: 0.1696
valid_acc: 0.964
epoch: 9 training_loss: 0.1652
valid_acc: 0.967
epoch: 10 training_loss: 0.1547
valid_acc: 0.967
guardando el modelo en ./model/
modelo guardado
Test de precisión: 97.030%
