##### Copyright 2021 The TensorFlow Authors.

In [None]:
#@title Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
# https://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

# Usar modelos TF1.x en flujos de trabajo TF2


<table class="tfo-notebook-buttons" align="left">
  <td><a target="_blank" href="https://www.tensorflow.org/guide/migrate/model_mapping"><img src="https://www.tensorflow.org/images/tf_logo_32px.png">Ver en TensorFlow.org</a></td>
  <td><a target="_blank" href="https://colab.research.google.com/github/tensorflow/docs-l10n/blob/master/site/es-419/guide/migrate/model_mapping.ipynb"><img src="https://www.tensorflow.org/images/colab_logo_32px.png">Ejecutar en Google Colab</a></td>
  <td>     <a target="_blank" href="https://github.com/tensorflow/docs-l10n/blob/master/site/es-419/guide/migrate/model_mapping.ipynb"><img src="https://www.tensorflow.org/images/GitHub-Mark-32px.png">Ver en GitHub</a>
</td>
  <td><a href="https://storage.googleapis.com/tensorflow_docs/docs-l10n/site/es-419/guide/migrate/model_mapping.ipynb"><img src="https://www.tensorflow.org/images/download_logo_32px.png">Descargar bloc de notas</a></td>
</table>

Esta guía proporciona una visión general y ejemplos de un [shim de código de modelado](https://en.wikipedia.org/wiki/Shim_(computing)) que puede emplear para usar sus modelos TF1.x existentes en flujos de trabajo TF2 como ejecución eager, `tf.function` y estrategias de distribución con cambios mínimos en su código de modelado.

## Ámbito de uso

La shim descrita en esta guía está diseñada para los modelos TF1.x que se basan en:

1. `tf.compat.v1.get_variable` y `tf.compat.v1.variable_scope` para controlar la creación y reutilización de variables, y
2. APIs basadas en la recopilación de grafos como `tf.compat.v1.global_variables()`, `tf.compat.v1.trainable_variables`, `tf.compat.v1.losses.get_regularization_losses()`, y `tf.compat.v1.get_collection()` para conservar un registro de las ponderaciones y las pérdidas de regularización.

Esto incluye la mayoría de los modelos construidos usando como base las APIs `tf.compat.v1.layer`, `tf.contrib.layers`, y [TensorFlow-Slim](https://github.com/google-research/tf-slim).

La shim **NO** es necesaria para los siguientes modelos TF1.x:

1. Modelos Keras autónomos que ya hacen un seguimiento de todas sus ponderaciones entrenables y pérdidas de regularización a través de `model.trainable_weights` y `model.losses` respectivamente.
2. `tf.Module`s que ya hacen un seguimiento de todas sus ponderaciones entrenables a través de `module.trainable_variables`, y sólo crean ponderaciones si aún no se han creado.

Es probable que estos modelos funcionen en TF2 con ejecución eager y `tf.function`s de forma inmediata.

## Preparación

Importe TensorFlow y otras dependencias.

In [None]:
!pip uninstall -y -q tensorflow

In [None]:
# Install tf-nightly as the DeterministicRandomTestTool is available only in
# Tensorflow 2.8

!pip install -q tf-nightly

In [None]:
import tensorflow as tf
import tensorflow.compat.v1 as v1
import sys
import numpy as np

from contextlib import contextmanager

## El decorador `track_tf1_style_variables`

La shim clave descrita en esta guía es `tf.compat.v1.keras.utils.track_tf1_style_variables`, un decorador que puede usar dentro de métodos pertenecientes a `tf.keras.layers.Layer` y `tf.Module` para hacer un seguimiento de las ponderaciones de estilo TF1.x y capturar las pérdidas de regularización.

Decorar los métodos de llamada de un `tf.keras.layers.Layer` o `tf.Module` con `tf.compat.v1.keras.utils.track_tf1_style_variables` permite que la creación y reutilización de variables a través de `tf.compat.v1.get_variable` (y por extensión `tf.compat.v1.layers`) trabajen correctamente dentro del método decorado en lugar de hacerlo dentro del método decorado. También hará que la capa o módulo haga un seguimiento implícito de cualquier ponderación creada o a la que se acceda mediante `get_variable` dentro del método decorado.

Además de hacer un seguimiento de las propias ponderaciones bajo las propiedades estándares `layer.variable`/`module.variable`/etc., si el método pertenece a una `tf.keras.layers. Layer`, entonces cualquier pérdida de regularización especificada mediante los argumentos de regularizador `get_variable` o `tf.compat.v1.layers` será seguida por la capa bajo la propiedad estándar `layer.losses`.

Este mecanismo de seguimiento permite usar grandes clases de código TF1.x-style model-forward-pass dentro de capas Keras o `tf.Module`s en TF2 incluso con los comportamientos TF2 habilitados.


## Ejemplos de uso

Los ejemplos de uso que aparecen a continuación muestran las shims de modelado utilizadas para decorar los métodos `tf.keras.layers.Layer`, pero excepto en los casos en los que interactúan específicamente con características de Keras, también son aplicables al decorar los métodos `tf.Module`.

### Capa construida con tf.compat.v1.get_variable

Imagine que tiene una capa implementada directamente sobre `tf.compat.v1.get_variable` de la siguiente manera:

```python
def dense(self, inputs, units):
  out = inputs
  with tf.compat.v1.variable_scope("dense"):
    # The weights are created with a `regularizer`,
    kernel = tf.compat.v1.get_variable(
        shape=[out.shape[-1], units],
        regularizer=tf.keras.regularizers.L2(),
        initializer=tf.compat.v1.initializers.glorot_normal,
        name="kernel")
    bias = tf.compat.v1.get_variable(
        shape=[units,],
        initializer=tf.compat.v1.initializers.zeros,
        name="bias")
    out = tf.linalg.matmul(out, kernel)
    out = tf.compat.v1.nn.bias_add(out, bias)
  return out
```

Use la shim para convertirla en una capa y llámela sobre las entradas.

In [None]:
class DenseLayer(tf.keras.layers.Layer):

  def __init__(self, units, *args, **kwargs):
    super().__init__(*args, **kwargs)
    self.units = units

  @tf.compat.v1.keras.utils.track_tf1_style_variables
  def call(self, inputs):
    out = inputs
    with tf.compat.v1.variable_scope("dense"):
      # The weights are created with a `regularizer`,
      # so the layer should track their regularization losses
      kernel = tf.compat.v1.get_variable(
          shape=[out.shape[-1], self.units],
          regularizer=tf.keras.regularizers.L2(),
          initializer=tf.compat.v1.initializers.glorot_normal,
          name="kernel")
      bias = tf.compat.v1.get_variable(
          shape=[self.units,],
          initializer=tf.compat.v1.initializers.zeros,
          name="bias")
      out = tf.linalg.matmul(out, kernel)
      out = tf.compat.v1.nn.bias_add(out, bias)
    return out

layer = DenseLayer(10)
x = tf.random.normal(shape=(8, 20))
layer(x)

Acceda a las variables de seguimiento y a las pérdidas de regularización capturadas como una capa Keras estándar.

In [None]:
layer.trainable_variables
layer.losses

Para comprobar que las ponderaciones se reutilizan cada vez que llama a la capa, ponga todas las ponderaciones a cero y vuelva a llamar a la capa.

In [None]:
print("Resetting variables to zero:", [var.name for var in layer.trainable_variables])

for var in layer.trainable_variables:
  var.assign(var * 0.0)

# Note: layer.losses is not a live view and
# will get reset only at each layer call
print("layer.losses:", layer.losses)
print("calling layer again.")
out = layer(x)
print("layer.losses: ", layer.losses)
out

También puede usar la capa convertida directamente en la construcción de modelos funcionales Keras.

In [None]:
inputs = tf.keras.Input(shape=(20))
outputs = DenseLayer(10)(inputs)
model = tf.keras.Model(inputs=inputs, outputs=outputs)

x = tf.random.normal(shape=(8, 20))
model(x)

# Access the model variables and regularization losses
model.weights
model.losses

### Modelo construido con `tf.compat.v1.layers`

Imagine que tiene una capa o modelo implementado directamente sobre `tf.compat.v1.layers` como sigue:

```python
def model(self, inputs, units):
  with tf.compat.v1.variable_scope('model'):
    out = tf.compat.v1.layers.conv2d(
        inputs, 3, 3,
        kernel_regularizer="l2")
    out = tf.compat.v1.layers.flatten(out)
    out = tf.compat.v1.layers.dense(
        out, units,
        kernel_regularizer="l2")
    return out
```

Use la shim para convertirla en una capa y llámela sobre las entradas.

In [None]:
class CompatV1LayerModel(tf.keras.layers.Layer):

  def __init__(self, units, *args, **kwargs):
    super().__init__(*args, **kwargs)
    self.units = units

  @tf.compat.v1.keras.utils.track_tf1_style_variables
  def call(self, inputs):
    with tf.compat.v1.variable_scope('model'):
      out = tf.compat.v1.layers.conv2d(
          inputs, 3, 3,
          kernel_regularizer="l2")
      out = tf.compat.v1.layers.flatten(out)
      out = tf.compat.v1.layers.dense(
          out, self.units,
          kernel_regularizer="l2")
      return out

layer = CompatV1LayerModel(10)
x = tf.random.normal(shape=(8, 5, 5, 5))
layer(x)

Advertencia: Por motivos de seguridad, asegúrese de poner todas las `tf.compat.v1.layers` dentro de una `variable_scope` de cadena no vacía. Esto se debe a que `tf.compat.v1.layers` con nombres autogenerados siempre autoincrementarán el nombre fuera de cualquier ámbito de variable. Esto significa que los nombres de las variables solicitadas no coincidirán cada vez que llame a la capa/módulo. Así, en lugar de reutilizar las ponderaciones ya hechas, creará un nuevo conjunto de variables en cada llamada.

Acceda a las variables de seguimiento y a las pérdidas de regularización capturadas como una capa Keras estándar.

In [None]:
layer.trainable_variables
layer.losses

Para comprobar que las ponderaciones se reutilizan cada vez que llama a la capa, ponga todas las ponderaciones a cero y vuelva a llamar a la capa.

In [None]:
print("Resetting variables to zero:", [var.name for var in layer.trainable_variables])

for var in layer.trainable_variables:
  var.assign(var * 0.0)

out = layer(x)
print("layer.losses: ", layer.losses)
out

También puede usar la capa convertida directamente en la construcción de modelos funcionales Keras.

In [None]:
inputs = tf.keras.Input(shape=(5, 5, 5))
outputs = CompatV1LayerModel(10)(inputs)
model = tf.keras.Model(inputs=inputs, outputs=outputs)

x = tf.random.normal(shape=(8, 5, 5, 5))
model(x)

In [None]:
# Access the model variables and regularization losses
model.weights
model.losses

### Capturar las actualizaciones de normalización por lotes y los args de `training` del modelo

En TF1.x, la normalización por lotes se realiza así:

```python
  x_norm = tf.compat.v1.layers.batch_normalization(x, training=training)

  # ...

  update_ops = tf.compat.v1.get_collection(tf.GraphKeys.UPDATE_OPS)
  train_op = optimizer.minimize(loss)
  train_op = tf.group([train_op, update_ops])
```

Tenga en cuenta que:

1. Las actualizaciones promedio móviles de normalización por lotes son rastreadas por `get_collection` que se llamó por separado de la capa
2. `tf.compat.v1.layers.batch_normalization` requiere un argumento `training` (generalmente llamado `is_training` cuando se usan capas de normalización por lotes TF-Slim).

En TF2, debido a [ejecución eager](https://www.tensorflow.org/guide/eager) y a las dependencias de control automáticas, las actualizaciones promedio móviles de normalización por lotes se ejecutarán de inmediato. No es necesario recopilarlas por separado de la recolección de actualizaciones y añadirlas como dependencias de control explícitas.

Además, si le da un argumento `training` al método de pasada hacia adelante de su `tf.keras.layers.Layer`, Keras podrá pasarle la fase de entrenamiento actual y cualquier capa anidada al igual que lo hace para cualquier otra capa. Consulte la documentación de la API de `tf.keras.Model` para saber cómo maneja Keras el argumento `training`.

Si está decorando métodos `tf.Module`, deberá asegurarse de pasar manualmente todos los argumentos `training` que sean necesarios. Sin embargo, las actualizaciones promedio móviles de normalización por lotes se seguirán aplicando automáticamente sin necesidad de dependencias de control explícitas.

Los siguientes fragmentos de código demuestran cómo incrustar capas de normalización por lotes en el shim y cómo funciona su uso en un modelo Keras (aplicable a `tf.keras.layers.Layer`).

In [None]:
class CompatV1BatchNorm(tf.keras.layers.Layer):

  @tf.compat.v1.keras.utils.track_tf1_style_variables
  def call(self, inputs, training=None):
    print("Forward pass called with `training` =", training)
    with v1.variable_scope('batch_norm_layer'):
      return v1.layers.batch_normalization(x, training=training)

In [None]:
print("Constructing model")
inputs = tf.keras.Input(shape=(5, 5, 5))
outputs = CompatV1BatchNorm()(inputs)
model = tf.keras.Model(inputs=inputs, outputs=outputs)

print("Calling model in inference mode")
x = tf.random.normal(shape=(8, 5, 5, 5))
model(x, training=False)

print("Moving average variables before training: ",
      {var.name: var.read_value() for var in model.non_trainable_variables})

# Notice that when running TF2 and eager execution, the batchnorm layer directly
# updates the moving averages while training without needing any extra control
# dependencies
print("calling model in training mode")
model(x, training=True)

print("Moving average variables after training: ",
      {var.name: var.read_value() for var in model.non_trainable_variables})


### Reutilización de variables basada en el ámbito variable

Las creaciones de variables en la pasada hacia adelante basadas en `get_variable` mantendrán la misma semántica de nomenclatura y reutilización de variables que tienen los ámbitos de variables en TF1.x. Esto es cierto siempre que tenga al menos un ámbito externo no vacío para cualquier `tf.compat.v1.layers` con nombres autogenerados, como se mencionó anteriormente.

Nota: La asignación de nombres y la reutilización tendrán un alcance dentro de una única instancia de capa/módulo. Las llamadas a `get_variable` dentro de una capa o módulo decorado con shim no podrán consultar variables creadas dentro de capas o módulos. Puede evitar esto usando referencias Python a otras variables directamente si es necesario, en lugar de acceder a las variables a través de `get_variable`.

### Ejecución eager y `tf.function`

Como se ha visto anteriormente, los métodos decorados para `tf.keras.layers.Layer` y `tf.Module` se ejecutan dentro de ejecución eager y también son compatibles con `tf.function`. Esto significa que puede usar [pdb](https://docs.python.org/3/library/pdb.html) y otras herramientas interactivas para recorrer su pasada hacia adelante mientras se ejecuta.

Advertencia: Aunque es perfectamente seguro llamar a sus métodos de capa/módulo decorados con shim desde *dentro* de un `tf.function`, no es seguro poner `tf.function`s dentro de sus métodos decorados con shim si esos `tf.functions` contienen llamadas `get_variable`. Introducir una `tf.function` restablece `variable_scope`s, lo que significa que la reutilización de variables basada en el alcance de variables al estilo TF1.x que imita el shim no funcionará con esta configuración.

### Estrategias de distribución

Las llamadas a `get_variable` dentro de métodos de capas o módulos decorados con `@track_tf1_style_variables` usan creaciones de variables estándares `tf.Variable` de forma oculta. Esto significa que puede usarlas con las distintas estrategias de distribución disponibles con `tf.distribute`, como `MirroredStrategy` y `TPUStrategy`.

## Anidar `tf.Variable`s, `tf.Module`s, `tf.keras.layers` y `tf.keras.models` en llamadas decoradas

Decorar su llamada de capa en `tf.compat.v1.keras.utils.track_tf1_style_variables` sólo añadirá un seguimiento implícito automático de las variables creadas (y reutilizadas) mediante `tf.compat.v1.get_variable`. No capturará ponderaciones creadas directamente por llamadas a `tf.Variable`, como las que usan las capas Keras típicas y la mayoría de `tf.Module`. Esta sección describe cómo manejar estos casos anidados.


### (Usos preexistentes) `tf.keras.layers` y `tf.keras.models`

Para usos preexistentes de capas y modelos Keras anidados, use `tf.compat.v1.keras.utils.get_or_create_layer`. Esto sólo se recomienda para facilitar la migración de los usos anidados de Keras existentes en TF1.x; el código nuevo debe usar la configuración explícita de atributos como se describe a continuación para tf.Variables y tf.Modules.

Para usar `tf.compat.v1.keras.utils.get_or_create_layer`, envuelva el código que construye su modelo anidado en un método y páselo al método. Ejemplo:

In [None]:
class NestedModel(tf.keras.Model):

  def __init__(self, units, *args, **kwargs):
    super().__init__(*args, **kwargs)
    self.units = units

  def build_model(self):
    inp = tf.keras.Input(shape=(5, 5))
    dense_layer = tf.keras.layers.Dense(
        10, name="dense", kernel_regularizer="l2",
        kernel_initializer=tf.compat.v1.ones_initializer())
    model = tf.keras.Model(inputs=inp, outputs=dense_layer(inp))
    return model

  @tf.compat.v1.keras.utils.track_tf1_style_variables
  def call(self, inputs):
    # Get or create a nested model without assigning it as an explicit property
    model = tf.compat.v1.keras.utils.get_or_create_layer(
        "dense_model", self.build_model)
    return model(inputs)

layer = NestedModel(10)
layer(tf.ones(shape=(5,5)))

Este método garantiza que estas capas anidadas sean reutilizadas y seguidas correctamente por tensorflow. Tenga en cuenta que el decorador `@track_tf1_style_variables` sigue siendo necesario en el método apropiado. El método constructor de modelos pasado a `get_or_create_layer` (en este caso, `self.build_model`), no debe tomar argumentos.

Se hace seguimiento de las ponderaciones:

In [None]:
assert len(layer.weights) == 2
weights = {x.name: x for x in layer.variables}

assert set(weights.keys()) == {"dense/bias:0", "dense/kernel:0"}

layer.weights

Y también la pérdida de regularización:

In [None]:
tf.add_n(layer.losses)

### Migración incremental: `tf.Variables` y `tf. Modules`

Si necesita incrustar llamadas `tf.Variable` o `tf. Module` en sus métodos decorados (por ejemplo, si está siguiendo la migración incremental a las API de TF2 no heredadas que se describe más adelante en esta guía), aún deberá realizar un seguimiento explícito de las mismas, con los siguientes requisitos:

- Asegúrese explícitamente de que la variable/módulo/capa sólo se crea una vez
- Adjúntelos explícitamente como atributos de instancia del mismo modo que lo haría al definir un [módulo o capa típicos](https://www.tensorflow.org/guide/intro_to_modules#defining_models_and_layers_in_tensorflow)
- Reutilice explícitamente el objeto ya creado en las llamadas que sigan

Esto garantiza que las ponderaciones no se creen nuevas en cada llamada y se reutilicen correctamente. Además, esto también garantiza el seguimiento de las ponderaciones existentes y de las pérdidas de regularización.

Aquí tiene un ejemplo de cómo puede quedar:

In [None]:
class NestedLayer(tf.keras.layers.Layer):

  def __init__(self, units, *args, **kwargs):
    super().__init__(*args, **kwargs)
    self.units = units

  @tf.compat.v1.keras.utils.track_tf1_style_variables
  def __call__(self, inputs):
    out = inputs
    with tf.compat.v1.variable_scope("inner_dense"):
      # The weights are created with a `regularizer`,
      # so the layer should track their regularization losses
      kernel = tf.compat.v1.get_variable(
          shape=[out.shape[-1], self.units],
          regularizer=tf.keras.regularizers.L2(),
          initializer=tf.compat.v1.initializers.glorot_normal,
          name="kernel")
      bias = tf.compat.v1.get_variable(
          shape=[self.units,],
          initializer=tf.compat.v1.initializers.zeros,
          name="bias")
      out = tf.linalg.matmul(out, kernel)
      out = tf.compat.v1.nn.bias_add(out, bias)
    return out

class WrappedDenseLayer(tf.keras.layers.Layer):

  def __init__(self, units, **kwargs):
    super().__init__(**kwargs)
    self.units = units
    # Only create the nested tf.variable/module/layer/model
    # once, and then reuse it each time!
    self._dense_layer = NestedLayer(self.units)

  @tf.compat.v1.keras.utils.track_tf1_style_variables
  def call(self, inputs):
    with tf.compat.v1.variable_scope('outer'):
      outputs = tf.compat.v1.layers.dense(inputs, 3)
      outputs = tf.compat.v1.layers.dense(inputs, 4)
      return self._dense_layer(outputs)

layer = WrappedDenseLayer(10)

layer(tf.ones(shape=(5, 5)))

Tenga en cuenta que el seguimiento explícito del módulo anidado es necesario aunque esté decorado con el decorador `track_tf1_style_variables`. Esto se debe a que cada módulo/capa con métodos decorados tiene asociado su propio almacén de variables.

Se hace un seguimiento correcto de las ponderaciones:

In [None]:
assert len(layer.weights) == 6
weights = {x.name: x for x in layer.variables}

assert set(weights.keys()) == {"outer/inner_dense/bias:0",
                               "outer/inner_dense/kernel:0",
                               "outer/dense/bias:0",
                               "outer/dense/kernel:0",
                               "outer/dense_1/bias:0",
                               "outer/dense_1/kernel:0"}

layer.trainable_weights

Así como de la pérdida de regularización:

In [None]:
layer.losses

Tenga en cuenta que si la `NestedLayer` fuera un `tf.Module` no Keras en su lugar, las variables seguirían siendo objeto de seguimiento, pero las pérdidas de regularización no serían objeto de seguimiento automático, por lo que tendría que hacer un seguimiento explícito por separado.

### Orientación sobre los nombres de variables

Las llamadas explícitas `tf.Variable` y las capas Keras usan un mecanismo de autogeneración de nombre de capa/nombre de variable diferente al que puede estar acostumbrado por la combinación de `get_variable` y `variable_scopes`. Aunque la shim hará que sus nombres de variables coincidan para las variables creadas por `get_variable` incluso al pasar de grafos TF1.x a ejecución eager y `tf.function` de TF2, no puede garantizar lo mismo para los nombres de variables generados para las llamadas `tf.Variable` y las capas Keras que incruste dentro de sus decoradores de métodos. Incluso es posible que varias variables compartan el mismo nombre en la eager execution y `tf.function` de TF2.

Debe tener especial cuidado con esto cuando siga las secciones sobre validación de la corrección y mapeado de los puntos de verificación TF1.x más adelante en esta guía.

### Usar `tf.compat.v1.make_template` en el método decorado

**Es muy recomendable usar directamente `tf.compat.v1.keras.utils.track_tf1_style_variables` en lugar de usar `tf.compat.v1.make_template`, ya que es una capa más delgada encima de TF2**.

Siga la orientación de esta sección para el código TF1.x anterior que ya dependía de `tf.compat.v1.make_template`.

Dado que `tf.compat.v1.make_template` envuelve el código que utiliza `get_variable`, el decorador `track_tf1_style_variables` le permite usar estas plantillas en las llamadas a capas y realizar con éxito el seguimiento de las ponderaciones y las pérdidas de regularización.

Sin embargo, asegúrese de llamar a `make_template` sólo una vez y luego reutilizar la misma plantilla en cada llamada a la capa. De lo contrario, se creará una nueva plantilla cada vez que llame a la capa junto con un nuevo conjunto de variables.

Por ejemplo,

In [None]:
class CompatV1TemplateScaleByY(tf.keras.layers.Layer):

  def __init__(self, **kwargs):
    super().__init__(**kwargs)
    def my_op(x, scalar_name):
      var1 = tf.compat.v1.get_variable(scalar_name,
                            shape=[],
                            regularizer=tf.compat.v1.keras.regularizers.L2(),
                            initializer=tf.compat.v1.constant_initializer(1.5))
      return x * var1
    self.scale_by_y = tf.compat.v1.make_template('scale_by_y', my_op, scalar_name='y')

  @tf.compat.v1.keras.utils.track_tf1_style_variables
  def call(self, inputs):
    with tf.compat.v1.variable_scope('layer'):
      # Using a scope ensures the `scale_by_y` name will not be incremented
      # for each instantiation of the layer.
      return self.scale_by_y(inputs)

layer = CompatV1TemplateScaleByY()

out = layer(tf.ones(shape=(2, 3)))
print("weights:", layer.weights)
print("regularization loss:", layer.losses)
print("output:", out)

Advertencia: Evite compartir la misma plantilla `make_template` creada a través de múltiples instancias de capa ya que puede romper los mecanismos de seguimiento de pérdidas de variables y regularización del decorador shim. Además, si planea usar el mismo nombre de `make_template` dentro de múltiples instancias de capa, entonces debería anidar el uso de la plantilla creada dentro de un `variable_scope`. De lo contrario, el nombre generado para el `variable_scope` de la plantilla se incrementará con cada nueva instancia de la capa. Esto puede alterar los nombres de las ponderaciones de forma inesperada.

## Migración incremental al TF2 nativo

Como ya se ha mencionado, `track_tf1_style_variables` permite mezclar el estilo TF2 orientado a objetos `tf.Variable`/`tf.keras.layers.Layer`/`tf. Module` con el uso heredado `tf.compat.v1.get_variable`/`tf.compat.v1.layers` dentro del mismo módulo/capa decorado.

Esto significa que después de haber hecho su modelo TF1.x totalmente compatible con TF2, puede escribir todos los nuevos componentes del modelo con las API nativas de TF2 (que no sean `tf.compat.v1`) y hacer que interoperen con su código más antiguo.

Sin embargo, si sigue modificando sus componentes modelo más antiguos, también puede seleccionar cambiar gradualmente su uso de estilo heredado `tf.compat.v1` a las API orientadas a objetos puramente nativas que se recomiendan para el código TF2 recién escrito.

El uso de `tf.compat.v1.get_variable` puede ser reemplazado por llamadas a `self.add_weight` si está decorando una capa/modelo Keras, o por llamadas a `tf.Variable` si está decorando objetos Keras o `tf.Module`s.

Tanto la capa de estilo funcional como la orientada a objetos `tf.compat.v1.layers` pueden ser generalmente reemplazadas por la capa equivalente `tf.keras.layers` sin que se requieran cambios en los argumentos.

También puede considerar fraccionar partes de su modelo o patrones comunes en capas/módulos individuales durante su paso incremental a APIs puramente nativas, que pueden usar por sí mismas `track_tf1_style_variables`.

### Una nota sobre Slim y contrib.layers

Una gran cantidad de código anterior de TF 1.x usa la librería [Slim](https://ai.googleblog.com/2016/08/tf-slim-high-level-library-to-define.html), que se empaquetó con TF 1.x como `tf.contrib.layers`. Convertir el código que usa Slim a TF 2 nativo es más complicado que convertir `v1.layers`. De hecho, quizá tenga sentido convertir primero su código Slim a `v1.layers` y después convertirlo a Keras. A continuación encontrará una guía general para convertir el código Slim.

- Asegúrese de que todos los argumentos son explícitos. Elimine `arg_scopes` si es posible. Si aún necesita usarlos, divida `normalizer_fn` y `activation_fn` en sus propias capas.
- Las capas conv separables mapean una o varias capas Keras diferentes (capas Keras a profundidad, enfocadas a puntos y separables).
- Slim y `v1.layers` tienen diferentes nombres de argumentos y valores por defecto.
- Tenga en cuenta que algunos argumentos tienen escalas diferentes.

### Migración a TF2 nativo ignorando la compatibilidad de puntos de verificación

El siguiente ejemplo de código demuestra un paso incremental de un modelo a APIs puramente nativas sin tener en cuenta la compatibilidad de los puntos de verificación.

In [None]:
class CompatModel(tf.keras.layers.Layer):

  def __init__(self, units, *args, **kwargs):
    super().__init__(*args, **kwargs)
    self.units = units

  @tf.compat.v1.keras.utils.track_tf1_style_variables
  def call(self, inputs, training=None):
    with tf.compat.v1.variable_scope('model'):
      out = tf.compat.v1.layers.conv2d(
          inputs, 3, 3,
          kernel_regularizer="l2")
      out = tf.compat.v1.layers.flatten(out)
      out = tf.compat.v1.layers.dropout(out, training=training)
      out = tf.compat.v1.layers.dense(
          out, self.units,
          kernel_regularizer="l2")
      return out


A continuación, sustituya las APIs `compat.v1` con sus equivalentes nativos orientados a objetos por partes. Empiece por cambiar la capa de convolución por un objeto Keras creado en el constructor de capas.

In [None]:
class PartiallyMigratedModel(tf.keras.layers.Layer):

  def __init__(self, units, *args, **kwargs):
    super().__init__(*args, **kwargs)
    self.units = units
    self.conv_layer = tf.keras.layers.Conv2D(
      3, 3,
      kernel_regularizer="l2")

  @tf.compat.v1.keras.utils.track_tf1_style_variables
  def call(self, inputs, training=None):
    with tf.compat.v1.variable_scope('model'):
      out = self.conv_layer(inputs)
      out = tf.compat.v1.layers.flatten(out)
      out = tf.compat.v1.layers.dropout(out, training=training)
      out = tf.compat.v1.layers.dense(
          out, self.units,
          kernel_regularizer="l2")
      return out


Use la clase [`v1.keras.utils.DeterministicRandomTestTool`](https://www.tensorflow.org/api_docs/python/tf/compat/v1/keras/utils/DeterministicRandomTestTool) para verificar que este cambio incremental deja el modelo con el mismo comportamiento que antes.

In [None]:
random_tool = v1.keras.utils.DeterministicRandomTestTool(mode='num_random_ops')
with random_tool.scope():
  tf.keras.utils.set_random_seed(42)
  layer = CompatModel(10)

  inputs = tf.random.normal(shape=(10, 5, 5, 5))
  original_output = layer(inputs)

  # Grab the regularization loss as well
  original_regularization_loss = tf.math.add_n(layer.losses)

print(original_regularization_loss)

In [None]:
random_tool = v1.keras.utils.DeterministicRandomTestTool(mode='num_random_ops')
with random_tool.scope():
  tf.keras.utils.set_random_seed(42)
  layer = PartiallyMigratedModel(10)

  inputs = tf.random.normal(shape=(10, 5, 5, 5))
  migrated_output = layer(inputs)

  # Grab the regularization loss as well
  migrated_regularization_loss = tf.math.add_n(layer.losses)

print(migrated_regularization_loss)

In [None]:
# Verify that the regularization loss and output both match
np.testing.assert_allclose(original_regularization_loss.numpy(), migrated_regularization_loss.numpy())
np.testing.assert_allclose(original_output.numpy(), migrated_output.numpy())

Ahora ha sustituido todas las `compat.v1.layers` individuales por capas Keras nativas.

In [None]:
class NearlyFullyNativeModel(tf.keras.layers.Layer):

  def __init__(self, units, *args, **kwargs):
    super().__init__(*args, **kwargs)
    self.units = units
    self.conv_layer = tf.keras.layers.Conv2D(
      3, 3,
      kernel_regularizer="l2")
    self.flatten_layer = tf.keras.layers.Flatten()
    self.dense_layer = tf.keras.layers.Dense(
      self.units,
      kernel_regularizer="l2")

  @tf.compat.v1.keras.utils.track_tf1_style_variables
  def call(self, inputs):
    with tf.compat.v1.variable_scope('model'):
      out = self.conv_layer(inputs)
      out = self.flatten_layer(out)
      out = self.dense_layer(out)
      return out


In [None]:
random_tool = v1.keras.utils.DeterministicRandomTestTool(mode='num_random_ops')
with random_tool.scope():
  tf.keras.utils.set_random_seed(42)
  layer = NearlyFullyNativeModel(10)

  inputs = tf.random.normal(shape=(10, 5, 5, 5))
  migrated_output = layer(inputs)

  # Grab the regularization loss as well
  migrated_regularization_loss = tf.math.add_n(layer.losses)

print(migrated_regularization_loss)

In [None]:
# Verify that the regularization loss and output both match
np.testing.assert_allclose(original_regularization_loss.numpy(), migrated_regularization_loss.numpy())
np.testing.assert_allclose(original_output.numpy(), migrated_output.numpy())

Por último, elimine tanto cualquier uso restante (que ya no sea necesario) de `variable_scope` como el propio decorador `track_tf1_style_variables`.

Ahora solo le queda una versión del modelo que usa APIs totalmente nativas.

In [None]:
class FullyNativeModel(tf.keras.layers.Layer):

  def __init__(self, units, *args, **kwargs):
    super().__init__(*args, **kwargs)
    self.units = units
    self.conv_layer = tf.keras.layers.Conv2D(
      3, 3,
      kernel_regularizer="l2")
    self.flatten_layer = tf.keras.layers.Flatten()
    self.dense_layer = tf.keras.layers.Dense(
      self.units,
      kernel_regularizer="l2")

  def call(self, inputs):
    out = self.conv_layer(inputs)
    out = self.flatten_layer(out)
    out = self.dense_layer(out)
    return out


In [None]:
random_tool = v1.keras.utils.DeterministicRandomTestTool(mode='num_random_ops')
with random_tool.scope():
  tf.keras.utils.set_random_seed(42)
  layer = FullyNativeModel(10)

  inputs = tf.random.normal(shape=(10, 5, 5, 5))
  migrated_output = layer(inputs)

  # Grab the regularization loss as well
  migrated_regularization_loss = tf.math.add_n(layer.losses)

print(migrated_regularization_loss)

In [None]:
# Verify that the regularization loss and output both match
np.testing.assert_allclose(original_regularization_loss.numpy(), migrated_regularization_loss.numpy())
np.testing.assert_allclose(original_output.numpy(), migrated_output.numpy())

### Mantener la compatibilidad de los puntos de verificación durante la migración al TF2 nativo

El proceso de migración anterior a las APIs nativas de TF2 cambió tanto los nombres de las variables (ya que las APIs de Keras producen nombres de ponderación muy diferentes), como las rutas orientadas a objetos que apuntan a diferentes ponderaciones en el modelo. Estos cambios dejarán inservibles tanto los puntos de verificación basados en nombres al estilo TF1 como los puntos de verificación orientados a objetos al estilo TF2.

Sin embargo, en algunos casos, es posible que pueda tomar su punto de verificación original basado en nombres y encontrar un mapeado de las variables a sus nuevos nombres con enfoques como el que se detalla en la guía [Reutilización de puntos de verificación TF1.x](./migrating_checkpoints.ipynb).

Algunos consejos para que esto sea factible son los siguientes:

- Las variables siguen teniendo todas un argumento `name` que puede configurar.
- Los modelos Keras también toman un argumento `name` que configuran como prefijo para sus variables.
- La función `v1.name_scope` puede usarse para configurar los prefijos de los nombres de las variables. Esto es muy diferente de `tf.variable_scope`. Sólo afecta a los nombres, y no hace un seguimiento de las variables y su reutilización.

Con las indicaciones anteriores en mente, los ejemplos de código siguientes demuestran un flujo de trabajo que puede adaptar a su código para actualizar de forma incremental parte de un modelo mientras se actualizan simultáneamente los puntos de verificación.

Nota: Debido a la complejidad de la denominación de variables con las capas Keras, no se garantiza que esto funcione para todos los casos de uso.

1. Empiece por cambiar las capas `tf.compat.v1.layers` de estilo funcional por sus versiones orientadas a objetos.

In [None]:
class FunctionalStyleCompatModel(tf.keras.layers.Layer):

  @tf.compat.v1.keras.utils.track_tf1_style_variables
  def call(self, inputs, training=None):
    with tf.compat.v1.variable_scope('model'):
      out = tf.compat.v1.layers.conv2d(
          inputs, 3, 3,
          kernel_regularizer="l2")
      out = tf.compat.v1.layers.conv2d(
          out, 4, 4,
          kernel_regularizer="l2")
      out = tf.compat.v1.layers.conv2d(
          out, 5, 5,
          kernel_regularizer="l2")
      return out

layer = FunctionalStyleCompatModel()
layer(tf.ones(shape=(10, 10, 10, 10)))
[v.name for v in layer.weights]

1. A continuación, asigne los objetos compat.v1.layer y cualquier variable creada por `compat.v1.get_variable` como propiedades del objeto `tf.keras.layers.Layer`/`tf.Module` cuyo método está decorado con `track_tf1_style_variables` (tenga en cuenta que cualquier punto de verificación del estilo TF2 orientado a objetos guardará ahora tanto una ruta por nombre de variable como la nueva ruta orientada a objetos).

In [None]:
class OOStyleCompatModel(tf.keras.layers.Layer):

  def __init__(self, *args, **kwargs):
    super().__init__(*args, **kwargs)
    self.conv_1 = tf.compat.v1.layers.Conv2D(
          3, 3,
          kernel_regularizer="l2")
    self.conv_2 = tf.compat.v1.layers.Conv2D(
          4, 4,
          kernel_regularizer="l2")

  @tf.compat.v1.keras.utils.track_tf1_style_variables
  def call(self, inputs, training=None):
    with tf.compat.v1.variable_scope('model'):
      out = self.conv_1(inputs)
      out = self.conv_2(out)
      out = tf.compat.v1.layers.conv2d(
          out, 5, 5,
          kernel_regularizer="l2")
      return out

layer = OOStyleCompatModel()
layer(tf.ones(shape=(10, 10, 10, 10)))
[v.name for v in layer.weights]

1. Vuelva a guardar un punto de verificación cargado en este punto para guardar las rutas tanto por el nombre de la variable (para compat.v1.layers), como por el grafo de objetos orientado a objetos.

In [None]:
weights = {v.name: v for v in layer.weights}
assert weights['model/conv2d/kernel:0'] is layer.conv_1.kernel
assert weights['model/conv2d_1/bias:0'] is layer.conv_2.bias

1. Ahora puede cambiar las `compat.v1.layers` orientadas a objetos por capas Keras nativas sin dejar de poder cargar el punto de verificación guardado recientemente. Asegúrese de conservar los nombres de las variables para las `compat.v1.layers` restantes registrando aún los `variable_scopes` autogenerados de las capas sustituidas. Estas capas/variables sustituidas ahora sólo usarán la ruta del atributo del objeto a las variables en el punto de verificación en lugar de la ruta del nombre de la variable.

En general, puede reemplazar el uso de `compat.v1.get_variable` en variables adjuntas a propiedades por:

- Cambiarlas para usar `tf.Variable`, **O**
- Actualizarlas usando [`tf.keras.layers.Layer.add_weight`](https://www.tensorflow.org/api_docs/python/tf/keras/layers/Layer#add_weight). Tenga en cuenta que si no está cambiando todas las capas de una sola vez, esto puede cambiar la nomenclatura autogenerada de capas/variables para las `compat.v1.layers` restantes a las que les falta un argumento `name`. Si ese es el caso, debe conservar los nombres de las variables para las `compat.v1.layers` restantes igual abriendo y cerrando manualmente un `ámbito_variable` correspondiente al nombre de ámbito generado de la `compat.v1.layer` eliminada. De lo contrario, las rutas de los puntos de verificación existentes pueden entrar en conflicto y la carga de puntos de verificación se comportará de forma incorrecta.


In [None]:
def record_scope(scope_name):
  """Record a variable_scope to make sure future ones get incremented."""
  with tf.compat.v1.variable_scope(scope_name):
    pass

class PartiallyNativeKerasLayersModel(tf.keras.layers.Layer):

  def __init__(self, *args, **kwargs):
    super().__init__(*args, **kwargs)
    self.conv_1 = tf.keras.layers.Conv2D(
          3, 3,
          kernel_regularizer="l2")
    self.conv_2 = tf.keras.layers.Conv2D(
          4, 4,
          kernel_regularizer="l2")

  @tf.compat.v1.keras.utils.track_tf1_style_variables
  def call(self, inputs, training=None):
    with tf.compat.v1.variable_scope('model'):
      out = self.conv_1(inputs)
      record_scope('conv2d') # Only needed if follow-on compat.v1.layers do not pass a `name` arg
      out = self.conv_2(out)
      record_scope('conv2d_1') # Only needed if follow-on compat.v1.layers do not pass a `name` arg
      out = tf.compat.v1.layers.conv2d(
          out, 5, 5,
          kernel_regularizer="l2")
      return out

layer = PartiallyNativeKerasLayersModel()
layer(tf.ones(shape=(10, 10, 10, 10)))
[v.name for v in layer.weights]

Guardar un punto de verificación en este paso después de construir las variables hará que contenga ***sólo*** las rutas de objetos disponibles en ese momento.

Asegúrese de registrar los ámbitos de las `compat.v1.layers` eliminadas para conservar los nombres de ponderación autogenerados para las `compat.v1.layers` restantes.

In [None]:
weights = set(v.name for v in layer.weights)
assert 'model/conv2d_2/kernel:0' in weights
assert 'model/conv2d_2/bias:0' in weights

1. Repita los pasos anteriores hasta que haya sustituido todas las `compat.v1.layers` y `compat.v1.get_variable` de su modelo por equivalentes totalmente nativos.

In [None]:
class FullyNativeKerasLayersModel(tf.keras.layers.Layer):

  def __init__(self, *args, **kwargs):
    super().__init__(*args, **kwargs)
    self.conv_1 = tf.keras.layers.Conv2D(
          3, 3,
          kernel_regularizer="l2")
    self.conv_2 = tf.keras.layers.Conv2D(
          4, 4,
          kernel_regularizer="l2")
    self.conv_3 = tf.keras.layers.Conv2D(
          5, 5,
          kernel_regularizer="l2")


  def call(self, inputs, training=None):
    with tf.compat.v1.variable_scope('model'):
      out = self.conv_1(inputs)
      out = self.conv_2(out)
      out = self.conv_3(out)
      return out

layer = FullyNativeKerasLayersModel()
layer(tf.ones(shape=(10, 10, 10, 10)))
[v.name for v in layer.weights]

Recuerde realizar pruebas para asegurarse de que el punto de verificación recién actualizado sigue comportándose como espera. Aplique las técnicas descritas en la [guía de validación de la corrección numérica](./validate_correctness.ipynb) en cada paso incremental de este proceso para asegurarse de que su código migrado se ejecuta correctamente.

## Manejar los cambios de comportamiento de TF1.x a TF2 no cubiertos por los shim de modelado

Los shim de modelado descritos en esta guía pueden garantizar que las variables, las capas y las pérdidas de regularización creadas con las semánticas `get_variable`, `tf.compat.v1.layers` y `variable_scope` sigan funcionando como antes al usar ejecución eager y `tf.function`, sin tener que depender de las recopilaciones.

Esto no cubre ***toda*** la semántica específica de TF1.x en la que pueden estar basándose sus modelos de pase hacia adelante. En algunos casos, los shim pueden ser insuficientes para que su pase hacia delante modelo entre en TF2 por sí solo. Lea la [Guía de comportamientos de TF1.x frente a TF2](./tf1_vs_tf2) para saber más sobre las diferencias de comportamiento entre TF1.x y TF2.