##### Copyright 2021 The TensorFlow Authors.

In [None]:
#@title Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
# https://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

# <a>TPUEstimator から TPUStrategy への移行</a>

<table class="tfo-notebook-buttons" align="left">
  <td>     <a target="_blank" href="https://www.tensorflow.org/guide/migrate/tpu_estimator"><img src="https://www.tensorflow.org/images/tf_logo_32px.png">TensorFlow.org で表示</a>
</td>
  <td>     <a target="_blank" href="https://colab.research.google.com/github/tensorflow/docs-l10n/blob/master/site/ja/guide/migrate/tpu_estimator.ipynb"><img src="https://www.tensorflow.org/images/colab_logo_32px.png">Google Colab で実行</a>
</td>
  <td><a target="_blank" href="https://github.com/tensorflow/docs-l10n/blob/master/site/ja/guide/migrate/tpu_estimator.ipynb"><img src="https://www.tensorflow.org/images/GitHub-Mark-32px.png">GitHub でソースを表示</a></td>
  <td>     <a href="https://storage.googleapis.com/tensorflow_docs/docs-l10n/site/ja/guide/migrate/tpu_estimator.ipynb"><img src="https://www.tensorflow.org/images/download_logo_32px.png">ノートブックをダウンロード</a>   </td>
</table>

このガイドでは、[TPU](../../guide/tpu.ipynb) で実行されているワークフローを TensorFlow 1 の `TPUEstimator` API から TensorFlow 2 の `TPUStrategy` API に移行する方法を示します。

- TensorFlow 1 では、`tf.compat.v1.estimator.tpu.TPUEstimator` API を使用して、モデルのトレーニングと評価、推論の実行、モデルの（サービングのための）保存を（クラウド）TPU で行うことができます。
- TensorFlow 2 で、TPU と TPU Pod（専用の高速ネットワーク インターフェースで接続された TPU デバイスのコレクション）で同期トレーニングを実行するには、TPU 分散ストラテジー（`tf.distribute.TPUStrategy`）を使用する必要があります。このストラテジーは、モデル構築（`tf.keras.Model`）、オプティマイザ（`tf.keras.optimizers.Optimizer`）、およびトレーニング（`Model.fit`）、およびカスタムトレーニングループ（`tf.function` と `tf.GradientTape` を使用）で使用できます。

エンドツーエンドの TensorFlow 2 の例については、[TPU の使用](../../guide/tpu.ipynb)ガイド（*TPU の分類*セクション）と [TPU で BERT を使用して GLUE タスクを解決する](https://www.tensorflow.org/text/tutorials/bert_glue)チュートリアルを参照してください。また、[分散トレーニング](../../guide/distributed_training.ipynb)ガイドも役立つかもしれません。このガイドでは、`TPUStrategy` を含むすべての TensorFlow 分散ストラテジーについて説明されています。

## セットアップ

まず、インポートし、デモ用の単純なデータセットから始めます。

In [None]:
import tensorflow as tf
import tensorflow.compat.v1 as tf1

In [None]:
features = [[1., 1.5]]
labels = [[0.3]]
eval_features = [[4., 4.5]]
eval_labels = [[0.8]]

## TensorFlow 1: TPUEstimator を使用して TPU でモデルを駆動する

このセクションでは、TensorFlow 1 で `tf.compat.v1.estimator.tpu.TPUEstimator` を使用してトレーニングと評価を実行する方法を示します。

`TPUEstimator` を使用するには、まず、トレーニングデータの入力関数、評価データの評価入力関数、および特徴量とラベルを使用してトレーニング演算がどのように定義されるかを `Estimator` に伝えるモデル関数など、いくつかの関数を定義します。

In [None]:
def _input_fn(params):
  dataset = tf1.data.Dataset.from_tensor_slices((features, labels))
  dataset = dataset.repeat()
  return dataset.batch(params['batch_size'], drop_remainder=True)

def _eval_input_fn(params):
  dataset = tf1.data.Dataset.from_tensor_slices((eval_features, eval_labels))
  dataset = dataset.repeat()
  return dataset.batch(params['batch_size'], drop_remainder=True)

def _model_fn(features, labels, mode, params):
  logits = tf1.layers.Dense(1)(features)
  loss = tf1.losses.mean_squared_error(labels=labels, predictions=logits)
  optimizer = tf1.train.AdagradOptimizer(0.05)
  train_op = optimizer.minimize(loss, global_step=tf1.train.get_global_step())
  return tf1.estimator.tpu.TPUEstimatorSpec(mode, loss=loss, train_op=train_op)

これらの関数を定義したら、クラスタ情報を提供する `tf.distribute.cluster_resolver.TPUClusterResolver` と `tf.compat.v1.estimator.tpu.RunConfig` オブジェクトを作成します。定義したモデル関数に加えて、`TPUEstimator` を作成できるようになりました。ここでは、チェックポイントの保存をスキップしてフローを簡素化します。次に、`TPUEstimator` のトレーニングと評価の両方のバッチサイズを指定します。

In [None]:
cluster_resolver = tf1.distribute.cluster_resolver.TPUClusterResolver(tpu='')
print("All devices: ", tf1.config.list_logical_devices('TPU'))

In [None]:
tpu_config = tf1.estimator.tpu.TPUConfig(iterations_per_loop=10)
config = tf1.estimator.tpu.RunConfig(
    cluster=cluster_resolver,
    save_checkpoints_steps=None,
    tpu_config=tpu_config)
estimator = tf1.estimator.tpu.TPUEstimator(
    model_fn=_model_fn,
    config=config,
    train_batch_size=8,
    eval_batch_size=8)

`TPUEstimator.train` を呼び出して、モデルのトレーニングを開始します。

In [None]:
estimator.train(_input_fn, steps=1)

次に、`TPUEstimator.evaluate` を呼び出して、評価データを使用してモデルを評価します。

In [None]:
estimator.evaluate(_eval_input_fn, steps=1)

## TensorFlow 2: Keras Model.fit と TPUStrategy を使用して TPU でモデルを駆動する

TensorFlow 2 で TPU ワーカーをトレーニングするには、`tf.distribute.TPUStrategy` を Keras API とともに使用して、モデルの定義とトレーニング/評価を行います。（Keras Model.fit とカスタムトレーニングループ（<code>tf.function</code> と `tf.GradientTape` を使用）を使用したトレーニングのその他の例については、<a>TPU の使用</a>ガイドを参照してください。）

リモートクラスタに接続して TPU ワーカーを初期化するには初期化作業を行う必要があります。まず `TPUClusterResolver` を作成してクラスタ情報を提供し、クラスタに接続します。（詳しくは、<a>TPU の使用</a>ガイドの <em>TPU 初期化</em> セクションを参照してください）。

In [None]:
cluster_resolver = tf.distribute.cluster_resolver.TPUClusterResolver(tpu='')
tf.config.experimental_connect_to_cluster(cluster_resolver)
tf.tpu.experimental.initialize_tpu_system(cluster_resolver)
print("All devices: ", tf.config.list_logical_devices('TPU'))

次に、データの準備が整ったら、`TPUStrategy` を作成し、このストラテジーの範囲でモデル、指標、オプティマイザを定義します。

`TPUStrategy` で同等のトレーニング速度を達成するには、各 `tf.function` 呼び出し中に実行されるバッチ数を指定するために `Model.compile` で `steps_per_execution` の数値を選択する必要があります。これは、パフォーマンスにとって重要です。この引数は、`TPUEstimator` で使用される `iterations_per_loop` に似ています。カスタムトレーニングループを使用している場合は、`tf.function` を使用したトレーニング関数内で複数のステップが実行されていることを確認する必要があります。詳細については、[TPU の使用](../../guide/tpu.ipynb)ガイドの *tf.function 内の複数のステップによるパフォーマンスの改善*セクションに移動してください。

`tf.distribute.TPUStrategy` は、動的形状計算の上限を推測できる境界のある動的形状をサポートします。ただし、動的形状では、静的形状と比較してパフォーマンスのオーバーヘッドが発生する場合があります。そのため、特にトレーニングでは、可能であれば入力形状を静的にすることを推奨します。ストリームに残っているサンプルの数がバッチ サイズよりも少ない可能性があるため、動的な形状を返す 1 つの一般的な演算は `tf.data.Dataset.batch(batch_size)` です。したがって、TPU でトレーニングする場合は、最高のトレーニングのパフォーマンスを得るために `tf.data.Dataset.batch(..., drop_reminder=True)` を使用する必要があります。

In [None]:
dataset = tf.data.Dataset.from_tensor_slices(
    (features, labels)).shuffle(10).repeat().batch(
        8, drop_remainder=True).prefetch(2)
eval_dataset = tf.data.Dataset.from_tensor_slices(
    (eval_features, eval_labels)).batch(1, drop_remainder=True)

strategy = tf.distribute.TPUStrategy(cluster_resolver)
with strategy.scope():
  model = tf.keras.models.Sequential([tf.keras.layers.Dense(1)])
  optimizer = tf.keras.optimizers.Adagrad(learning_rate=0.05)
  model.compile(optimizer, "mse", steps_per_execution=10)

以上でトレーニングデータセットを使用してモデルをトレーニングする準備が整いました。

In [None]:
model.fit(dataset, epochs=5, steps_per_epoch=10)

最後に、評価データセットを使用してモデルを評価します。

In [None]:
model.evaluate(eval_dataset, return_dict=True)

## 次のステップ

TensorFlow 2 の `TPUStrategy` についての詳細は、次のリソースを参照してください。

- ガイド: [TPU の使用](../../guide/tpu.ipynb)（Keras `Model.fit` を使用したトレーニング / `tf.distribute.TPUStrategy` を使用したカスタムトレーニングループと、`tf.function` でパフォーマンスを改善するためのヒントを含む）
- ガイド: [TensorFlow による分散トレーニング](../../guide/distributed_training.ipynb)

トレーニングのカスタマイズの詳細については、次を参照してください。

- ガイド: [Model.fit の処理をカスタマイズする](../..guide/keras/customizing_what_happens_in_fit.ipynb)
- ガイド: [トレーニングループの新規作成](https://www.tensorflow.org/guide/keras/writing_a_training_loop_from_scratch)

TPU（Google の機械学習専用 ASIC）は、[Google Colab](https://colab.research.google.com/)、[TPU Research Cloud](https://sites.research.google/trc/)、[Cloud TPU](https://cloud.google.com/tpu) から入手できます。