##### Copyright 2019 The TensorFlow Authors.

In [1]:
#@title Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
# https://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

# ニューラルネットワークによるディープラーニングのHello World

あらゆる最初のアプリと同様に、まずは、コードの動作方法のスキャフォールド（足場）を全体的に把握できる単純なことから始めると良いです。  

ニューラルネットワークを作成する場合、使いたいサンプルは、２つの数の間の関係を学習するサンプルです。たとえば、このような関数のコードを書く場合、「ルール」はすでに分かっています。 


```
float hw_function(float x){
    float y = (2 * x) - 1;
    return y;
}
```

では、同じようなタスクを行うようにニューラルネットワークを訓練するには、どうしたら良いでしょうか？データを使うのです。XのセットとYのセットを読み込ませることで、それらの関係を見つけ出せるようになるはずです。

これは明らかに、皆さんが慣れているパラダイムとは異なるので、１つずつ見ていきましょう。


## インポート

インポートすることから始めましょう。ここではTensorFlowをインポートしますが、使いやすくするためにtfと呼ぶことにします。

次に、numpyというライブラリをインポートします。データを簡単かつ迅速にリストとして表現できるようになります。

ニューラルネットワークをSequential層のセットとして定義するフレームワークはkerasと呼ばれます。これもインポートします。

In [2]:
import tensorflow as tf
import numpy as np
from tensorflow import keras

## ニューラルネットワークを定義し、コンパイルする

次に、可能な限り最も単純なニューラルネットワークを作成していきます。１つの層があり、その層には１つのニューロンがあり、その入力形状の値は１つだけです。

In [3]:
model = tf.keras.Sequential([keras.layers.Dense(units=1, input_shape=[1])])

今度は、ニューラルネットワークをコンパイルします。このとき、２つの関数を指定する必要があります。損失(loss)関数と最適化アルゴリズム(optimizer)です。

機械学習用の数学をたくさん見たことがあるとわかるように、通常ここで使われますが、この場合は関数にカプセル化されて使いやすくなっています。ここで何が起こるか、説明しておきましょう。

関数で表すと、数の関係はy=2ｘ-1であることがわかっています。 

コンピューターがそれを「学習」しようとするとき、推測を行います。たとえば、y=10x+10というように。損失関数は、既知の正しい答えに対する推測した答えについて評価し、どのくらい良いか悪いかを評価します。

次に、最適化アルゴリズムを使用して、別の推測を行います。損失関数の評価に基づいて、損失の最小化を試みます。その時点で、y=5x+5などを思いつくかもしれません。まだかなり悪いですが、正しい結果に近づいています。（すなわち、損失が低くなっています）

これを、エポック数だけ繰り返します。これについてはもう少し後で見ていきます。ここではまず、損失関数には「平均二乗誤差」を使用し、最適化アルゴリズムには「確率的勾配降下法」を使用するように指定する方法を示します。そのための数学を理解する必要は今のところありませんが、これらが有効であることはわかります。

そのうち、さまざまなシナリオに適したさまざまな損失関数および最適化アルゴリズムを見ていくことになるでしょう。


In [4]:
model.compile(optimizer='sgd', loss='mean_squared_error')

## データを与える

次に、いくつかのデータを与えます。この例では、６つのxと６つのyを与えます。これらの関係はy=2x-1なので、x = -1のとき、y=-3になります。

NumpyというPythonライブラリは、事実上の業界標準と言える配列型データ構造を多数提供しています。値をnp.array[ ]として指定することによって、これらを使用することを宣言します。

In [5]:
xs = np.array([-1.0,  0.0, 1.0, 2.0, 3.0, 4.0], dtype=float)
ys = np.array([-3.0, -1.0, 1.0, 3.0, 5.0, 7.0], dtype=float)

# ニューラルネットワークを訓練する

ニューラルネットワークの訓練プロセスでは、XとYの関係が**model.fit**コールにあることを「学習」します。ここで、すでにお話ししたループを繰り返し、推測を行い、それがどのくらい良いか悪いか（すなわち、損失）を評価し、最適化アルゴリズムを使用して別の推測を行う、といったことが行われます。これを、指定したエポックの数だけ行います。このコードを実行すると、右側に損失が表示されます。

In [6]:
model.fit(xs, ys, epochs=500)

Epoch 1/500
Epoch 2/500
Epoch 3/500
Epoch 4/500
Epoch 5/500
Epoch 6/500
Epoch 7/500
Epoch 8/500
Epoch 9/500
Epoch 10/500
Epoch 11/500
Epoch 12/500
Epoch 13/500
Epoch 14/500
Epoch 15/500
Epoch 16/500
Epoch 17/500
Epoch 18/500
Epoch 19/500
Epoch 20/500
Epoch 21/500
Epoch 22/500
Epoch 23/500
Epoch 24/500
Epoch 25/500
Epoch 26/500
Epoch 27/500
Epoch 28/500
Epoch 29/500
Epoch 30/500
Epoch 31/500
Epoch 32/500
Epoch 33/500
Epoch 34/500
Epoch 35/500
Epoch 36/500
Epoch 37/500
Epoch 38/500
Epoch 39/500
Epoch 40/500
Epoch 41/500
Epoch 42/500
Epoch 43/500
Epoch 44/500
Epoch 45/500
Epoch 46/500
Epoch 47/500
Epoch 48/500
Epoch 49/500
Epoch 50/500
Epoch 51/500
Epoch 52/500
Epoch 53/500
Epoch 54/500
Epoch 55/500
Epoch 56/500
Epoch 57/500
Epoch 58/500
Epoch 59/500
Epoch 60/500
Epoch 61/500
Epoch 62/500
Epoch 63/500
Epoch 64/500
Epoch 65/500
Epoch 66/500
Epoch 67/500
Epoch 68/500
Epoch 69/500
Epoch 70/500
Epoch 71/500
Epoch 72/500
Epoch 73/500
Epoch 74/500
Epoch 75/500
Epoch 76/500
Epoch 77/500
Epoch 78

<keras.callbacks.History at 0x7fa29fb2f210>

これで、XとYの関係を学習するように訓練されたモデルができました。**model.predict**メソッドを使用して、以前は未知であったXに対するYを見つけ出させることができます。たとえば、X = 10の場合、Yはいくつになると思いますか？このコードを実行する前に、推測してみましょう。

In [7]:
print(model.predict([10.0]))

[[18.979761]]


19だと思いませんでしたか？しかし、それより少し少ない値になります。なぜだと思いますか？ 

ニューラルネットワークは確率を扱うので、ニューラルネットワークにデータを与えると、XとYの間の関係はY=2X-1である確率が非常に高いと計算しますが、６つのデータポイントだけでは、確実なことはわかりません。結果として、10の場合の結果は19に非常に近いですが、必ずしも19ではありません。

ニューラルネットワークを使用していると、このパターンを繰り返し見ることになります。ほぼ常に、確実性ではなく確率を扱うことになり、分類に関するときには特に、確率に基づいて結果を見つけ出すために少しコーディングを行います。
