# The Hello World of Deep Learning with Neural Networks

あなたのコードがどのように動作するか、全体的な流れを示す超シンプルなものから始めてみましょう。

ニューラルネットワークを作成する場合、私が好んで使用するサンプルは、2つの数値の関係を学習するものです。例えば、以下のような関数のコードを書いている場合、すでに「ルール」を知っています。

```
float my_function(float x){
    float y = (3 * x) + 1;
    return y;
}
```
では、どのようにしてニューラルネットワークを訓練して同等のタスクを実行するのでしょうか？データを使うのです! XとYのセットを与えることで、機械はそれらの間の関係を把握することができるはずです。

これは明らかに、あなたが慣れているものとは非常に異なるパラダイムです。ひとつひとつ見ていきましょう。


## Imports

まずはインポートから始めましょう。ここではTensorFlowをインポートし、使いやすさを考慮してtfと呼んでいます。

次に、numpyというライブラリをインポートします。これはデータをかんたんに、すばやくリスト形式で表現することができます。

ニューラルネットワークをシーケンシャルレイヤーの集合として定義するkerasというフレームワークもインポートします。

In [0]:
import tensorflow as tf
import numpy as np
from tensorflow import keras

## Define and Compile the Neural Network


次に、可能な限りシンプルなニューラルネットワークを作成します。これは1つの層を持ち、その層には1つのニューロンをもちます。またそこへの入力は1つの値だけです。

In [0]:
model = tf.keras.Sequential([keras.layers.Dense(units=1, input_shape=[1])])

ここでニューラルネットワークをコンパイルします。その際、2つの関数、損失とオプティマイザを指定しなければなりません。

機械学習の数学をたくさん見たことがある人は、ここが通常使われている場所ですが、この場合は関数にうまくカプセル化されています。しかし、ここで何が起こるのか説明しましょう...この関数では、数の関係は y=3x+1 であることがわかっています。

コンピュータがそれを「学習」しようとしているとき、コンピュータは推測をします...たぶんy=10x+10です。LOSS関数は、推測された答えを既知の正解と比較して、どれだけうまくいったか、あるいはどれだけ悪い結果になったかを測定します。

そして、OPTIMIZER関数を使用して別の推測を行います。LOSS関数がどのような結果を出したかに基づいて、損失を最小化しようとします。この時点で、おそらくy=5x+5のような結果が出てくるでしょう。これはまだかなり悪いですが、正しい結果に近い（つまり損失が少ない）ものです。

これはまもなく表示されるEPOCHSの数だけ繰り返されます。しかし、最初に、損失には「MEAN SQUARED ERROR（平均二乗誤差）」を、オプティマイザには「STOCHASTIC GRADIENT DESCENT（確率的勾配降下法）」を使用するように指示します。まだこれらの数学を理解する必要はありませんが、動作することがわかります。

時間が経つにつれて、さまざまなシナリオのための異なる適切な損失とオプティマイザー関数を学ぶことになるでしょう。

In [0]:
model.compile(optimizer='sgd', loss='mean_squared_error')

## Providing the Data


次はデータを入力します。このケースでは、6つのxsと6つのysを入力しています。これらの間の関係は y=2x-1 であり、x = -1, y=-3 などとなります。

「Numpy」と呼ばれる python ライブラリは、配列型のデータ構造をたくさん提供しています。これらを使用したい場合は、np.array[]に値を指定することで宣言します。

In [0]:
xs = np.array([-1.0, 0.0, 1.0, 2.0, 3.0, 4.0], dtype=float)
ys = np.array([-2.0, 1.0, 4.0, 7.0, 10.0, 13.0], dtype=float)

# Training the Neural Network

ニューラルネットワークを学習するプロセスで、XとYの関係を「学習」するのは**model.fit**を呼び出すことで可能となります。ここでは、上で説明したループを経て、推測を行い、それがどれくらい良いか悪いか（損失）を測定し、オプティマイザを使って別の推測を行うなどの処理を行います。これを指定したエポック数だけ行います。このコードを実行すると、右側に損失が表示されます。

In [0]:
model.fit(xs, ys, epochs=500)


これで、XとYの関係を学習するために訓練されたモデルができました。 **model.predict**メソッドを使って、未知のXに対してYを求めることができます。例えば、X = 10のときにYはどうなると思いますか？このコードを実行する前に推測してみてください。

In [0]:
print(model.predict([10.0]))



おそらく、31だと思っていたかもしれませんね。でも結局ちょっとオーバーしてしまいました。なぜだと思いますか？

ニューラルネットワークは確率を扱うので、NNに与えたデータから、XとYの関係はY=3X+1という非常に高い確率であることを計算していますが、6つのデータポイントしかないので確かなことはわかりません。その結果、10の結果は31に非常に近いのですが、必ずしも31とは限りません。

ニューラルネットワークを使うと、このパターンが繰り返されることがわかります。ほとんどの場合、確実性ではなく確率を扱うことになり、特に分類に関しては、確率に基づいて結果が何であるかを理解するために、少しだけコーディングを行うことになります。
