<a href="https://www.nvidia.com/en-us/deep-learning-ai/education/"> <img src="images/DLI Header.png" alt="Header" style="width: 400px;"/> </a>

# *新しいデータ* を使った有効なモデルの作成

ビッグ データ時代の現在、1 日に 250 京バイトものデータが生み出されています。
[Kaggle.com](https://www.kaggle.com/datasets) や [UCI](https://archive.ics.uci.edu/ml/datasets.html) などのサイトでは無料のデータセットが提供されています。
クラウドソーシングされたデータセットが、クリエイティブな手法で構築されています。
たとえば、Facebook が写真に写っている友達への「タグ付け」をユーザーに依頼して作成した、ラベル付きの顔認識データセットなどがあります。
また、専門家が手作業で生成した複雑なデータセットもあります。
たとえば、レントゲン技師に心臓の特定の部分にラベルを付けるよう依頼して作成されたデータセットなどがあります。

このコースではこれまで、16 枚の画像という *非常に小さな* データセットを使用してきました。
本当に必要なのは数万枚のラベル付き画像ですが、(今のところ) Louie 用にはそれがありません。
幸いなことに、Kaggle には犬と猫のラベル付き画像 18,750 枚で構成されるデータセットがあり、これを使用して始めることができます。
ネットワークに Louie を教えるのではなく、犬とはどんなものであるかを教えるところから始めましょう。

このタスクが終了すると、学習データセットに含まれていなかった犬と猫を正しく分類できる、学習済みのニューラルネットワークが完成します。

はじめに、ラベル付きデータから学習データセットを *作成すること* で、DIGITS とディープラーニングのワークフローについてもう少し詳しく学びましょう。

<a href="/digits/">DIGITS を開く</a>

### 最初のデータセットの読み込み

DIGITS を開くと、ホーム画面が表示されます。
ここで、新しいデータセットや新しいモデルを作成できます。

まず、左の "Datasets" タブを選択します。

![](images/DIGITSdatasetHome.PNG)

前回のタスクの「Images of Beagles」データセットは (今は) 無視します。
各画像がどの「カテゴリ」に属するのかをネットワークに判断させたいので、右の青い "Images" メニューから "Classification" を選択して、DIGITS に **新しい** 「分類」画像データセットを準備するよう指定します。

このとき、ユーザー名の入力が必要な場合があります。
要求されたら、小文字で任意の名前を入力してください。

#### データの読み込みと構成

"Training Images" フィールドに、以下のディレクトリを入力して、データが格納されているフォルダーを指定します。

<pre>/dli/data/dogscats/train</pre>

![](images/datasetttttings.PNG)

ここでは、現在作業しているコンピューターではなく、学習環境内のフォルダーを指定する点に注意してください。
この 2 つの間でデータをやり取りする方法は多数あります (日々更新されている「[Resources: Next Steps for Independent Deep Learning](https://docs.google.com/document/d/1A8r1Shh0ssiRzrxNcraK7PJ_NUFay--EX1aBovpVMKU/edit)」で説明しています)。

データセットを読み込む前に、データの構造を把握するために、"Training Images" の横の「?」にマウスを合わせてみてください。

*入力データと出力ラベルを対応付ける方法は多数あります。
犬の画像が入った「dogs」フォルダーと、猫の画像が入った「cats」フォルダーを作成しました。
この 2 つのフォルダーを「dogscats」という名前の別のフォルダーに入れました。
DIGITS は、2 つのフォルダーがあることを認識し、2 つのカテゴリがあると判断しました。
以上です。この後、皆さんはこれを自分のデータで練習します。*

"**% for validation**" フィールドで 25% を割り当てたことに注目してください。
これについては、データセットの読み込み中に確認しましょう。

データセットの準備にかかる時間を短縮するために "Encoding" を "PNG(lossless)" から "None" に変更し、データセットに名前を付けます。
"Create" を選択すると、約 3 分で学習用のデータが準備されます。
準備の間、以下のセクションを読んで、何が行われるかを把握しましょう。

![](images/datasetname1.PNG)

## DIGITS が行う処理

指定したフォルダー内の画像を取得し、2 つの処理を行うよう、DIGITS に指示しました。

1) 学習するネットワークで想定されているサイズに合うように、画像のサイズを標準化します。今回も AlexNet を学習します。AlexNet は 256x256 のカラー画像の入力を受け取るよう設計されています。これについては、次のタスクで詳しく説明します。

2) 画像を 2 つのデータセットに分割します。カテゴリごとに 75% が学習用に使用され、25% が検証用に分離されます。

学習データセットは、Louie 分類器を学習したときと同じように使用されます。
つまり、 *ネットワーク上を画像が順伝播* し、出力が生成され、 *損失* が評価されます。
この損失がネットワークを *逆伝播* し、重みが更新されます 
(ここでは詳しく説明しませんが、これがディープラーニングの要点です。 *コンピューターが実行する* 数学を理解していなくてもディープラーニングによる問題解決の障壁にはなりませんが、より詳しく学びたい場合は、[3Blue1Brown のこちらのビデオ](https://www.youtube.com/watch?v=Ilg3gGewQ5U) をダウンロードして、後でご覧ください)。

![](images/propogation.png)

### 検証データを使用したパフォーマンスの評価

*新しいデータ* でのパフォーマンスの評価には検証データセットが使用されます。
これには人間の学習では使用できないテクニックが使用されます。
検証データをネットワークに入力すると出力が生成されますが、 *ネットワークは検証データからは何も学習しません* 。
損失は報告されますが、モデル自体は変更されません。
同じ検証データセットを使用しても、これらは常に新しいデータとして扱われるため、 *新しい* データでのパフォーマンスを何度でも評価することができます。

![](images/forwardprop.png)

いったんデータセットが読み込まれたのち、作成されたヒストグラムにマウスを合わせると、さらに詳細を確認することができます。
"Explore the db" を選択すると、実際のデータを表示できます。

これで DIGITS にデータを読み込む方法がわかりました。
ネットワークの学習をどこで行う場合でも、同様の手順が必要です。

## 学習

次の作業は、Louie データセットで行ったのと同じ方法で、ニューラルネットワークモデルを学習することです。

左上の "DIGITS" を選択して DIGITS のホーム画面に移動します。
次に、"```New Model```"、"```Classification```" の順に選択して、新しい分類モデルを作成します。
これ以降の手順は、以下の内容が示すとおり、小さいデータセットで学習したときと同じです。

<pre>先ほど読み込んだデータについて AlexNet の学習を 5 エポック行う。</pre> 

この作業を自力で行える場合は、以下の操作を行うことができます。

<pre>読み込み済みのデータで画像分類ネットワークを学習する。</pre>

復習が必要な場合は、前回のタスクの Notebook を参照してください: [Train a Model](../../task1/task/Train%20a%20Model-ja.ipynb)

今回は、ネットワークの学習時に生成されるグラフをよく見てください。
後ほど説明しますが、まずは結果を解釈してみましょう。
主に、**学習中、グラフを使用してモデルの *パフォーマンス* を評価するにはどうすればよいか、について考えてみてください。**

#### 注: 学習に 15 分以上かかる場合は、エポック (繰り返し回数) を 6 回以上に指定したと考えられます。

画面の上部で "Abort Job" を選択し、"Clone Job" を選択して、手順を再度確認してください。

学習が実行されている間、下のセクションを読んでください。

## 推論

モデルのジョブページに移動します。
メインコースに戻ったときに、このページの内容を解釈する方法を詳しく説明しますが、ここではひとまず、これまでネットワークが見たことがない画像をテストして、成功したことを確認しましょう。

*推論* は、学習したことに基づいて判断を下すプロセスです。
学習済みモデルは、 **ラベルのない** 画像も分類できるようになっているはずです。

![](images/trainingwithinferencevisualization.PNG)

モデルウィンドウの下部で、単一の画像または画像リストをテストできます。
左の "Image Path" テキストボックスに下記のパスを入力します。

<pre>/dli/data/BeagleImages/louietest2.JPG</pre>

"**Classify One**" ボタンを選択します。
数秒後、新しいウィンドウが開き、画像と、画像の分類結果に関する情報が表示されます。

![](images/TestLouieImage.PNG)

この結果の解釈は 2 通りあります。

1) 成功です。学習していないニューラルネットワークを選び、数千枚の *ラベル付き* 画像を見せました。これにより、統計的に有意な信頼度で、犬を犬として分類する出力が得られました。おめでとうございます。

2) 失敗です。人間の学習者であれば、100% の信頼度で画像に犬が含まれていることを判断できるでしょう。ここで作成したモデルには、まだ大きな損失があります。

2 つの解釈のどちらも間違っていませんが、今のところは 1 の解釈を採用して喜んでおきましょう。
この Notebook を閉じたら、パフォーマンスについて詳しく見ていきます。

### 他の画像でのテスト

元のデータセット内の画像は、いずれもこの学習データセットには含まれませんでしたので、任意の画像をテストしてみてください。

下のセルをクリックし、**Shift + Enter** を押すことで、画像のファイルパスを表示できます (これは、この後このコースでよく使用するテクニックです)。
このフルファイルパスを "Image Path" フィールドに入力することでテストできます。

In [None]:
!ls /dli/data/BeagleImages/Louie

このワークフローは、ほぼすべての画像分類タスクに使用できます。
AlexNet を学習することで、ある人の画像から別の人の画像を分類したり、手書きの数字の画像から特定の数字の画像を分類したり、健康な患者と不健康な患者を分類したりできます。
次のタスクで、これについて直接見ていきましょう。

この最初のタスクは成功しましたが、まだ学ぶことは多数あります。

コースに戻って、ここで行った作業に文脈を加えていきましょう。
このウィンドウを閉じると、この GPU インスタンスを停止する "Stop" オプションが表示されます。
このウィンドウを閉じたら、そのオプションを選択してください。

<a href="https://www.nvidia.com/en-us/deep-learning-ai/education/"> <img src="images/DLI Header.png" alt="Header" style="width: 400px;"/> </a>