<a href="https://colab.research.google.com/github/DeepInsider/playground-data/blob/master/docs/articles/deeplearningdat.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

##### Copyright 2019 Digital Advantage - Deep Insider.

In [0]:
#@title Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
# https://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

# 連載『機械学習 ＆ ディープラーニング入門（データ構造編）』のノートブック

<table valign="middle">
  <td>
    <a target="_blank" href="https://deepinsider.jp/tutor/deeplearningdat"> <img src="https://re.deepinsider.jp/img/ml-logo/manabu.svg"/>Deep Insiderで記事を読む</a>
  </td>
  <td>
    <a target="_blank" href="https://colab.research.google.com/github/DeepInsider/playground-data/blob/master/docs/articles/deeplearningdat.ipynb"> <img src="https://re.deepinsider.jp/img/ml-logo/gcolab.svg" />Google Colabで実行する</a>
  </td>
  <td>
    <a target="_blank" href="https://github.com/DeepInsider/playground-data/blob/master/docs/articles/deeplearningdat.ipynb"> <img src="https://re.deepinsider.jp/img/ml-logo/github.svg" />GitHubでソースコードを見る</a>
  </td>
</table>

※上から順に実行してください。上のコードで実行したものを再利用しているところがあるため、すべて実行しないとエラーになるコードがあります。  
　すべてのコードを一括実行したい場合は、メニューバーから［ランタイム］－［すべてのセルを実行］をクリックしてください。

※このノートブックは「Python 2」でも実行できるようにしていますが、基本的に「Python 3」を利用することをお勧めします。
　Python 3を利用するには、メニューバーから［ランタイム］－［ランタイムのタイプを変更］を選択すると表示される［ノートブックの設定］ダイアログの、［ランタイムのタイプ］欄で「Python 3」に選択し、その右下にある［保存］ボタンをクリックしてください。

In [0]:
# Python バージョン2への対応
from __future__ import absolute_import
from __future__ import division
from __future__ import print_function
from __future__ import unicode_literals

import sys
print(sys.version_info.major)  # 3  # バージョン（メジャー）
print(sys.version_info.minor)  # 6  # バージョン（マイナー）

## Python言語におけるデータの構造

### Pythonにおける「1つの」データの表現

#### リスト1-1　「単一の」データを表現するコード

In [0]:
height = 177.2

print(height)  # 177.2と出力される

#### リスト1-2　変数名だけを記述してオブジェクトの評価結果を出力

In [0]:
height  # 177.2と出力される

#### リスト1-3　オブジェクト評価結果の出力とprint()関数の出力の違い

In [0]:
import numpy as np
array2d = np.array([ [ 165.5, 58.4 ],
                     [ 177.2, 67.8 ],
                     [ 183.2, 83.7 ] ])

print(array2d)     # [[165.5  58.4]
                   #  [177.2  67.8]
                   #  [183.2  83.7]]

array2d      # array([[165.5,  58.4],
             #        [177.2,  67.8],
             #        [183.2,  83.7]])

#### リスト2-1　「単一の」データを複数書いて表現するコード

In [0]:
hana_height = 165.5
taro_height = 177.2
jiro_height = 183.2

hana_height, taro_height, jiro_height  # (165.5, 177.2, 183.2)

#### リスト2-2　「複数（1次元）の」データを表現するコード

In [0]:
heights = [ 165.5, 177.2, 183.2 ]

heights  # [165.5, 177.2, 183.2]

### Pythonにおける「複数（2次元）の」データの表現

#### リスト3　「複数（2次元）の」データを表現するコード

In [0]:
people = [ [ 165.5, 58.4 ],
           [ 177.2, 67.8 ],
           [ 183.2, 83.7 ] ]

people  # [165.5, 177.2, 183.2]

### Pythonにおける「複数（多次元）の」データの表現

#### リスト4　「複数（3次元）の」データを表現するコード

In [0]:
list3d = [
  [ [ 165.5, 58.4 ], [ 177.2, 67.8 ], [ 183.2, 83.7 ] ],
  [ [ 155.5, 48.4 ], [ 167.2, 57.8 ], [ 173.2, 73.7 ] ],
  [ [ 145.5, 38.4 ], [ 157.2, 47.8 ], [ 163.2, 63.7 ] ]
]

list3d  # [[[165.5, 58.4], [177.2, 67.8], [183.2, 83.7]],
        #  [[155.5, 48.4], [167.2, 57.8], [173.2, 73.7]],
        #  [[145.5, 38.4], [157.2, 47.8], [163.2, 63.7]]]

## AIプログラムにおけるデータの構造（基本編）

### NumPyのインストール

#### リスト5-1　`numpy`パッケージをインストールするためのシェルコマンド

In [0]:
!pip install numpy

### numpyモジュールのインポート

#### リスト5-2　`numpy`モジュールをインポートするコード例

In [0]:
import numpy as np

### NumPyのデータ型「多次元配列」オブジェクトの作成

#### リスト5-3　`array`関数で多次元配列を作成するコード例（値を使用）

In [0]:
array2d = np.array([ [ 165.5, 58.4 ],
                     [ 177.2, 67.8 ],
                     [ 183.2, 83.7 ] ])

array2d  # array([[165.5,  58.4],
         #        [177.2,  67.8],
         #        [183.2,  83.7]])

#### リスト5-4　`array`関数で多次元配列を作成するコード例（変数を使用）

In [0]:
array3d = np.array(list3d)

array3d  # array([[[165.5,  58.4],
         #         [177.2,  67.8],
         #         [183.2,  83.7]],
         # 
         #        [[155.5,  48.4],
         #         [167.2,  57.8],
         #         [173.2,  73.7]],
         # 
         #        [[145.5,  38.4],
         #         [157.2,  47.8],
         #         [163.2,  63.7]]])

#### リスト5-5　`ndarray`クラスの`tolist()`メソッドで多次元リストに変換するコード例

In [0]:
tolist3d = array3d.tolist()

tolist3d  # [[[165.5, 58.4], [177.2, 67.8], [183.2, 83.7]],
          #  [[155.5, 48.4], [167.2, 57.8], [173.2, 73.7]],
          #  [[145.5, 38.4], [157.2, 47.8], [163.2, 63.7]]]

##  AIプログラムにおけるデータの構造（応用編）

### Pandasのインストール

#### リスト6　◎pandas◎パッケージをインストールするためのシェルコマンド

In [0]:
!pip install pandas

#### 図7-1　NumPyのデータをPandasで一覧表として表示する例

In [0]:
import pandas as pd
df = pd.DataFrame(array2d, columns=['身長', '体重'])
df

## AIプログラムにおけるデータの計算

### AI・ディープラーニングで数学を使う理由

#### リスト7-1　3人の身長の平均を計算するコード例（個別の値を使用）

In [0]:
# hana_height, taro_height, jiro_height = 165.5, 177.2, 183.2 # Lesson 1のリスト2-1で宣言済み

average_height = (
  hana_height + 
  taro_height + 
  jiro_height 
) / 3

print(average_height)  # 175.29999999999998

#### リスト7-2　3人の身長と体重の平均を計算するコード例（多次元配列を使用）

In [0]:
import numpy as np

array1d = np.array([ 165.5, 177.2, 183.2 ])

average_height = np.average(array1d)

average_height  # 175.29999999999998

### NumPyを使った計算

#### リスト8-1　3行2列の行列のさまざまな特性を表示するコード例

In [0]:
array2d = np.array([ [ 165.5, 58.4 ],
                     [ 177.2, 67.8 ],
                     [ 183.2, 83.7 ] ])

print(array2d.shape)  # (3, 2)
print(array2d.ndim)   # 2
print(array2d.size)   # 6

#### リスト8-2　NumPyを使った行列計算

In [0]:
diet = np.array([ [ 1.0, 0.0 ],
                  [ 0.0, 0.9 ] ])

lose_weights = diet @ array2d.T
# Python 3.5以降の場合。それ以前のPython 2系などの場合は、以下のmatmul関数を使う必要がある
#lose_weights = np.matmul(diet, array2d.T)

print(lose_weights.T)  # [[165.5   52.56]
                       #  [177.2   61.02]
                       #  [183.2   75.33]]

#### リスト8-3　全要素の平均値を算出（身長／体重別ではない）

In [0]:
averages = np.average(array2d)

averages  # 122.63333333333334

#### リスト8-4　身長／体重別の平均値を算出

In [0]:
averages = np.average(array2d, axis=0)

averages  # array([175.3       ,  69.96666667])

#### リスト8-5　3次元配列データでグループごとの身長／体重別の平均値を算出

In [0]:
array3d = np.array(
  [ [ [ 165.5, 58.4 ], [ 177.2, 67.8 ], [ 183.2, 83.7 ] ],
    [ [ 155.5, 48.4 ], [ 167.2, 57.8 ], [ 173.2, 73.7 ] ],
    [ [ 145.5, 38.4 ], [ 157.2, 47.8 ], [ 163.2, 63.7 ] ] ]
)

avr3d = np.average(array3d, axis=1)

print(avr3d)  # [[175.3         69.96666667]
              #  [165.3         59.96666667]
              #  [155.3         49.96666667]]

## お疲れさまでした。データ構造の学習は修了です。