# 画像を読み込んでレイヤーを抽出してみよう
## 以下で解説すること
画像を読み込む所までは自力でやりましょう．問題なのは，読み込んだ画像データがどういう配列に格納されているかです．

以下では配列とその次元の考え方のヒントを載せておきますね．

extractで抽出している値は，どういう理屈で抽出できているのでしょうか．わからなければ配列と次元の考え方を調べてみてください．

画像を読み込むとRGBの配列になっているので，その中で一つのチャンネルを抽出するとき，どうすればいいでしょうか．

In [1]:
import numpy as np

In [18]:
ar = np.array([1, 2, 3, 4, 5])
print(ar)
print("-*" * 10)
print(np.ndim(ar)) # 配列の次元
print(np.shape(ar)) # 配列の形状
print(np.size(ar)) # 配列の全要素数

print("-*" * 10)

print("extract! ->", ar[3])


[1 2 3 4 5]
-*-*-*-*-*-*-*-*-*-*
1
(5,)
5
-*-*-*-*-*-*-*-*-*-*
extract! -> 4


In [23]:
ar = np.array([[1, 2, 3, 4, 5], [10, 20, 30, 40, 50], [100, 200, 300, 400, 500]])
print(ar)
print("-*" * 10)
print(np.ndim(ar)) # 配列の次元
print(np.shape(ar)) # 配列の形状
print(np.size(ar)) # 配列の全要素数

print("-*" * 10)

print("extract! ->", ar[2, 1])
print("extract! ->", ar[2, :])
print("extract! ->", ar[:, 1])


[[  1   2   3   4   5]
 [ 10  20  30  40  50]
 [100 200 300 400 500]]
-*-*-*-*-*-*-*-*-*-*
2
(3, 5)
15
-*-*-*-*-*-*-*-*-*-*
extract! -> 200
extract! -> [100 200 300 400 500]
extract! -> [  2  20 200]


In [28]:
ar = np.array([[[1, 2, 3, 4, 5], [10, 20, 30, 40, 50], [100, 200, 300, 400, 500]], [[11, 22, 33, 44, 55], [110, 220, 330, 440, 550], [100, 200, 3000, 4000, 5000]]])
print(ar)
print("-*" * 10)
print(np.ndim(ar)) # 配列の次元
print(np.shape(ar)) # 配列の形状
print(np.size(ar)) # 配列の全要素数

print("-*" * 10)

print("extract! ->", ar[0, :, :])
print("extract! ->", ar[1, :, :])
print("extract! ->", ar[:, :, 3])

[[[   1    2    3    4    5]
  [  10   20   30   40   50]
  [ 100  200  300  400  500]]

 [[  11   22   33   44   55]
  [ 110  220  330  440  550]
  [ 100  200 3000 4000 5000]]]
-*-*-*-*-*-*-*-*-*-*
3
(2, 3, 5)
30
-*-*-*-*-*-*-*-*-*-*
extract! -> [[  1   2   3   4   5]
 [ 10  20  30  40  50]
 [100 200 300 400 500]]
extract! -> [[  11   22   33   44   55]
 [ 110  220  330  440  550]
 [ 100  200 3000 4000 5000]]
extract! -> [[   4   40  400]
 [  44  440 4000]]


In [51]:
ar = np.arange(100).reshape(2, 2, 5, 5, 1) # ここまで来ると，私も追うのが面倒くさい．上が理解できていれば書いていることはわかると思います．
# print(ar)
print("-*" * 10)
print(np.ndim(ar)) # 配列の次元
print(np.shape(ar)) # 配列の形状
print(np.size(ar)) # 配列の全要素数

print("-*" * 10)

print("extract! ->", ar[0])
print("-*" * 10)
print("extract! ->", ar[:, :, :, :, 0])

-*-*-*-*-*-*-*-*-*-*
5
(2, 2, 5, 5, 1)
100
-*-*-*-*-*-*-*-*-*-*
extract! -> [[[[ 0]
   [ 1]
   [ 2]
   [ 3]
   [ 4]]

  [[ 5]
   [ 6]
   [ 7]
   [ 8]
   [ 9]]

  [[10]
   [11]
   [12]
   [13]
   [14]]

  [[15]
   [16]
   [17]
   [18]
   [19]]

  [[20]
   [21]
   [22]
   [23]
   [24]]]


 [[[25]
   [26]
   [27]
   [28]
   [29]]

  [[30]
   [31]
   [32]
   [33]
   [34]]

  [[35]
   [36]
   [37]
   [38]
   [39]]

  [[40]
   [41]
   [42]
   [43]
   [44]]

  [[45]
   [46]
   [47]
   [48]
   [49]]]]
-*-*-*-*-*-*-*-*-*-*
extract! -> [[[[ 0  1  2  3  4]
   [ 5  6  7  8  9]
   [10 11 12 13 14]
   [15 16 17 18 19]
   [20 21 22 23 24]]

  [[25 26 27 28 29]
   [30 31 32 33 34]
   [35 36 37 38 39]
   [40 41 42 43 44]
   [45 46 47 48 49]]]


 [[[50 51 52 53 54]
   [55 56 57 58 59]
   [60 61 62 63 64]
   [65 66 67 68 69]
   [70 71 72 73 74]]

  [[75 76 77 78 79]
   [80 81 82 83 84]
   [85 86 87 88 89]
   [90 91 92 93 94]
   [95 96 97 98 99]]]]


# generatorで学習データを読み込みながら学習させよう
## generatorとその挙動 
generatorは，関数の中にあるreturnをyieldに変えたものです（乱暴な説明な気もしますが）．

generatorはreturnの代わりにyieldを用いることで，処理を記憶しながら逐次呼び出すことができます．

説明が大変なので，以下の計算の例を取り上げます．

In [83]:
from sys import exit # ジェネレーターを止めるために使用
def generator_ex():
    ar = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
    limit = 0
    i = 0
    while True:
        value = ar[i]
        yield value # この位置にyield
        
        i += 1
        limit += 1
        if i >= len(ar):
            i = 0
            print("-*-reset-*-" * 3)
        if limit >= 20: # 終了条件
            print("Finish")
            exit()
            

In [85]:
for num in generator_ex():
    print(num)

0
1
2
3
4
5
6
7
8
9
-*-reset-*--*-reset-*--*-reset-*-
0
1
2
3
4
5
6
7
8
9
-*-reset-*--*-reset-*--*-reset-*-
Finish


SystemExit: 

## 機械学習でどう使うのか？

generatorを使うのは，莫大なデータを読み込む際にメモリーがいっぱいいっぱいにならないようにするためです(画像データ全てをメモリーに開けるとクラッシュします)．

画像を読み込んでそれを学習データとしてyieldする，と言うプログラムを作成してください．

上を知ってからぐぐると，案外書き方がわかりますよ．


## 懸案事項
もしかしたら，colabだとIOの関係でジェネレーターが使えません．自前の計算機に投げましょう．