# ミニバッチ学習の実装

In [10]:
from PIL import Image
import numpy as np
import matplotlib.pyplot as plt
import math

# Load the MNIST dataset
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("../../mnist_data/", one_hot=True) #パスは適宜変更する
train = mnist.train.images
test = mnist.test.images
train_labels = mnist.train.labels
test_labels = mnist.test.labels

Extracting ../../mnist_data/train-images-idx3-ubyte.gz
Extracting ../../mnist_data/train-labels-idx1-ubyte.gz
Extracting ../../mnist_data/t10k-images-idx3-ubyte.gz
Extracting ../../mnist_data/t10k-labels-idx1-ubyte.gz


## ミニバッチ学習
* ミニバッチ学習は、一般的には非復元抽出によって行われることが多いが、必ずこうしなければならないというわけではなく、分析者がデータセットの与え方を工夫することもできる。ただし、工夫しても計算が上手くいくとは限らない。
* 工夫のしどころ。
    * 一般的には、エポックのたびにシャッフルするが、シャッフルするタイミングを任意に変えてみる  
    * 与えるミニバッチ の順番を意図的に操作してみる   
        * 例、出現頻度の少ないラベルのデータを先に学習させる
    * 抽出されるラベルの割合が一定になるように抽出してみる
    * 復元抽出にしてみる

In [11]:
def trainer(network, x, y):
    """
    学習用の関数
    このnotebookでは、ミニバッチ学習を学ぶことが目的であるため、この関数の中身は空のままにしておく
    実際には、何らかの学習させるための処理を記述する
    """
    pass
    return 

### ミニバッチ学習のループ(復元抽出)

In [12]:
train_size = train_labels.shape[0]
batch_size = 32
max_iter = 10 #ループの回数
network = None #ダミー

for i in range(max_iter):
    print("i=%s"%i)
    batch_mask = np.random.choice(train_size, batch_size)
    x_batch = train[batch_mask]
    y_batch = train_labels[batch_mask]

    trainer(network, x_batch, y_batch)

i=0
i=1
i=2
i=3
i=4
i=5
i=6
i=7
i=8
i=9


### 復元抽出部分を理解するためのコード

In [13]:
batch_mask = np.random.choice(train_size, batch_size)
print("batch_mask=", batch_mask)
print()

x_batch = train[batch_mask]
print("x_batch=", x_batch)
print("x_batch.shape=", x_batch.shape)
print()
y_batch = train_labels[batch_mask]
print("y_batch=", y_batch)
print("y_batch.shape=", y_batch.shape)
print()

batch_mask= [ 7940 45127 48657 25840 10788 43761 46979 33292 16346  2778 46641 14840
 34352 39687 36101 54616  6420 28051 48239 24460 42435 23664  9900 49229
  9774  5613 14608 16885 17392 13521 52259 18261]

x_batch= [[0. 0. 0. ... 0. 0. 0.]
 [0. 0. 0. ... 0. 0. 0.]
 [0. 0. 0. ... 0. 0. 0.]
 ...
 [0. 0. 0. ... 0. 0. 0.]
 [0. 0. 0. ... 0. 0. 0.]
 [0. 0. 0. ... 0. 0. 0.]]
x_batch.shape= (32, 784)

y_batch= [[0. 0. 0. 0. 0. 1. 0. 0. 0. 0.]
 [1. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [1. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 1. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 1. 0. 0. 0.]
 [0. 0. 0. 1. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 0. 1.]
 [0. 0. 0. 0. 0. 1. 0. 0. 0. 0.]
 [0. 0. 0. 1. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 1. 0. 0. 0.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0. 0.]
 [0. 1. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 0. 1.]
 [1. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 1. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 1. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0. 0

In [14]:
# 復元抽出部分(何回か実行してみてください)
np.random.choice(10,3)

array([7, 7, 1])

### ミニバッチ学習のループ(非復元抽出)

### [演習]
* 以下の非復元抽出によるミニバッチ学習を完成させましょう。
* 通常の計算では、非復元抽出で行うことが多いです。

In [15]:
# ヒント
index = np.arange(10)
print("index=%s"%index)
np.random.shuffle(index)
print("index=%s"%index)
print()
print(np.random.permutation(10))
print()

for i in range(4):
    print(index[3*i:3*(i+1)])

index=[0 1 2 3 4 5 6 7 8 9]
index=[5 6 4 7 1 3 8 9 2 0]

[8 1 3 7 9 0 2 6 5 4]

[5 6 4]
[7 1 3]
[8 9 2]
[0]


In [16]:
train_size = train_labels.shape[0]
batch_size = 32
epochs = 10
network = None #ダミー
minibatch_num =  # ミニバッチの個数
    
for epoch in range(epochs):
    print("epoch=%s"%epoch)
    
    # indexを定義し、シャッフルする
    index = 
    np.random.shuffle()
    
    for mn in range():
        """
        非復元抽出によるループ
        """
        batch_mask = index[:]       
        x_batch = train[batch_mask]
        y_batch = train_labels[batch_mask]

        trainer(network, x_batch, y_batch)

SyntaxError: invalid syntax (<ipython-input-16-a7e40c07a538>, line 5)