In [None]:
import matplotlib.pyplot as plt
def draw(X):
    ''' 執行描繪的函數
    X: 形狀為(28, 28, 1)的圖像資料
    ''' 
    plt.figure(figsize=(8, 8))      # 描繪區域為8 × 8英吋 
    pos = 1                         # 維持圖像的描繪位置  
    # 看有幾張圖像，就重複幾次描繪處理
    for i in range(X.shape[0]):
        plt.subplot(4, 4, pos)          # 在4 × 4繪圖區域的第pos個位置
        # 將索引i的圖像變換為(28,28)的形狀、進行描繪
        plt.imshow(X[i].reshape((28,28)),interpolation='nearest')
        plt.axis('off')                 # 隱藏軸線的刻度
        pos += 1
    plt.show()


In [None]:
import numpy as np
import pandas as pd
from sklearn.model_selection import KFold
from tensorflow.keras.utils import to_categorical

# 將train.csv讀入pandas的DataFrame
train = pd.read_csv('/kaggle/input/digit-recognizer/train.csv')
tr_x = train.drop(['label'], axis=1)     # 從train取出圖像資料
train_y = train['label']                 # 從train取出正確答案

# 將圖像的像素值除以255.0、限制在0 ~ 1.0的範圍內，轉換為numpy.array 
tr_x = np.array(tr_x / 255.0)

# 將二維矩陣的圖像變換成( 高度 = 28, 寬度 = 28, 通道 = 1) 的三維矩陣
# 灰階圖片的通道值為1。
tr_x = tr_x.reshape(-1,28,28,1)

# 將正確答案標籤轉換為One-hot encoding
tr_y = to_categorical(train_y, 10)

# 用於測試的圖像張數
batch_size = 16


In [None]:
draw(tr_x[0:batch_size])

In [None]:
# 導入ImageDataGenerator 
from tensorflow.keras.preprocessing.image import ImageDataGenerator

# 執行旋轉，最多旋轉90度
datagen = ImageDataGenerator(rotation_range=90)
g = datagen.flow(tr_x, tr_y, batch_size, shuffle=False)# 看小批次尺寸多少，就生成多少個增補資料
X_batch, y_batch = g.next()                            # 將增補資料放入清單
draw(X_batch)                                          # 繪圖


In [None]:
# 平行移動 最大 0.5
datagen = ImageDataGenerator(width_shift_range=0.5)
g = datagen.flow(tr_x, tr_y, batch_size, shuffle=False)# 看小批次尺寸多少，就生成多少個增補資料
X_batch, y_batch = g.next()                            # 將增補資料放入清單
draw(X_batch)                                          # 繪圖


In [None]:
# 垂直移動 最大 0.5
datagen = ImageDataGenerator(height_shift_range=0.5)
g = datagen.flow(tr_x, tr_y, batch_size, shuffle=False)# 看小批次尺寸多少，就生成多少個增補資料
X_batch, y_batch = g.next()                            # 將增補資料放入清單
draw(X_batch)                                          # 繪圖


In [None]:
datagen = ImageDataGenerator(zoom_range=0.5)
g = datagen.flow(tr_x, tr_y, batch_size, shuffle=False)# 看小批次尺寸多少，就生成多少個增補資料
X_batch, y_batch = g.next()                            # 將增補資料放入清單
draw(X_batch)                                          # 繪圖


In [None]:
datagen = ImageDataGenerator(horizontal_flip=True)
g = datagen.flow(tr_x, tr_y, batch_size, shuffle=False)# 看小批次尺寸多少，就生成多少個增補資料
X_batch, y_batch = g.next()                            # 將增補資料放入清單
draw(X_batch)                                          # 繪圖


In [None]:
datagen = ImageDataGenerator(vertical_flip=True)
g = datagen.flow(tr_x, tr_y, batch_size, shuffle=False)# 看小批次尺寸多少，就生成多少個增補資料
X_batch, y_batch = g.next()                            # 將增補資料放入清單
draw(X_batch)                                          # 繪圖
