In [9]:
#!/usr/bin/python
# -*- coding: UTF-8 -*-
from keras.preprocessing.image import ImageDataGenerator
import sys
import os
from matplotlib import pyplot as plt
%matplotlib widget

os.chdir(sys.path[0])

# 对numpy矩阵序列中的图片进行预处理

In [10]:
import numpy as np
import matplotlib.pyplot as plt
from imgaug import augmenters as iaa
import imgaug as ia
from keras.datasets import cifar10
from keras.datasets import mnist
import tensorflow as tf

#显示前9张图片
def show(img):
    fig=plt.figure()
    for i in range(9):
        plt.subplot(3,3,i+1)
        plt.imshow(img[i])


(x_train, y_train), (x_test, y_test) = cifar10.load_data()
print(f"Total training examples: {len(x_train)}")
print(f"Total test examples: {len(x_test)}")
show(x_test)

Total training examples: 50000
Total test examples: 10000


Canvas(toolbar=Toolbar(toolitems=[('Home', 'Reset original view', 'home', 'home'), ('Back', 'Back to previous …

### 单通道图片转换为3通道图片

In [6]:
(x_train, y_train), (x_test, y_test) = mnist.load_data()
#mnist需要转换为3通道图片
x_train=np.stack((x_train,)*3, axis=-1)
x_test=np.stack((x_test,)*3, axis=-1)
print(x_train.shape)

(60000, 28, 28, 3)


### 更改图片的颜色空间
单通道的灰度图片无法用该函数转换为彩色图片  
转换为GRAY后，输出通道的数量仍然是3，该增强器仅“消除”了颜色  
#可选参数: RGB, BGR, GRAY, CIE, YCrCb, HSV, HLS, Lab, Luv  

In [7]:
seq = iaa.Sequential([iaa.ChangeColorspace(from_colorspace ='RGB',to_colorspace ='GRAY')])
x=seq.augment_images(x_test)
print(x.shape)
show(x)

(10000, 28, 28, 3)


Canvas(toolbar=Toolbar(toolitems=[('Home', 'Reset original view', 'home', 'home'), ('Back', 'Back to previous …

### 图片缩放

In [8]:
#缩放到指定分辨率
seq = iaa.Sequential([iaa.Resize({"height": 100, "width": 100})])
#随机缩放到50%~100%分辨率，保持长、宽比例不变，多余部分填充黑色
#seq = iaa.Sequential([iaa.Resize((0.5, 1.0))])
x=seq.augment_images(x_test)
show(x)

Canvas(toolbar=Toolbar(toolitems=[('Home', 'Reset original view', 'home', 'home'), ('Back', 'Back to previous …

### 随机裁剪

In [9]:
seq = iaa.Sequential([iaa.Crop(percent = (0, 0.3))])
x=seq.augment_images(x_test)
show(x)

Canvas(toolbar=Toolbar(toolitems=[('Home', 'Reset original view', 'home', 'home'), ('Back', 'Back to previous …

### 随机移动

In [10]:
seq = iaa.Sequential([iaa.Affine(translate_percent={'x':(-0.1,0.1), 'y':(-0.1,0.1)})])
x=seq.augment_images(x_test)
show(x)

Canvas(toolbar=Toolbar(toolitems=[('Home', 'Reset original view', 'home', 'home'), ('Back', 'Back to previous …

### 随机旋转

In [11]:
seq = iaa.Sequential([iaa.Affine(rotate=(-25, 25))])
x=seq.augment_images(x_test)
show(x)

Canvas(toolbar=Toolbar(toolitems=[('Home', 'Reset original view', 'home', 'home'), ('Back', 'Back to previous …

### 翻转

In [12]:
#水平翻转
seq = iaa.Sequential([iaa.Fliplr(0.5)])
#垂直翻转
seq = iaa.Sequential([iaa.Flipud(0.5)])
x=seq.augment_images(x_test)
show(x)

Canvas(toolbar=Toolbar(toolitems=[('Home', 'Reset original view', 'home', 'home'), ('Back', 'Back to previous …

### 随机切边

In [13]:
seq = iaa.Sequential([iaa.Affine(shear=(-20, 20))])
x=seq.augment_images(x_test)
show(x)

Canvas(toolbar=Toolbar(toolitems=[('Home', 'Reset original view', 'home', 'home'), ('Back', 'Back to previous …

### 随机色彩抖动

In [14]:
seq = iaa.Sequential([iaa.Multiply((0.1, 1.5))])
x=seq.augment_images(x_test)
show(x)

Canvas(toolbar=Toolbar(toolitems=[('Home', 'Reset original view', 'home', 'home'), ('Back', 'Back to previous …

### 随机改变对比度

In [15]:
seq = iaa.Sequential([iaa.contrast.LinearContrast((0.75, 1.5))])
x=seq.augment_images(x_test)
show(x)

Canvas(toolbar=Toolbar(toolitems=[('Home', 'Reset original view', 'home', 'home'), ('Back', 'Back to previous …

### 随机噪点

In [4]:
seq = iaa.Sequential([iaa.SaltAndPepper(p=(0, 0.1))])
x=seq.augment_images(x_test)
show(x)

Canvas(toolbar=Toolbar(toolitems=[('Home', 'Reset original view', 'home', 'home'), ('Back', 'Back to previous …

## 手动定制多种增强的组合

In [17]:
seq = iaa.Sequential([
    iaa.Crop(px=(0, 16)),
    iaa.Fliplr(0.5), 
    iaa.GaussianBlur(sigma=(0, 3.0)) 
])

(x_train, y_train), (x_test, y_test) = cifar10.load_data()
x=seq.augment_images(x_test)
show(x)

Canvas(toolbar=Toolbar(toolitems=[('Home', 'Reset original view', 'home', 'home'), ('Back', 'Back to previous …

## 自动定制多种增强的组合

In [32]:
seq = iaa.RandAugment(n=3, m=7)
(x_train, y_train), (x_test, y_test) = cifar10.load_data()
x=seq.augment_images(x_test)
show(x)

Canvas(toolbar=Toolbar(toolitems=[('Home', 'Reset original view', 'home', 'home'), ('Back', 'Back to previous …

## 归一化

In [3]:
#将数据转换为浮点数,将输入数组中的数据转换为0~1之间的数
x=x_test.astype('float32')/255
show(x)

Canvas(toolbar=Toolbar(toolitems=[('Home', 'Reset original view', 'home', 'home'), ('Back', 'Back to previous …

# 创建图片生成器

##  使用文件夹中的图片创建图片生成器
生成数据集使用flow_from_directory，参数如下  
target_size:将图片转换为此分辨率
color_mode："grayscale", "rgb" 之一  
classe:可选的类的子目录列表（例如 ['dogs', 'cats']）。默认：None。如果未提供，类的列表将自动从 directory 下的 子目录名称/结构 中推断出来，其中每个子目录都将被作为不同的类（类名将按字典序映射到标签的索引）。包含从类名到类索引的映射的字典可以通过 class_indices 属性获得。  
class_mode:"categorical", "binary", "sparse", "input" 或 None 之一。"categorical" 是独热编码，"sparse" 是整数标签，"input" 将是与输入图像相同的图像（主要用于自动编码器）。如果为 None，不返回标签  
shuffle:是否混洗数据（默认 True）  
save_to_dir:None 或 字符串（默认 None）。这使你可以最佳地指定正在生成的增强图片要保存的目录（用于可视化你在做什么）  
interpolation:图像缩放时的插值方法，支持的方法有 "nearest", 双线性"bilinear", 双三次"bicubic"。如果安装了 3.4.0 以上版本的 PIL 的话，支持 "box" 和 "hamming"。  

In [22]:
from keras.preprocessing.image import ImageDataGenerator
import matplotlib.pyplot as plt
from imgaug import augmenters as iaa

seq = iaa.Sequential([iaa.Affine(rotate=(-25, 25))])
ig = ImageDataGenerator(preprocessing_function=seq.augment_image)
train_generator=ig.flow_from_directory(directory="images",target_size=(100, 100),color_mode='grayscale',class_mode='categorical',batch_size=32,shuffle=True,save_to_dir=None,interpolation='hamming')
print(train_generator.class_indices)

Found 50 images belonging to 10 classes.
{'0': 0, '1': 1, '2': 2, '3': 3, '4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}


In [23]:
#一个batch的数据
x=train_generator[0][0]
y=train_generator[0][1]
print(x.shape)
print(y.shape)

# matplotlib不能直接显示灰度图，必须将通道的维度去掉
show(x[:,:,:,0])

(32, 100, 100, 1)
(32, 10)


Canvas(toolbar=Toolbar(toolitems=[('Home', 'Reset original view', 'home', 'home'), ('Back', 'Back to previous …

## 使用numpy数据集创建生成器

In [8]:
from keras.utils import Sequence

feature_out=1280
class generator(Sequence):
    #数据增强
    def aug(self):
        #数据增强
        seq = iaa.Sequential([
            #iaa.RandAugment(n=3, m=7),
            iaa.Resize({"height": 96, "width": 96})
            ])
        self.x_set_r=seq.augment_images(self.x_set)
        #归一化
        self.x_set_r=self.x_set_r.astype('float32')/255

    def __init__(self, x_set, y_set, batch_size):
        self.x_set , self.y_set = x_set, y_set
        self.batch_size = batch_size
        self.aug()

    def __len__(self):
        return int(np.ceil(len(self.x_set) / float(self.batch_size)))

    def __getitem__(self, idx):
        batch_x1 = self.x_set_r[idx * self.batch_size:(idx + 1) * self.batch_size]
        batch_y1 = self.y_set[idx * self.batch_size:(idx + 1) * self.batch_size]
     
        return batch_x1,batch_y1
  
      #该函数将在训练时每一个epoch结束的时候自动执行
    def on_epoch_end(self):
        self.aug()
        print("epoch 结束")

g=generator(x_train,y_train,50)
g.__getitem__(0)[0].shape

(50, 96, 96, 3)

# 在训练中使用生成器

## fit_generator
generator：一个生成器，或者一个 Sequence (keras.utils.Sequence) 对象的实例。这是我们实现的重点，后面会着介绍生成器和sequence的两种实现方式。  
steps_per_epoch：这个是我们在每个epoch中需要执行多少次生成器来生产数据，fit_generator函数没有batch_size这个参数，是通过steps_per_epoch来实现的，每次生产的数据就是一个batch，因此steps_per_epoch的值我们通过会设为（样本数/batch_size）。如果我们的generator是sequence类型，那么这个参数是可选的，默认使用len(generator) 。  
epochs：即我们训练的迭代次数。  
verbose：0, 1 或 2。日志显示模式。 0 = 安静模式, 1 = 进度条, 2 = 每轮一行  
callbacks：在训练时调用的一系列回调函数。  
validation_data：和我们的generator类似，只是这个使用于验证的，不参与训练。  
validation_steps：和前面的steps_per_epoch类似。  
class_weight：可选的将类索引（整数）映射到权重（浮点）值的字典，用于加权损失函数（仅在训练期间）。 这可以用来告诉模型「更多地关注」来自代表性不足的类的样本。（感觉这个参数用的比较少）  
max_queue_size：整数。生成器队列的最大尺寸。默认为10.  
workers：整数。使用的最大进程数量，如果使用基于进程的多线程。 如未指定，workers 将默认为 1。如果为 0，将在主线程上执行生成器。  
use_multiprocessing：布尔值。如果 True，则使用基于进程的多线程。默认为False。  
shuffle：是否在每轮迭代之前打乱 batch 的顺序。 只能与Sequence(keras.utils.Sequence) 实例同用。  
initial_epoch: 开始训练的轮次（有助于恢复之前的训练）  

In [21]:
'''
modle.fit_generator(generator, 
                    steps_per_epoch=None,
                    epochs=1, 
                    verbose=1, 
                    callbacks=None, 
                    validation_data=None, 
                    validation_steps=None, 
                    class_weight=None, 
                    max_queue_size=10, 
                    workers=2, 
                    use_multiprocessing=True, 
                    shuffle=True, 
                    initial_epoch=0)
'''

'\nmodle.fit_generator(generator, \n                    steps_per_epoch=None,\n                    epochs=1, \n                    verbose=1, \n                    callbacks=None, \n                    validation_data=None, \n                    validation_steps=None, \n                    class_weight=None, \n                    max_queue_size=10, \n                    workers=2, \n                    use_multiprocessing=True, \n                    shuffle=True, \n                    initial_epoch=0)\n'

## train_on_batch
适用于GAN的训练

In [21]:
batchs=1
batch_size=50
for e in range(batchs):
    #随机抽取1个batch的数据
    idx1 = np.random.randint(0, x_train.shape[0], batch_size)
    x_train = x_train[idx1]
    y_train = y_train[idx1]
    idx2 = np.random.randint(0, x_test.shape[0], batch_size)
    x_test = x_test[idx2]
    y_test = y_test[idx2]
    
    #数据增强
    seq = iaa.Sequential([iaa.Affine(shear=(-20, 20))])
    x_train=seq.augment_images(x_train)
    x_test=seq.augment_images(x_train)

    #归一化
    x_train=x_train.astype('float32')/255
    x_test=x_test.astype('float32')/255
    
    #交互训练
    #model1.train_on_batch(x=g_train[i][0],y=g_train[i][1])
    #model2.train_on_batch(x=g_test[i][0],y=g_test[i][1])


uint8
