# [python数字图像处理（6）：图像的批量处理 ](https://blog.csdn.net/haoji007/article/details/52063227)

图片集合函数为：`skimage.io.ImageCollection(load_pattern,load_func=None)`

这个函数是放在`io`模块内的，带两个参数，第一个参数`load_pattern`, 表示图片组的路径，可以是一个`str`字符串。第二个参数`load_func`是一个回调函数，我们对图片进行批量处理就可以通过这个回调函数实现。回调函数默认为`imread()`,即默认这个函数是批量读取图片。

`file_names = 'd:/pic/*.jpg:d:/pic/*.png'` 是两个字符串合在一起的，第一个是`'d:/pic/*.jpg'`, 第二个是`'d:/pic/*.png'` ，合在一起后，中间用冒号来隔开，这样就可以把`d:/pic/`文件夹下的`jpg`和`png`格式的图片都读取出来。如果还想读取存放在其它地方的图片，也可以一并加进去，只是中间同样用冒号来隔开。

`io.ImageCollection()`这个函数省略第二个参数，就是批量读取。如果我们不是想批量读取，而是其它批量操作，如批量转换为灰度图，那又该怎么做呢？
那就需要先定义一个函数，然后将这个函数作为第二个参数，如：
```py
from skimage import data_dir,io,color

def convert_gray(f):
    rgb=io.imread(f)
    return color.rgb2gray(rgb)
    
str=data_dir+'/*.png'
coll = io.ImageCollection(str,load_func=convert_gray)
io.imshow(coll[10])
```

这种批量操作对视频处理是极其有用的，因为视频就是一系列的图片组合：
```py
from skimage import data_dir,io,color

class AVILoader:
    video_file = 'myvideo.avi'

    def __call__(self, frame):
        return video_read(self.video_file, frame)

avi_load = AVILoader()

frames = range(0, 1000, 10) # 0, 10, 20, ...
ic =io.ImageCollection(frames, load_func=avi_load)
```
这段代码的意思，就是将`myvideo.avi`这个视频中每隔`10`帧的图片读取出来，放在图片集合中。

得到图片集合以后，我们还可以将这些图片连接起来，构成一个维度更高的数组，连接图片的函数为：
`skimage.io.concatenate_images(ic)`

带一个参数，就是以上的图片集合，如：
```py
from skimage import data_dir,io,color

coll = io.ImageCollection('d:/pic/*.jpg')
mat=io.concatenate_images(coll)
```
使用`concatenate_images(ic)`函数的前提是读取的这些图片尺寸必须一致，否则会出错。我们看看图片连接前后的维度变化：
```py
from skimage import data_dir,io,color

coll = io.ImageCollection('d:/pic/*.jpg')
print(len(coll))      #连接的图片数量
print(coll[0].shape)   #连接前的图片尺寸，所有的都一样
mat=io.concatenate_images(coll)
print(mat.shape)  #连接后的数组尺寸
```

保存并转换图片尺寸
```py
from skimage import data_dir, io, transform, color
import numpy as np


def convert_gray(f):
    rgb = io.imread(f)  # 依次读取rgb图片
    gray = color.rgb2gray(rgb)  # 将rgb图片转换成灰度图
    dst = transform.resize(gray, (256, 256))  # 将灰度图片大小转换为256*256
    return dst


str = data_dir+'/*.png'
coll = io.ImageCollection(str, load_func=convert_gray)
for i in range(len(coll)):
    io.imsave('d:/data/'+np.str(i)+'.jpg', coll[i])  # 循环保存图片
```

In [1]:
import sys

import numpy as np

sys.path.append('E:/xinlib')
import xin

In [3]:
root = 'E:/Data/datasets/flower_photos/'
dataset = xin.Dataset(root)

data, labels = dataset.dataset()

In [6]:
labels

CategoricalIndex(['daisy', 'daisy', 'daisy', 'daisy', 'daisy', 'daisy',
                  'daisy', 'daisy', 'daisy', 'daisy',
                  ...
                  'tulips', 'tulips', 'tulips', 'tulips', 'tulips', 'tulips',
                  'tulips', 'tulips', 'tulips', 'tulips'],
                 categories=['daisy', 'dandelion', 'roses', 'sunflowers', 'tulips'], ordered=False, dtype='category', length=3670)

In [58]:
labels.get_value()

TypeError: get_value() missing 2 required positional arguments: 'series' and 'key'

In [8]:
import numpy as np

In [None]:
np.var