In [7]:
import matplotlib.pyplot as plot
import numpy as np
import cv2
%matplotlib inline

# 池化操作

将图片按照固定大小网格分割，网格内的像素值取网格内所有像素的平均值。

我们将这种把图片使用均等大小网格分割，并求网格内代表值的操作称为**池化（Pooling）**。

池化操作是**卷积神经网络（Convolutional Neural Network）**中重要的图像处理方式。

### 请把大小为$128\times128$的 `imori.jpg` 使用$8\times8$的网格做池化
![imori](./img/imori.jpg)


## 平均池化（Average Pooling）

平均池化按照下式定义：
$$
v=\frac{1}{|R|}\  \sum\limits_{i=1}^R\ v_i
$$

In [8]:
# average pooling
def average_pooling(img, G=8):
    out = img.copy()

    H, W, C = img.shape
    Nh = int(H / G)
    Nw = int(W / G)

    for y in range(Nh):
        for x in range(Nw):
            for c in range(C):
                out[G * y:G * (y + 1), G * x:G * (x + 1), c] = np.mean(
                    out[G * y:G * (y + 1), G * x:G * (x + 1), c]).astype(np.int)

    return out

In [9]:
img = cv2.imread("./img/imori.jpg")

# Average Pooling
out = average_pooling(img)

# Save result
# cv2.imwrite("out.jpg", out)
cv2.imshow("result", out)
cv2.waitKey(0)
cv2.destroyAllWindows()

## 最大池化（Max Pooling）

网格内的值不取平均值，而是取网格内的最大值进行池化操作。

In [11]:
# max pooling
def max_pooling(img, G=8):
    # Max Pooling
    out = img.copy()

    H, W, C = img.shape
    Nh = int(H / G)
    Nw = int(W / G)

    for y in range(Nh):
        for x in range(Nw):
            for c in range(C):
                out[G * y:G * (y + 1), G * x:G * (x + 1), c] = np.max(out[G * y:G * (y + 1), G * x:G * (x + 1), c])

    return out

In [13]:
# Read image
img = cv2.imread("./img/imori.jpg")

# Max pooling
out = max_pooling(img)

# Save result
# cv2.imwrite("out.jpg", out)
cv2.imshow("result", out)
cv2.waitKey(0)
cv2.destroyAllWindows()