<h1>Table of Contents<span class="tocSkip"></span></h1>
<div class="toc"><ul class="toc-item"><li><span><a href="#4.1.-NumPy-indexing" data-toc-modified-id="4.1.-NumPy-indexing-1">4.1. NumPy indexing</a></span></li><li><span><a href="#4.2.-Color-images" data-toc-modified-id="4.2.-Color-images-2">4.2. Color images</a></span></li></ul></div>

# 4. A crash course on NumPy for images

`scikit-image` 中的图像由 NumPy ndarrays 表示。因此，可以使用标准 NumPy 方法来操作 arrays 来实现许多常见操作：

In [1]:
from skimage import data
camera = data.camera()
type(camera)

numpy.ndarray

In [None]:
检索图像的几何形状和像素数：

In [2]:
camera.shape

(512, 512)

In [3]:
camera.size

262144

检索有关图像强度值的统计信息：

In [4]:
camera.min(), camera.max()

(0, 255)

In [5]:
camera.mean()

129.06072616577148

表示图像的 NumPy 数组可以是不同的整数或浮点数值类型。有关这些类型以及 `scikit-image` 如何处理它们的更多信息，请参阅 [Image data types and what they mean](https://scikit-image.org/docs/stable/user_guide/data_types.html#data-types)。

## 4.1. NumPy indexing

NumPy 索引既可用于查看像素值，也可用于修改它们：

In [6]:
# Get the value of the pixel at the 10th row and 20th column
camera[10, 20]

200

In [7]:
# Set to black the pixel at the 3rd row and 10th column
camera[3, 10] = 0

当心！在 NumPy 索引中，第一个维度 (`camera.shape[0]`) 对应于行，而第二个维度 (`camera.shape[1]`) 对应于列，原点 (`camera[0, 0]`) 位于左上角角落。这与矩阵/线性代数表示法匹配，但与笛卡尔 (x, y) 坐标相反。有关更多详细信息，请参阅下面的 [Coordinate conventions](https://scikit-image.org/docs/stable/user_guide/numpy_images.html#coordinate-conventions)。

除了单个像素之外，还可以使用 NumPy 的不同索引功能来访问/修改整组像素的值。

切片：

In [8]:
# Set the first ten lines to "black" (0)
camera[:10] = 0

掩码（使用布尔值掩码进行索引）：

In [9]:
mask = camera < 87
# Set to "white" (255) the pixels where mask is True
camera[mask] = 255

花式索引（使用索引集进行索引）：

In [11]:
import numpy as np
inds_r = np.arange(len(camera))
inds_c = 4 * inds_r % len(camera)
camera[inds_r, inds_c] = 0

当您需要选择一组像素来执行操作时，掩码（Masks）非常有用。掩码可以是与图像形状相同的任何布尔数组（或可广播到图像形状的形状）。这可用于定义感兴趣的区域，例如磁盘形状：

In [12]:
nrows, ncols = camera.shape
row, col = np.ogrid[:nrows, :ncols]
cnt_row, cnt_col = nrows / 2, ncols / 2
outer_disk_mask = ((row - cnt_row)**2 + (col - cnt_col)**2 >
                   (nrows / 2)**2)
camera[outer_disk_mask] = 0

![camera](https://scikit-image.org/docs/stable/_images/sphx_glr_plot_camera_numpy_001.png)

NumPy 的布尔运算可用于定义更复杂的掩码：

In [14]:
lower_half = row > cnt_row
lower_half_disk = np.logical_and(lower_half, outer_disk_mask)
camera = data.camera()
camera[lower_half_disk] = 0

## 4.2. Color images