In [1]:
import cv2
import numpy as np

### 读写图像文件

* 每一个像素都有一个值，不同格式表示像素的方式不同。可以通过一个二维数组创建一个黑色的正方形图像：

In [2]:
img = np.zeros((3,3),dtype=np.uint8)#每个像素都由一个8位整数表示，像素值范围是0-255。
print(img)

[[0 0 0]
 [0 0 0]
 [0 0 0]]


* 用cv2.cvtColor函数将图像转换成（Blue-Green-Red）BGR格式：

In [3]:
img = cv2.cvtColor(img,cv2.COLOR_GRAY2BGR)

In [4]:
print(img)#每个像素由一个三元组表示，每个整型向量分别表示一个B、G、R通道。

[[[0 0 0]
  [0 0 0]
  [0 0 0]]

 [[0 0 0]
  [0 0 0]
  [0 0 0]]

 [[0 0 0]
  [0 0 0]
  [0 0 0]]]


* 通过shape查看图像的结构，返回行和列。

In [5]:
print(img.shape)#返回的3,3,3分别是行、列、通道数。

(3, 3, 3)


* 读取一种格式的图像文件，保存为另一种格式。

In [6]:
image = cv2.imread('one.jpg')#将png格式转换为jpg格式
cv2.imwrite('one.png',image)

True

In [7]:
print(image)
print(image.shape)

[[[255 253 255]
  [255 253 255]
  [255 253 255]
  ...
  [255 253 255]
  [255 253 255]
  [255 253 255]]

 [[255 253 255]
  [255 253 255]
  [255 253 255]
  ...
  [255 253 255]
  [255 253 255]
  [255 253 255]]

 [[255 253 255]
  [255 253 255]
  [255 253 255]
  ...
  [255 253 255]
  [255 253 255]
  [255 253 255]]

 ...

 [[255 253 255]
  [255 253 255]
  [255 253 255]
  ...
  [255 253 255]
  [255 253 255]
  [255 253 255]]

 [[255 253 255]
  [255 253 255]
  [255 253 255]
  ...
  [255 253 255]
  [255 253 255]
  [255 253 255]]

 [[255 253 255]
  [255 253 255]
  [255 253 255]
  ...
  [255 253 255]
  [255 253 255]
  [255 253 255]]]
(959, 959, 3)


* BGR和RGB表示的色彩空间相同，，但是字节顺序相反。

* imread()函数参数

> IMREAD_ANYCOLOR = 4

> IMREAD_ANYDEPTH = 2

> IMREAD_COLOR = 1

> IMREAD_GRAYSCALE = 0

> IMREAD_LOAD_GDAL = 8

> IMREAD_UNCHANGED = -1

* 例如:将png文件作为灰度图像，又保存为灰度的png图像：

In [8]:
grayImage = cv2.imread('two.png',cv2.IMREAD_GRAYSCALE)
cv2.imwrite('two.png',grayImage)

True

In [9]:
print(grayImage)
print(grayImage.shape)

[[254 254 254 ... 254 254 254]
 [254 254 254 ... 254 254 254]
 [254 254 254 ... 254 254 254]
 ...
 [254 254 254 ... 254 254 254]
 [254 254 254 ... 254 254 254]
 [254 254 254 ... 254 254 254]]
(959, 959)


### 图像与原始字节之间的转换

* 8位的灰度图是二维数组，24位的BGR图像是三维数组。如image[0,0]或image[0,0,0]。第一个值代表像素的y坐标或行，0表示顶部；第二个值代表像素的x坐标或列，0表示坐标；第三个值表示颜色通道。

* 将含有随机字节的bytearray转换为灰度图像和BGR图像。

In [10]:
import os

In [11]:
randomByteArray = bytearray(os.urandom(120000))
flatNumpyArray = np.array(randomByteArray)

grayImage1 = flatNumpyArray.reshape(300,400)
cv2.imwrite('randomGray.png',grayImage1)

bgrImage = flatNumpyArray.reshape(100,400,3)
cv2.imwrite('randomColor.png',bgrImage)

True

In [12]:
print(grayImage1.shape)
print(bgrImage.shape)

(300, 400)
(100, 400, 3)


* 将BGR图像在（0,0）处的像素转化为白像素。

In [13]:
img = cv2.imread('image3.jpg')
img[0,0] = [255,255,255]
cv2.imshow('image',img)
cv2.waitKey(0)

-1

![title](img2.png)

* 改变某一坐标的像素值，通过np.array提供的item()函数有3个参数，x,y以及x,y位置的数组索引，该函数返回索引位置的值。还可以通过itemset()函数可设置指定通道的值，有2个参数：一个三元组和索要设定的值。

* 将坐标(150,120)的当前蓝色值(127)变为255：

In [14]:
img = cv2.imread('image3.jpg')
print(img.item(150,120,0))

img.itemset((150,120,0),255)
print(img.item(150,120,0))

cv2.imshow('image',img)
cv2.waitKey(0)

0
255


-1

![title](img1.png)

* 操作通道，将指定通道B/G/R的所有值置为0

In [15]:
img = cv2.imread('one.jpg')
img[:,:,1] = 0#将G值设为0,0表示B，1表示G，2表示R

In [16]:
print(img)
cv2.imshow('image',img)
cv2.waitKey(0)

[[[255   0 255]
  [255   0 255]
  [255   0 255]
  ...
  [255   0 255]
  [255   0 255]
  [255   0 255]]

 [[255   0 255]
  [255   0 255]
  [255   0 255]
  ...
  [255   0 255]
  [255   0 255]
  [255   0 255]]

 [[255   0 255]
  [255   0 255]
  [255   0 255]
  ...
  [255   0 255]
  [255   0 255]
  [255   0 255]]

 ...

 [[255   0 255]
  [255   0 255]
  [255   0 255]
  ...
  [255   0 255]
  [255   0 255]
  [255   0 255]]

 [[255   0 255]
  [255   0 255]
  [255   0 255]
  ...
  [255   0 255]
  [255   0 255]
  [255   0 255]]

 [[255   0 255]
  [255   0 255]
  [255   0 255]
  ...
  [255   0 255]
  [255   0 255]
  [255   0 255]]]


-1

* 将图像的一部分拷贝到另一部分。

In [17]:
img = cv2.imread('image4.jpg')
my_roi = img[0:100,0:100]
img[300:400,300:400] = my_roi

In [18]:
cv2.imshow('image',img)
cv2.waitKey(0)

-1

![title](img3.png)

* 获取图像属性

In [19]:
img = cv2.imread('image3.jpg')
print('图像维度为：',img.shape)#返回图像宽度，高度，通道数
print('图像像素大小为：',image.size)#图像像素的大小
print('图像格式为：',img.dtype)#图像的数据类型

图像维度为： (2560, 1440, 3)
图像像素大小为： 2759043
图像格式为： uint8
