In [1]:
import cv2
import numpy as np

### 读写图像文件

* 每一个像素都有一个值，不同格式表示像素的方式不同。可以通过一个二维数组创建一个黑色的正方形图像：

In [7]:
img = np.zeros((3,3),dtype=np.uint8)#每个像素都由一个8位整数表示，像素值范围是0-255。
print(img)

[[0 0 0]
 [0 0 0]
 [0 0 0]]


* 用cv2.cvtColor函数将图像转换成（Blue-Green-Red）BGR格式：

In [8]:
img = cv2.cvtColor(img,cv2.COLOR_GRAY2BGR)

In [9]:
print(img)#每个像素由一个三元组表示，每个整型向量分别表示一个B、G、R通道。

[[[0 0 0]
  [0 0 0]
  [0 0 0]]

 [[0 0 0]
  [0 0 0]
  [0 0 0]]

 [[0 0 0]
  [0 0 0]
  [0 0 0]]]


* 通过shape查看图像的结构，返回行和列。

In [10]:
print(img.shape)#返回的3,3,3分别是行、列、通道数。

(3, 3, 3)


* 读取一种格式的图像文件，保存为另一种格式。

In [11]:
image = cv2.imread('ImageTest/one.jpg')#将png格式转换为jpg格式
cv2.imwrite('ImageTest/one.png',image)

True

In [12]:
print(image)
print(image.shape)

[[[255 253 255]
  [255 253 255]
  [255 253 255]
  ...
  [255 253 255]
  [255 253 255]
  [255 253 255]]

 [[255 253 255]
  [255 253 255]
  [255 253 255]
  ...
  [255 253 255]
  [255 253 255]
  [255 253 255]]

 [[255 253 255]
  [255 253 255]
  [255 253 255]
  ...
  [255 253 255]
  [255 253 255]
  [255 253 255]]

 ...

 [[255 253 255]
  [255 253 255]
  [255 253 255]
  ...
  [255 253 255]
  [255 253 255]
  [255 253 255]]

 [[255 253 255]
  [255 253 255]
  [255 253 255]
  ...
  [255 253 255]
  [255 253 255]
  [255 253 255]]

 [[255 253 255]
  [255 253 255]
  [255 253 255]
  ...
  [255 253 255]
  [255 253 255]
  [255 253 255]]]
(959, 959, 3)


* BGR和RGB表示的色彩空间相同，，但是字节顺序相反。

* imread()函数参数

> IMREAD_ANYCOLOR = 4

> IMREAD_ANYDEPTH = 2

> IMREAD_COLOR = 1

> IMREAD_GRAYSCALE = 0

> IMREAD_LOAD_GDAL = 8

> IMREAD_UNCHANGED = -1

* 例如:将png文件作为灰度图像，又保存为灰度的png图像：

In [13]:
grayImage = cv2.imread('ImageTest/two.png',cv2.IMREAD_GRAYSCALE)
cv2.imwrite('ImageTest/two.png',grayImage)

True

In [14]:
print(grayImage)
print(grayImage.shape)

[[254 254 254 ... 254 254 254]
 [254 254 254 ... 254 254 254]
 [254 254 254 ... 254 254 254]
 ...
 [254 254 254 ... 254 254 254]
 [254 254 254 ... 254 254 254]
 [254 254 254 ... 254 254 254]]
(959, 959)


### 图像与原始字节之间的转换

* 8位的灰度图是二维数组，24位的BGR图像是三维数组。如image[0,0]或image[0,0,0]。第一个值代表像素的y坐标或行，0表示顶部；第二个值代表像素的x坐标或列，0表示坐标；第三个值表示颜色通道。

* 将含有随机字节的bytearray转换为灰度图像和BGR图像。

In [15]:
import os

In [16]:
randomByteArray = bytearray(os.urandom(120000))
flatNumpyArray = np.array(randomByteArray)

grayImage1 = flatNumpyArray.reshape(300,400)
cv2.imwrite('ImageTest/randomGray.png',grayImage1)

bgrImage = flatNumpyArray.reshape(100,400,3)
cv2.imwrite('ImageTest/randomColor.png',bgrImage)

True

In [17]:
print(grayImage1.shape)
print(bgrImage.shape)

(300, 400)
(100, 400, 3)


* 将BGR图像在（0,0）处的像素转化为白像素。

In [26]:
img = cv2.imread('ImageTest/image3.jpg')
img[0,0] = [255,255,255]
cv2.imshow('image',img)
cv2.waitKey(0)

-1

![title](image/img2.png)

* 改变某一坐标的像素值，通过np.array提供的item()函数有3个参数，x,y以及x,y位置的数组索引，该函数返回索引位置的值。还可以通过itemset()函数可设置指定通道的值，有2个参数：一个三元组和索要设定的值。

* 将坐标(150,120)的当前蓝色值(127)变为255：

In [19]:
img = cv2.imread('ImageTest/image3.jpg')
print(img.item(150,120,0))

img.itemset((150,120,0),255)
print(img.item(150,120,0))

cv2.imshow('image',img)
cv2.waitKey(0)

0
255


-1

![title](image/img1.png)

* 操作通道，将指定通道B/G/R的所有值置为0

In [20]:
img = cv2.imread('ImageTest/one.jpg')
img[:,:,1] = 0#将G值设为0,0表示B，1表示G，2表示R

In [21]:
print(img)
cv2.imshow('image',img)
cv2.waitKey(0)

[[[255   0 255]
  [255   0 255]
  [255   0 255]
  ...
  [255   0 255]
  [255   0 255]
  [255   0 255]]

 [[255   0 255]
  [255   0 255]
  [255   0 255]
  ...
  [255   0 255]
  [255   0 255]
  [255   0 255]]

 [[255   0 255]
  [255   0 255]
  [255   0 255]
  ...
  [255   0 255]
  [255   0 255]
  [255   0 255]]

 ...

 [[255   0 255]
  [255   0 255]
  [255   0 255]
  ...
  [255   0 255]
  [255   0 255]
  [255   0 255]]

 [[255   0 255]
  [255   0 255]
  [255   0 255]
  ...
  [255   0 255]
  [255   0 255]
  [255   0 255]]

 [[255   0 255]
  [255   0 255]
  [255   0 255]
  ...
  [255   0 255]
  [255   0 255]
  [255   0 255]]]


-1

* 将图像的一部分拷贝到另一部分。

In [22]:
img = cv2.imread('ImageTest/image4.jpg')
my_roi = img[0:100,0:100]
img[300:400,300:400] = my_roi

In [23]:
cv2.imshow('image',img)
cv2.waitKey(0)

-1

![title](image/img3.png)

* 获取图像属性

In [24]:
img = cv2.imread('ImageTest/image3.jpg')
print('图像维度为：',img.shape)#返回图像宽度，高度，通道数
print('图像像素大小为：',image.size)#图像像素的大小
print('图像格式为：',img.dtype)#图像的数据类型

图像维度为： (2560, 1440, 3)
图像像素大小为： 2759043
图像格式为： uint8


### 视频文件的读/写

* VideoCapture和VideoWriter支持各种格式的视频文件。VideoCapture通过read函数获取新的帧，将图像传递给VideoWriter的write函数，会将图像加到VideoWriter指向的文件中，文件若存在，则被覆盖。VideoWriter构造函数要指定文件名和视频编解码器。

In [31]:
videoCapture = cv2.VideoCapture('video/video1.avi')
fps = videoCapture.get(cv2.CAP_PROP_FPS)
size = (int(videoCapture.get(cv2.CAP_PROP_FRAME_WIDTH)),
       int(videoCapture.get(cv2.CAP_PROP_FRAME_HEIGHT)))

videoWriter = cv2.VideoWriter('video/video2.avi',cv2.VideoWriter_fourcc('I','4','2','0'),fps,size)

success,frame = videoCapture.read()

print(success)
print(frame)

while success :
    videoWriter.write(frame)
    success,frame = videoCapture.read()
    
print(success)
print(frame)

True
[[[0 1 0]
  [0 1 0]
  [0 1 0]
  ...
  [0 0 0]
  [0 0 0]
  [0 0 0]]

 [[0 1 0]
  [0 1 0]
  [0 1 0]
  ...
  [0 0 0]
  [0 0 0]
  [0 0 0]]

 [[0 1 0]
  [0 1 0]
  [0 1 0]
  ...
  [0 0 0]
  [0 0 0]
  [0 0 0]]

 ...

 [[0 0 0]
  [0 0 0]
  [0 0 0]
  ...
  [0 0 0]
  [0 0 0]
  [0 0 0]]

 [[0 0 0]
  [0 0 0]
  [0 0 0]
  ...
  [0 0 0]
  [0 0 0]
  [0 0 0]]

 [[0 0 0]
  [0 0 0]
  [0 0 0]
  ...
  [0 0 0]
  [0 0 0]
  [0 0 0]]]
False
None


* 编解码器的常用选项：

> cv2.VideoWriter_fourcc('T','4','2','0')，未压缩的YUV颜色编码，但会产生较大文件，文件扩展名为.avi。

> cv2.VideoWriter_fourcc('P','T','M','I')：MPEG-1编码，扩展名为.avi。

> cv2.VideoWriter_fourcc(X'','V','I','D')：MPEG-4编码，得到的视频大小为平均值。

> cv2.VideoWriter_fourcc('T','H','E','O')：文件扩展名是.ogv。

> cv2.VideoWriter_fourcc('F','L','V','I')：Flash视频，扩展名.flv。

### 捕获摄像头的帧

* VideoCapture捕获摄像头的帧流，写入到AVI文件中。

In [40]:
cameraCapture = cv2.VideoCapture(0)
fps = 30#一个假设

size = (int(cameraCapture.get(cv2.CAP_PROP_FRAME_WIDTH)),int(cv2.CAP_PROP_FRAME_HEIGHT))
print(size)
videoWriter = cv2.VideoWriter('video/video3.avi',cv2.VideoWriter_fourcc('I','4','2','0'),fps,size)

success,frame = cameraCapture.read()
# print(success)
# print(frame)
if videoCapture.isOpened():# if videoCapture.read()                                                                                                                                                                                           is true
    numFrameRemaining = 100 * fps - 1 #10 seconds video
    while success and numFrameRemaining > 0:
        videoWriter.write(frame)
        success,frame = cameraCapture.read()
        numFrameRemaining = -1
    cameraCapture.release()
    
else:
    print("error")

(640, 4)


* 当需要同步一组或一个多头摄像头的时候，read()不再适用，可用grad()和retrive()方法代替。

In [38]:
cameraCapture0 = cv2.VideoCapture(0)
cameraCapture1 = cv2.VideoCapture(0)

success0 = cameraCapture0.grab()
success1 = cameraCapture1.grab()

if success0 and success1:
    frame0 = cameraCapture0.retrieve()
    frame1 = cameraCapture1.retrieve()

### 在窗口显示图像

* imshow()函数可以实现图像显示。

In [42]:
img = cv2.imread('ImageTest/image3.jpg')
cv2.imshow('image',img)#第一个参数是图像名称，第二个参数是图像本身
cv2.waitKey()
cv2.destroyAllWindows()#释放创建的所有窗口

### 在窗口显示摄像头帧

* namedWindow()、imshow()、DestroyWindow()函数指定窗口创建、显示和销毁窗口。waitKey获取键盘输入，setMouseCallback获取鼠标输入、

In [2]:
clicked = False
def onMouse(event,x,y,flags,param):
    global  clicked#global variable
    if event == cv2.EVENT_MOUSEMOVE:
        clicked = True
        
cameraCapture = cv2.VideoCapture(0)
cv2.namedWindow('My Window')
cv2.setMouseCallback('My window',onMouse)
print('showing camera feed. Click window or press any key to stop')
success,frame = cameraCapture.read()
while success and cv2.waitKey(1 ) == -1 and not clicked:# waitKey return -1 is not click key,waitKey参数为等待键盘触发时间
    cv2.imshow('My Window',frame)
    success,frame = cameraCapture.read()
cv2.destroyWindow('My Window')
cameraCapture.release()

showing camera feed. Click window or press any key to stop


In [54]:
print(ord('a'))# 返回字符的ASCII值

97


In [3]:
import cv2
import numpy as np
import time

class CaptureManager(object):
    
    def __init__(self,capture,previewWindowManager = None,shouldMirrorPreview = False):
        
        self.previewWindowManager = previewWindowManager
        self.shouldMirrorPreview = shouldMirrorPreview
        
        self._capture = capture
        self._channel = 0
        self._enteredFrame = False
        self._frame = None
        self._imageFilename = None
        sele._videoFilename = None
        self._videoEncoding = None
        self._videoWriter = None
        
        self._startTime = None
        self._framesElapsed = None
        self._fpsEstimate = None
        
    @property
    def channel(self):
        return self._channel
    
    @channel.setter
    def channel(self,value):
        if self._channel != value:
            self._channel = value
            self._frame = None
            

SyntaxError: unexpected EOF while parsing (<ipython-input-3-183add7fa18d>, line 30)