# Read, Display and Write an Image using OpenCV

1. imread() helps us read an image
2. imshow() displays an image in a window
3. imwrite() writes an image into the file directory

In [1]:
import cv2
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

## Reading an Image

imread(filename, flags)

flags:
- cv2.IMREAD_UNCHANGED  or -1
- cv2.IMREAD_GRAYSCALE  or 0
- cv2.IMREAD_COLOR  or 1

In [2]:
img_color = cv2.imread('images/1.JPG', 1);

In [3]:
img_grayscale = cv2.imread('images/1.JPG',0);

In [4]:
img_unchanged = cv2.imread('images/1.JPG', -1);

## Displaying an Image

imshow(window_name, image)
1. The first argument is the window name that will be displayed on the window.
2. The second argument is the image that you want to display.

waitKey(): thời gian cửa sổ được hiển thị (ms)
destroyAllWindows()/destroyWindow(): xóa cửa sổ hoặc hình ảnh khỏi bộ nhớ chính của hệ thống

In [5]:
cv2.imshow('color image', img_color);
cv2.waitKey(0);
cv2.destroyAllWindows();

## Writing an Image

imwrite(filename, image)
1. The first argument is the filename, which must include the filename extension (for example .png, .jpg etc). OpenCV uses this filename extension to specify the format of the file. 
2. The second argument is the image you want to save. The function returns True if the image is saved successfully.

In [6]:
cv2.imwrite('grayscale.jpg',img_grayscale)

True

## Summary

1. imread(), imshow() and imwrite() functions to read, display, and write images 
2. waitKey() and destroyAllWindows() functions, along with the display function to 
- close the image window on key press
- and clear any open image window from the memory.

# Reading and Writing Videos using OpenCV

## Reading Video From a File

VideoCapture(path, apiPreference)

In [3]:
# Create a video capture object, in this case we are reading the video from a file
vid_capture = cv2.VideoCapture('video.mp4')

1. isOpened(): trả về một giá trị boolean cho biết luồng video có hợp lệ hay không
2. get(): lấy một đối số duy nhất từ một danh sách liệt kê các tùy chọn 
+ 5: tốc độ khung hình (CAP_PROP_FPS)
+ 7: số khung hình ( CAP_PROP_FRAME_COUNT)

In [4]:
if (vid_capture.isOpened() == False):
  print("Error opening the video file")
else:
  # Get frame rate information
 
  fps = int(vid_capture.get(5))
  print("Frame Rate : ",fps,"frames per second")  
 
  # Get frame count
  frame_count = vid_capture.get(7)
  print("Frame count : ", frame_count)

Frame Rate :  25 frames per second
Frame count :  739.0


1. vid_capture.read(): trả về một tuple
trong đó:
- phần tử đầu tiên là một giá trị logic 
- phần tử tiếp theo là khung hình video thực tế. 

Khi phần tử đầu tiên là True, nó cho biết luồng video chứa khung để đọc.

2. imshow() để hiển thị khung hiện tại trong cửa sổ, nếu không thì thoát khỏi vòng lặp

3. waitKey() chức năng tạm dừng trong 20 mili giây giữa các khung hình video

In [5]:
while(vid_capture.isOpened()):
  # vCapture.read() methods returns a tuple, first element is a bool 
  # and the second is frame
 
  ret, frame = vid_capture.read()
  if ret == True:
    cv2.imshow('Frame',frame)
    k = cv2.waitKey(20)
    # 113 is ASCII code for q key
    if k == 113:
      break
  else:
    break

Giải phóng đối tượng quay video(vid_capture) và đóng cửa sổ

In [6]:
# Release the objects
vid_capture.release()
cv2.destroyAllWindows()

## Reading an Image Sequence

In [7]:
# một chuỗi hình ảnh
# ví dụ: Cars0001.jpg, Cars0002.jpg, Cars0003.jpg, ... 
#vid_capture = cv2.VideoCapture('Resources/Image_sequence/Cars%04d.jpg')

## Reading Video from a Webcam

In [14]:
#CAP_DSHOWchỉ là một tùy chọn API quay video khác, viết tắt của directshow via video input.
vid_capture = cv2.VideoCapture(0, cv2.CAP_DSHOW)

## Writing Videos

- chiều cao và chiều rộng của khung ảnh bằng get() : 3,4
- Khởi tạo một đối tượng quay video

In [15]:
# Obtain frame size information using get() method
frame_width = int(vid_capture.get(3))
frame_height = int(vid_capture.get(4))
frame_size = (frame_width,frame_height)
fps = 20

VideoWriter(filename, apiPreference, fourcc, fps, frameSize[,isColor])
- filename: tên đường dẫn cho tệp video đầu ra
- apiPreference: Định danh phụ trợ API
- fourcc: Mã 4 ký tự của codec, dùng để nén khung hình ( Fourcc )
- fps: Tốc độ khung hình của luồng video đã tạo
- frame_size: Kích thước của khung hình video
- isColor: Nếu không bằng 0, bộ mã hóa sẽ mong đợi và mã hóa các khung màu. Nếu không, nó sẽ hoạt động với các khung thang độ xám (cờ hiện chỉ được hỗ trợ trên Windows).

AVI:cv2.VideoWriter_fourcc('M','J','P','G')

MP4:cv2.VideoWriter_fourcc(*'XVID')

In [16]:
# Initialize video writer object
output = cv2.VideoWriter('output_video_from_file.mp4', cv2.VideoWriter_fourcc(*'XVID'), 20, frame_size)


In [19]:
while(vid_capture.isOpened()):
    # vid_capture.read() methods returns a tuple, first element is a bool 
    # and the second is frame
 
    ret, frame = vid_capture.read()
    if ret == True:
           # Write the frame to the output files
           output.write(frame)
    else:
         print('Stream disconnected')
    break

In [20]:
# Release the objects
vid_capture.release()
output.release()

# Thay đổi kích thước hình ảnh

In [2]:
# Reading image
image = cv2.imread('images/1.JPG')

# Get original height and width
h,w,c = image.shape
print("Hight",h,"width",w,"channel",c)

Hight 503 width 894 channel 3


resize(src, dsize[, dst[, fx[, fy[, interpolation]]]])
- src: Đó là hình ảnh đầu vào bắt buộc, nó có thể là một chuỗi có đường dẫn của hình ảnh đầu vào (ví dụ: 'test_image.png').
- dsize: Đó là kích thước mong muốn của hình ảnh đầu ra, nó có thể là chiều cao và chiều rộng mới.
- fx: Hệ số tỷ lệ dọc theo trục hoành.
- fy: Hệ số tỷ lệ theo trục tung.
- interpolation: Nó cho chúng ta tùy chọn các phương pháp thay đổi kích thước hình ảnh khác nhau.

## Thay đổi kích thước bằng cách chỉ định chiều rộng và chiều cao

In [27]:
# Set rows and columns 
# lets downsize the image using new  width and height
down_width = 300
down_height = 200
down_points = (down_width, down_height)
resized_down = cv2.resize(image, down_points, interpolation= cv2.INTER_LINEAR)

Tiếp theo, chúng tôi tạo một biến khác để tăng kích thước của hình ảnh. 

In [24]:
# Set rows and columns
up_width = 600
up_height = 400
up_points = (up_width, up_height)
# resize the image
resized_up = cv2.resize(image, up_points, interpolation = cv2.INTER_LINEAR)

In [28]:
# Display images
cv2.imshow('Resized Down by defining height and width', resized_down)
cv2.waitKey()
cv2.imshow('Resized Up image by defining height and width', resized_up)
cv2.waitKey()
cv2.destroyAllWindows()

## Thay đổi kích thước với hệ số tỷ lệ

In [3]:
# Scaling Up the image 1.2 times by specifying both scaling factors
scale_up_x = 1.2
scale_up_y = 1.2
# Scaling Down the image 0.6 times specifying a single scale factor.
scale_down = 0.6
 
scaled_f_down = cv2.resize(image, None, fx= scale_down, fy= scale_down, interpolation= cv2.INTER_LINEAR)
scaled_f_up = cv2.resize(image, None, fx= scale_up_x, fy= scale_up_y, interpolation= cv2.INTER_LINEAR)

In [4]:
# Display images and press any key to check next image
cv2.imshow('Resized Down by defining scaling factor', scaled_f_down)
cv2.waitKey()
cv2.imshow('Resized Up image by defining scaling factor', scaled_f_up)
cv2.waitKey()
cv2.destroyAllWindows()

## Thay đổi kích thước bằng các phương pháp nội suy khác nhau

1. INTER_AREA: INTER_AREA sử dụng mối quan hệ diện tích pixel để lấy mẫu lại. Điều này phù hợp nhất để giảm kích thước của hình ảnh (thu nhỏ). Khi được sử dụng để phóng to hình ảnh, nó sử dụng INTER_NEARESTphương thức.
2. INTER_CUBIC: Điều này sử dụng phép nội suy nhị phân để thay đổi kích thước hình ảnh. Trong khi thay đổi kích thước và nội suy các pixel mới, phương pháp này hoạt động trên các pixel lân cận 4×4 của hình ảnh. Sau đó, nó lấy trọng số trung bình của 16 pixel để tạo pixel được nội suy mới.
3. INTER_LINEAR: Phương pháp này hơi giống với INTER_CUBIC phép nội suy. Nhưng không giống như INTER_CUBIC, điều này sử dụng các pixel lân cận 2×2 để lấy giá trị trung bình có trọng số cho pixel được nội suy.
4. INTER_NEAREST: INTER_NEAREST Phương thức sử dụng khái niệm hàng xóm gần nhất để nội suy. Đây là một trong những phương pháp đơn giản nhất, chỉ sử dụng một pixel lân cận từ hình ảnh để nội suy.

In [5]:
# Scaling Down the image 0.6 times using different Interpolation Method
res_inter_nearest = cv2.resize(image, None, fx= scale_down, fy= scale_down, interpolation= cv2.INTER_NEAREST)
res_inter_linear = cv2.resize(image, None, fx= scale_down, fy= scale_down, interpolation= cv2.INTER_LINEAR)
res_inter_area = cv2.resize(image, None, fx= scale_down, fy= scale_down, interpolation= cv2.INTER_AREA)

In [6]:
# Concatenate images in horizontal axis for comparison
vertical= np.concatenate((res_inter_nearest, res_inter_linear, res_inter_area), axis = 0)
# Display the image Press any key to continue
cv2.imshow('Inter Nearest :: Inter Linear :: Inter Area', vertical)
cv2.waitKey()
cv2.destroyAllWindows()