### Compute disparity for each pixel

In [4]:
# aivietnam.ai
# simple stereo matching using pixel-wise matching

import cv2
import numpy as np

# cho trước chiều rộng và chiều cao của ảnh
height = 288
width  = 384

def stereo_matching(left_img, right_img, disparity_range):   
    # đọc ảnh trái và ảnh phải, rồi chuyển sang ảnh grayscale
    left  = cv2.imread(left_img, 0)    
    right = cv2.imread(right_img, 0)  
    
    left  = left.astype(np.float32)
    right = right.astype(np.float32)
    
    # tạo disparity map
    depth = np.zeros((height, width), np.uint8)               
    scale = 255 / disparity_range
      
    for y in range(height):        
        for x in range(width):
            
            # tìm j tại đó cost có giá trị min
            disparity = 0
            cost_min  = abs(left[y, x] - right[y, x])
            
            for j in range(1, disparity_range):                
                cost = 255 if (x - j) < 0 else abs(left[y, x] - right[y, x - j])
                
                if cost < cost_min:
                    cost_min  = cost
                    disparity = j
                            
            # đã tìm được j (lưu ở biến disparity) để cost min
            # gán j đó vào disaprity map
            # nhân cho scale để nhìn thấy rõ ràng (không cần scale cũng được)
            depth[y, x] = disparity*scale
                                
    # chuyển dữ liệu từ ndarray sang kiểu Image và lưu xuống file
    cv2.imwrite('images/disparity_ad_w1.png', depth)
         
if __name__ == '__main__':
    disparity_range = 16 # cho cặp ảnh Tsukuba
    stereo_matching("images/left.png", "images/right.png", disparity_range)

### compute cost space

In [5]:
# aivietnam.ai
# simple stereo matching using pixel-wise matching

import cv2

# cho trước chiều rộng và chiều cao của ảnh
height = 288
width  = 384

def stereo_matching(left_img, right_img, disparity_range):   
    # đọc ảnh trái và ảnh phải, rồi chuyển sang ảnh grayscale
    left  = cv2.imread(left_img, 0)    
    right = cv2.imread(right_img, 0) 
    
    left  = left.astype(np.float32)
    right = right.astype(np.float32)
    
    # compute cost space
    cost_space = np.zeros((height, width, disparity_range), np.float32)       
    for y in range(height):        
        for x in range(width):
            for j in range(disparity_range):                
                cost = 255 if (x - j) < 0 else abs(left[y, x] - right[y, x - j])
                cost_space[y, x, j] = cost
    
    
    # process cost_space
    
    
    # compute disparity from cost space
    depth = np.zeros((height, width), np.uint8)               
    scale = 255 / disparity_range
    
    for y in range(height):        
        for x in range(width):
            disparity = 0
            cost_min  = cost_space[y, x, 0]
            for j in range(1, disparity_range): 
                cost = cost_space[y, x, j]
                
                if cost < cost_min:
                    cost_min  = cost
                    disparity = j
                    
            # đã tìm được j (lưu ở biến disparity) để cost min
            # gán j đó vào disaprity map
            # nhân cho scale để nhìn thấy rõ ràng (không cần scale cũng được)
            depth[y, x] = disparity*scale
                
    # chuyển dữ liệu từ ndarray sang kiểu Image và lưu xuống file
    cv2.imwrite('images/disparity_ad_w2.png', depth)    
         
if __name__ == '__main__':
    disparity_range = 16 # cho cặp ảnh Tsukuba
    stereo_matching("images/left.png", "images/right.png", disparity_range)

### Vectorization

In [None]:
# aivietnam.ai
# simple stereo matching using pixel-wise matching

import cv2
import numpy as np

# cho trước chiều rộng và chiều cao của ảnh
height = 288
width  = 384

def stereo_matching(left_img, right_img, disparity_range):   
    # đọc ảnh trái và ảnh phải, rồi chuyển sang ảnh grayscale
    left  = cv2.imread(left_img, 0)    
    right = cv2.imread(right_img, 0)  
    
    left  = left.astype(np.float32)
    right = right.astype(np.float32)
    
    # compute cost space
    cost_space = np.zeros((height, width, disparity_range))
    for j in range(disparity_range):                
        left_d  = left[:,j:width]
        right_d = right[:, 0:width-j]
        cost = np.abs(left_d-right_d)
        cost_space[:, j:width, j] = cost     
        
    # compute disparity from cost space
    depth = np.zeros((height, width), np.uint8)               
    scale = 255 / disparity_range
    
    for y in range(height):        
        for x in range(width):
            disparity = 0
            cost_min  = cost_space[y, x, 0]
            for j in range(1, disparity_range): 
                cost = cost_space[y, x, j]
                
                if cost < cost_min:
                    cost_min  = cost
                    disparity = j
                    
            # đã tìm được j (lưu ở biến disparity) để cost min
            # gán j đó vào disaprity map
            # nhân cho scale để nhìn thấy rõ ràng (không cần scale cũng được)
            depth[y, x] = disparity*scale
                
    # chuyển dữ liệu từ ndarray sang kiểu Image và lưu xuống file
    cv2.imwrite('images/disparity_ad_np.png', depth)  
         
if __name__ == '__main__':
    disparity_range = 16 # cho cặp ảnh Tsukuba
    stereo_matching("images/left.png", "images/right.png", disparity_range)

In [None]:
# aivietnam.ai
# simple stereo matching using pixel-wise matching

import cv2
import numpy as np

# cho trước chiều rộng và chiều cao của ảnh
height = 288
width  = 384

def stereo_matching(left_img, right_img, disparity_range):   
    # đọc ảnh trái và ảnh phải, rồi chuyển sang ảnh grayscale
    left  = cv2.imread(left_img, 0)    
    right = cv2.imread(right_img, 0)  
    
    left  = left.astype(np.float32)
    right = right.astype(np.float32)
    
    # compute cost space
    cost_space = np.zeros((height, width, disparity_range))
    for j in range(disparity_range):                
        left_d  = left[:,j:width]
        right_d = right[:, 0:width-j]
        cost = np.abs(left_d-right_d)
        cost_space[:, j:width, j] = cost     
        
    # compute disparity from cost space           
    scale = 255 / disparity_range    
    depth = np.argmin(cost_space, axis=2)
    depth = depth*scale
    depth = depth.astype(np.uint8)
                
    # chuyển dữ liệu từ ndarray sang kiểu Image và lưu xuống file
    cv2.imwrite('images/disparity_ad_np_2.png', depth)  
         
if __name__ == '__main__':
    disparity_range = 16 # cho cặp ảnh Tsukuba
    stereo_matching("images/left.png", "images/right.png", disparity_range)