도로에서 차선 찾기
이 프로젝트에서는 학습한 도구를 사용하여 도로의 차선을 식별한다. 일련의 개별 이미지에 대한 파이프라인을 개발하고 나중에 결과를 비디오 스트림에 적용할 수 있다. 아래 도우미 기능을 사용한 후 출력의 모양을 확인하려면 비디오 클립 "raw-line-example.mp4"를 확인

"raw-line-example.mp4"와 거의 유사한 결과가 나온 후에는 창의력을 발휘하여 감지한 선 세그먼트를 평균화하거나 추정하여 차선 전체를 그려야 한다. 비디오 "P1_example.mp4"에서 원하는 결과의 예를 볼 수 있다. 결국, 차선 왼쪽에는 한 줄, 오른쪽에는 한 줄만 그리려고 한다.

첫 번째 이미지인 'test_images/solidWhiteRight.jpg'를 살펴본다. 아래 2개의 셀(Shift-Enter 또는 위의 "재생" 버튼을 누름)을 실행하여 이미지를 표시한다.

참고 언제든지 고정된 디스플레이 창이나 기타 교란 문제가 발생하는 경우 위의 "커널" 메뉴로 이동하여 "다시 시작 및 출력 지우기"를 선택하여 다시 시작할 수 있다.

color selection, region of interest selection, grayscaling, Gaussian smoothing, Canny Edge Detection and Hough Tranform line detection 감지 도구가 있다. 또한 본 수업에서 제시되지 않은 다른 기술을 자유롭게 탐색하고 시도할 수 있다. 파이프라인으로 연결하여 이미지의 선 세그먼트를 감지한 다음 평균/추외하여 표시할 이미지에 그리는 것이 목표이다(아래 참조). 작동 중인 파이프라인이 있으면 아래 비디오 스트림에서 사용해 보자.

In [7]:
#유용한 패키지들을 import 해온다.
import matplotlib.pyplot as plt
import matplotlib.image as mpimg
import numpy as np
import cv2
from sklearn import linear_model
%matplotlib inline

In [6]:
#사진을 불러온다
image = mpimg.imread('test_images/solidWhiteRight.jpg')
#사진을 출력한다.
print('This image is:', type(image), 'with dimesions:', image.shape)
plt.imshow(image)  #call as plt.imshow(gray, cmap='gray') to show a grayscaled image

FileNotFoundError: [Errno 2] No such file or directory: 'test_images/solidWhiteRight.jpg'

이 이미지는 <class 'numpy.ndarray'>이고, dimension은 (540, 960, 3)이다.

In [None]:
<matplo.tlib.image.AxesImage at 0x10a67bc50>

이 프로젝트에 유용할 수 있는 OpenCV 기능 외에 다음과 같은 기능이 있다.

색상 선택을 위한 cv2.inRange()
cv2.fillPoly() 영역 선택
cv2.line 지정된 엔드포인트에 선을 그린다.
cv2.addHeighted()를 추가하여 두 이미지 cv2.cvtColor()를 그레이스케일에 추가하거나 컬러 cv2.imwrite()를 변경하여 이미지를 파일로 출력한다.
이미지에 마스크를 적용할 cv2.bitwise_andwithm

다음은 시작에 도움이 되는 몇 가지 도우미 기능이다. 

In [8]:
import math

def grayscale(img):
""""그레이스케일 변환 적용
이렇게 하면 컬러 채널이 하나만 있는 이미지가 반환된다.
참고: 반환된 이미지를 그레이스케일로 보려면
plt.imshow(gray, cmap='gray')로 call해야한다.""""
    return cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    
def canny(img, low_threshold, high_threshold):
    """Canny 변환 적용"""
    return cv2.Canny(img, low_threshold, high_threshold)

def gaussian_blur(img, kernel_size):
    """Applies a Gaussian Noise kernel"""
    return cv2.GaussianBlur(img, (kernel_size, kernel_size), 0)

def region_of_interest(img, vertices):
    """
    이미지 마스크를 적용한다.
    
   폴리곤으로 정의된 영상의 영역만 유지한다.
   
    """
    #시작할 빈 mask를 정의
    mask = np.zeros_like(img)   
    
    #입력 이미지에 따라 마스크를 채울 3채널 또는 1채널 색상 표시
    if len(img.shape) > 2:
        channel_count = img.shape[2] 
        ignore_mask_color = (255,) * channel_count
    else:
        ignore_mask_color = 255
        
    #"filing"에 의해 정의된 폴리곤 내부의 filling pixels는 fill color로 정의된다
    cv2.fillPoly(mask, vertices, ignore_mask_color)
    
    #마스크 픽셀이 0이 아닌 경우에만 영상 반환
    masked_image = cv2.bitwise_and(img, mask)
    return masked_image
    
def get_slope_of_line(line):
    points = line[0]
    return ((points[3]-points[1])/(points[2]-points[0]))

def get_intercept(m, x, y):
    # y  =  mx + (y1 - mx1) 
    return y - m * x
    
def get_mean_x_y(lines):
    n = len(lines) * 2
    if n is 0:
        return 0;
    sum_x = 0
    sum_y = 0
    for line in lines:
        sum_x, sum_y = (sum_x + line[0][0] + line[0][2], sum_y + line[0][1] + line[0][3])
    return (sum_x / n, sum_y / n)
    
        
def is_slope_horizontal(line):
    slope = get_slope_of_line(line)
    return np.absolute(slope) <= np.tan(np.pi * 30/180)

def get_mean_slope(lines):
    slopes = [get_slope_of_line(line) for line in lines]
    return np.nanmean(slopes)

def extract_x_and_y(lines):
    x_values = np.array([])
    y_values = np.array([])
    for line in lines:
        x_values = np.append(x_values, line[0][0])
        y_values = np.append(y_values, line[0][1])
        x_values = np.append(x_values, line[0][2])
        y_values = np.append(y_values, line[0][3])
    #print(x_values, y_values)
    return (x_values, np.vstack(y_values))

def draw_line2(img, y_values, x_values, color, thickness):
    model = linear_model.LinearRegression()
    model.fit(y_values, x_values)
    y1 = img.shape[0]
    x1 = int(model.predict([y1])[0])
    y2 = 0
    x2 = int(model.predict([y2])[0])
    cv2.line(img, (x1, y1), (x2, y2), color, thickness)

# 선형 회귀 분석을 사용하여 선 그리기
def draw_lines2(img, lines, color=[255, 0, 0], thickness=10):
    # Remove unwanted lines
    lines = [line for line in lines if not is_slope_horizontal(line)]
    
    right_lines = [line for line in lines if get_slope_of_line(line) > 0]
    left_lines = [line for line in lines if get_slope_of_line(line) <= 0]
    
    if left_lines:
        x_values, y_values = extract_x_and_y(left_lines)
        draw_line2(img, y_values, x_values, color, thickness)
        
    if right_lines:
        x_values, y_values = extract_x_and_y(right_lines)
        draw_line2(img, y_values, x_values, color, thickness)
    
    
def draw_lines(img, lines, color=[255, 0, 0], thickness=10):
    """
    NOTE: this is the function you might want to use as a starting point once you want to 
    average/extrapolate the line segments you detect to map out the full
    extent of the lane (going from the result shown in raw-lines-example.mp4
    to that shown in P1_example.mp4).  
    
    Think about things like separating line segments by their 
    slope ((y2-y1)/(x2-x1)) to decide which segments are part of the left
    line vs. the right line.  Then, you can average the position of each of 
    the lines and extrapolate to the top and bottom of the lane.
    
    This function draws `lines` with `color` and `thickness`.    
    Lines are drawn on the image inplace (mutates the image).
    If you want to make the lines semi-transparent, think about combining
    this function with the weighted_img() function below
    """
    # 필요없는 선 지우기
    lines = [line for line in lines if not is_slope_horizontal(line)]
    
    right_lines = [line for line in lines if get_slope_of_line(line) > 0]
    right_mean_slope = get_mean_slope(right_lines)
    left_lines = [line for line in lines if get_slope_of_line(line) <= 0]
    left_mean_slope = get_mean_slope(left_lines)
    
    # 왼쪽 선 그리기
    if left_lines and np.isfinite(left_mean_slope):
        x, y = get_mean_x_y(left_lines)
        c = int(get_intercept(left_mean_slope, x, y))
        y1 = img.shape[0]
        x1 = int((y1 - c) / left_mean_slope)
        y2 = 0
        x2 = int((y2 - c) / left_mean_slope)
        cv2.line(img, (x1, y1), (x2, y2), color, thickness)
    
    # 오른쪽 선 그리기
    if right_lines and np.isfinite(right_mean_slope):
        x, y = get_mean_x_y(right_lines)
        c = int(get_intercept(right_mean_slope, x, y))
        y1 = img.shape[0]
        x1 = int((y1 - c) / right_mean_slope)
        y2 = 0
        x2 = int((y2 - c) / right_mean_slope)
        cv2.line(img, (x1, y1), (x2, y2), color, thickness)
    
def hough_lines(img, rho, theta, threshold, min_line_len, max_line_gap):
    """
    `img`는 캐니 변환의 결과여야 한다.
        
    가시가 그려진 이미지를 반환합니다.
    """
    lines = cv2.HoughLinesP(img, rho, theta, threshold, np.array([]), minLineLength=min_line_len, maxLineGap=max_line_gap)
    line_img = np.zeros((*img.shape, 3), dtype=np.uint8)
    draw_lines2(line_img, lines)
    return line_img

# Python 3는 멋진 수학기호를 지원한다.

def weighted_img(img, initial_img, α=0.8, β=1., λ=0.):
    """
    `img` is the output of the hough_lines(), An image with lines drawn on it.
    Should be a blank image (all black) with lines drawn on it.
    
    `initial_img` should be the image before any processing.
    
    The result image is computed as follows:
    
    initial_img * α + img * β + λ
    NOTE: initial_img and img must be the same shape!
    """
    return cv2.addWeighted(initial_img, α, img, β, λ)

  if n is 0:


Test on Images
이제 "test_images" 디렉터리의 이미지를 작업하도록 파이프라인을 빌드해야 한다.
동영상을 시도하기 전에 파이프라인이 이러한 이미지에서 제대로 작동하는지 확인해야 한다.

In [9]:
import os
os.listdir("test_images/")

FileNotFoundError: [WinError 3] 지정된 경로를 찾을 수 없습니다: 'test_images/'

비디오 테스트
이미지 위에 차선을 그리는 것보다 더 멋지게 비디오 위에 차선을 그린다.

제공되는 두 가지 비디오로 테스트 할 수 있다.

In [10]:
#동영상 편집/저장/보기에 필요한 모든 튤 가져오기
from moviepy.editor import VideoFileClip
from IPython.display import HTML

ModuleNotFoundError: No module named 'moviepy'

In [11]:
def process_image(image):
#반환되는 출력은 아래의 비디오 처리를 위한 컬러 이미지(3채널)여야 한다
# TODO: 파이프라인을 여기에 놓아야한다
# 최종 출력(라인이 있는 이미지는 레인에 그려짐)을 반환해야 한다.
    imshape = image.shape

    # Gray scale
    processed_image = grayscale(image)
    # Polish
    processed_image = gaussian_blur(processed_image, 5)
    # Find edges
    high_threshold, threshold = cv2.threshold(processed_image, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU);
    low_threshold = high_threshold * 0.5
    processed_image = canny(processed_image, low_threshold, high_threshold)
    # 관심 부분은 정의
    vertices = np.array([[(0,imshape[0]), \
                          (int(imshape[1] * 50 / 100) - 50, imshape[0] * 60 / 100), \
                          (int(imshape[1] * 50 / 100) + 50, imshape[0] * 60 / 100), \
                          (imshape[1], imshape[0])]], \
                        dtype=np.int32)
    # 관심부분을 정의
    processed_image = region_of_interest(processed_image, vertices)
    # Mark lane lines
    processed_image = hough_lines(processed_image, 1, np.pi / 180, 10, 10, 100)
    # 관심부분을 정의
    processed_image = region_of_interest(processed_image, vertices)
    # 결과를 원본 이미지와 결합
    processed_image = weighted_img(processed_image, image)

    return processed_image

def process_test_images():
    dir = "test_images/"
    #dir = "error_batch1/"
    files = [file for file in os.listdir(dir) if not file.startswith("out_") and file.endswith('.jpg')]
    for image_path in files :
        image = mpimg.imread(dir + image_path)
        plt.title(image_path)
        processed_image = process_image(image)
        plt.imshow(processed_image)
        plt.show()
        
        cv2.imwrite(dir + 'out_' + image_path , processed_image)
        
process_test_images()

FileNotFoundError: [WinError 3] 지정된 경로를 찾을 수 없습니다: 'test_images/'

In [None]:
white_output = 'white.mp4'
clip1 = VideoFileClip("solidWhiteRight.mp4")
white_clip = clip1.fl_image(process_image) #NOTE: this function expects color images!!
%time white_clip.write_videofile(white_output, audio=False)

[MoviePy] >>>> Building video white.mp4
[MoviePy] Writing video white.mp4
100%|█████████▉| 221/222 [00:07<00:00, 30.45it/s]
[MoviePy] Done.
[MoviePy] >>>> Video ready: white.mp4 

CPU times: user 3.85 s, sys: 1.19 s, total: 5.04 s
Wall time: 8.08 s

인라인으로 비디오를 재생하거나 파일 시스템에서 비디오를 찾고(동일한 디렉토리에 있어야 함) 선택한 비디오 플레이어에서 비디오를 재생한다.

In [12]:
HTML("""
<video width="960" height="540" controls>
  <source src="{0}">
</video>
""".format(white_output))

NameError: name 'HTML' is not defined

In [None]:
이 시점에서 성공했다면 Hough line segments가 도로에 그려졌을 수도 있지만, 차선 전체를 식별하고 예제 비디오(P1_example.mp4)와 
같이 명확하게 표시하는 것은 어떤가? Hough Transform(거치 변환)으로 식별한 선 세그먼트를 기준으로 가시적 레인의 전체 길이를 실행할 선을 정의할 
수 있다. 이에 따라 draw_lines 기능을 수정하고 파이프라인을 다시 실행하라.

In [None]:
yellow_output = 'yellow.mp4'
clip2 = VideoFileClip('solidYellowLeft.mp4')
yellow_clip = clip2.fl_image(process_image)
%time yellow_clip.write_videofile(yellow_output, audio=False)

[MoviePy] >>>> Building video yellow.mp4
[MoviePy] Writing video yellow.mp4
100%|█████████▉| 681/682 [00:23<00:00, 29.51it/s]
[MoviePy] Done.
[MoviePy] >>>> Video ready: yellow.mp4 

CPU times: user 12.3 s, sys: 3.59 s, total: 15.9 s
Wall time: 23.9 s

In [None]:
HTML("""
<video width="960" height="540" controls>
  <source src="{0}">
</video>
""".format(yellow_output))

In [None]:
challenge_output = 'extra.mp4'
clip2 = VideoFileClip('challenge.mp4')
challenge_clip = clip2.fl_image(process_image)
%time challenge_clip.write_videofile(challenge_output, audio=False)


[MoviePy] >>>> Building video extra.mp4
[MoviePy] Writing video extra.mp4
100%|██████████| 251/251 [00:16<00:00, 16.48it/s]
[MoviePy] Done.
[MoviePy] >>>> Video ready: extra.mp4 

CPU times: user 8.61 s, sys: 2.28 s, total: 10.9 s
Wall time: 19 s

In [None]:
HTML("""
<video width="960" height="540" controls>
  <source src="{0}">
</video>
""".format(challenge_output))