### Perspective_Transform
![example grid](example_grid1.jpg)
首先，在“source”图像中选择四个点，然后映射至“destination”图像，后者是一个俯视图（top-down view）。模拟器中的正方形网格代表长度为1米的正方形。因而前面谈到的映射也将为我们提供一个对相机视图内的所有物体的距离估计。    
透视变换（Perspective transforms）包括了一些复杂的几何学知识，但我们在这里使用OpenCV库函数 cv2.getPerspectiveTransform()和 cv2.warpPerspective()来除了这个繁重的任务（更多关于这个和其他几何变换，参考：https://docs.opencv.org/trunk/da/d6e/tutorial_py_geometric_transformations.html）    
因此，需要执行以下步骤：
1. 定义4个源点，即图像上某个单元格的四个角点
2. 定义4个目标点（注意点的罗列顺序应和源点一致）
3. 使用cv2.getPerspectiveTransform()获得变换矩阵M
4. 使用cv2.warpPerspective()将变换矩阵M应用在图像上，扭曲(warp)图像并获得俯视图。    

为了执行选择源点的第一步，可以执行一些图像分析来识别图像中的线条和角，但因为只需要做一次，因此可以只需使用交互式matplotlib窗口手动选择点。在交互式matplotlib窗口，可以读取光标所指的像素坐标。通过放大视图来更好地测量角点的坐标值并记录。

In [10]:
import matplotlib.image as mpimg
import matplotlib.pyplot as plt
# This enables the interactive matplotlib window
%matplotlib notebook
image = mpimg.imread('example_grid1.jpg')
plt.imshow(image)
plt.show()

<IPython.core.display.Javascript object>

#### Choosing destination points
选择源点以后，剩下的就是选择目的点了。在这种情况下，选择一组正方形点集是有意义的，这样网格中的平方米就能够用目标图像中的正方形区域表示。例如，将采样视图地面上的一平方米单元格映射为输出图像中10×10像素的正方形，这意味着图像中的每个像素映射到地面上是0.1×0.1平方米的区域。    
注意：将网格中的每个正方形映射到目标图像中的10x10像素正方形只是一个建议，可以选择其他缩放。     
下面已经给出变换方程，现在所要做的就是在source image（原始图）中选择四个点，并在输出图像中映射到它们(还需要选择输出图像上的四个点)。

In [11]:
import cv2
import numpy as np

def perspect_transform(img, src, dst):
    # Get transform matrix using cv2.getPerspectivTransform()
    M = cv2.getPerspectiveTransform(src, dst)
    # Warp image using cv2.warpPerspective()
    # keep some size as input image
    warped = cv2.warpPerspective(img, M, (img.shape[1], img.shape[0]))
    # Return the result
    return warped

# Define source and destination points
source = np.float32([[118.134,95.9982],
                     [200.234,95.7806],
                     [302.795,140.155],
                     [15.0656,139.664]])
img_size_h = image.shape[0]
img_size_w = image.shape[1]
destination = np.float32([[img_size_w/2-5,img_size_h-20-10],
                          [img_size_w/2+5,img_size_h-20-10],
                          [img_size_w/2+5,img_size_h-20],
                          [img_size_w/2-5,img_size_h-20]])

warped = perspect_transform(image, source, destination)
plt.imshow(warped)
plt.show()

<IPython.core.display.Javascript object>

在实施变换之后，较理想的输出结果应该接近于下图所示：
![transform_result](example_result.png)

在上面的图像中，地面上的网格单元已经映射到10×10的像素方，换句话说，该图像中的每个像素现在代表Rover环境中的10平方厘米。结果看起来有点奇怪，但现在它确实是一个俯视图，这在Rover相机的视野中是可见的，换句话说，这是一张Map！     
鉴于透视变换的性质，该映射仅适用于地平面中的像素。值得庆辛的是，Rover环境相对平坦，所以这个输出图像中的浅色区域是Rover前面的可导航地形布局的合适表示。     
一个提示：不需要非常精确，可以从上面的matplotlib窗口的屏幕截图中估计源点，并在输出图像的底部中心附近选择目标点为10x10像素的正方形。

### Try it yourself!
下面给出的是练习题的原始代码。当直接运行下面这段代码时，可以看到输出图像和原始图像并无任何差异。这是因为我们在选择可以获得变换矩阵的四个源点和四个目标点时，两组点的位置是一致的（事实上若两组点的位置不一致，但是相对位置比例不变，会得出缩放比例的图）。

In [14]:
import matplotlib.pyplot as plt
import matplotlib.image as mpimg
import numpy as np
import cv2

image = mpimg.imread('example_grid1.jpg')

def perspect_transform(img, src, dst):

    # Get transform matrix using cv2.getPerspectivTransform()
    M = cv2.getPerspectiveTransform(src, dst)
    # Warp image using cv2.warpPerspective()
    # keep same size as input image
    warped = cv2.warpPerspective(img, M, (img.shape[1], img.shape[0]))
    # Return the result
    return warped

# TODO:
# Define a box in source (original) and 
# destination (desired) coordinates
# Right now source and destination are just 
# set to equal the four corners
# of the image so no transform is taking place
# Try experimenting with different values!
source = np.float32([[0, 0], 
                 [0, image.shape[0]], 
                 [image.shape[1], image.shape[0]], 
                 [image.shape[1], 0]])
destination = np.float32([[0, 0], 
                 [0, image.shape[0]], 
                 [image.shape[1], image.shape[0]], 
                 [image.shape[1], 0]])

warped = perspect_transform(image, source, destination)
# Draw Source and destination points on images (in blue) before plotting
cv2.polylines(image, np.int32([source]), True, (0, 0, 255), 3)
cv2.polylines(warped, np.int32([destination]), True, (0, 0, 255), 3)
# Display the original image and binary               
f, (ax1, ax2) = plt.subplots(1, 2, figsize=(6, 2), sharey=True)
f.tight_layout()
ax1.imshow(image)
ax1.set_title('Original Image', fontsize=15)

ax2.imshow(warped, cmap='gray')
ax2.set_title('Result', fontsize=15)
plt.subplots_adjust(left=0., right=1, top=0.9, bottom=0.)
#plt.show() # Uncomment if running on your local machine

<IPython.core.display.Javascript object>

下面给出的是solusion的处理：

In [None]:
# Define calibration box in source (actual) and destination (desired) coordinates
# These source and destination points are defined to warp the image
# to a grid where each 10x10 pixel square represents 1 square meter
dst_size = 5 
# Set a bottom offset to account for the fact that the bottom of the image 
# is not the position of the rover but a bit in front of it
bottom_offset = 6
source = np.float32([[14, 140], [301 ,140],[200, 96], [118, 96]])
destination = np.float32([[image.shape[1]/2 - dst_size, image.shape[0] - bottom_offset],
                  [image.shape[1]/2 + dst_size, image.shape[0] - bottom_offset],
                  [image.shape[1]/2 + dst_size, image.shape[0] - 2*dst_size - bottom_offset], 
                  [image.shape[1]/2 - dst_size, image.shape[0] - 2*dst_size - bottom_offset],
                  ])

总结：
1. Geometric Transformations of Images. Opencv提供了两个变换方程，cv.warpAffine 和 cv.warpPerspective，这两个方程能够实施所有种类的变换。前者输入一个2×3的矩阵，是一类2D仿射变换，它执行从2D坐标到其他2D坐标的线性映射，保留了线的“直线性”和“平行性”。可以使用一系列平移 (translation)、缩放 (scale)、翻转 (flip)、旋转 (rotation) 和错切 (shear) 来构造仿射变换。。而后者输入一个3×3的矩阵，相关的百年还矩阵可以通过cv.getPerspectiveTransform获取。    
2. 提供变换矩阵给上述方程，2D图像的变换矩阵可以通过这两个函数获取：cv.getAffineTransform 和 cv.getRotationMatrix2D；而3D图像的变换矩阵可以通过cv.getPerspectiveTransform 获取。前者使用旋转角或两组点集（每组3个点），后者使用两组点集（每组4个点）。上述变换矩阵的用法见：https://docs.opencv.org/trunk/da/d6e/tutorial_py_geometric_transformations.html    
3. 不那么相关的一点：使用pyplot同时画多个图时，有两种代码“套路”：

In [None]:
# 1.
f, (ax1, ax2) = plt.subplots(1, 2, figsize=(6, 2), sharey=True)
ax1.imshow(image)
ax2.imshow(warped, cmap='gray')
plt.show()


# 2.
fig = plt.figure(figsize=(12,3)) 
plt.subplot(131) 
plt.imshow(red_channel) 
plt.subplot(132) 
plt.imshow(green_channel)  
plt.subplot(133) 
plt.imshow(blue_channel)
plt.show()