# 避障演示

在这个示例中，我们将使用之前训练的模型让机器人判断前方是“有障碍”还是“无障碍”，然后再让机器人做出相应的动作。

## 1.首先加载所需模块

In [None]:
import torch
import torchvision
import traitlets
from IPython.display import display
import ipywidgets.widgets as widgets
from nxbot import Robot,event,bgr8_to_jpeg
import torch.nn.functional as F

## 2.加载神经网络

在训练模型的demo中我们也加载过“alexnet”神经网络，但是在这里“pretrained=False”表示只加载网络结构，不加载预训练模型。
同样的，还是需要把网络的类别数量改为2个。

In [None]:
model = torchvision.models.alexnet(pretrained=False)
model.classifier[6] = torch.nn.Linear(model.classifier[6].in_features, 2)

接下来，加载之前训练得到的“best_model.pth”模型。
把模型数据传输到GPU设备上，加快运行速度。
* 如果使用你自己训练的模型可以选择第二个模型地址"model_path"。

In [None]:
model_path = r'../../../models/local/alexnet/collision_avoid.pth'
# model_path = r'students_models/best_model_custom.pth'
model.load_state_dict(torch.load(model_path))
device = torch.device('cuda')
model = model.to(device)

## 3.创建预处理函数

我们现在已经加载了我们的模型，但是有一个小问题。我们训练时模型接收的图片格式与机器人拍摄的图片的格式不匹配。为此，我们对机器人拍摄的图片做一些预处理，使得在训练和检测时输入神经网络的图片格式是一致的。包括以下步骤：
1. 把机器人拍摄的图片像素缩放为224×224
2. 从BGR转换为RGB（蓝绿红转为红绿蓝）
3. 从HWC（高/宽/通道）布局转换为CHW（宽/高/通道）布局
4. 将数据从CPU内存传输到GPU内存
5. 把图像进行标准化处理。

In [None]:
import cv2
import numpy as np

mean = 255.0 * np.array([0.485, 0.456, 0.406])
stdev = 255.0 * np.array([0.229, 0.224, 0.225])

normalize = torchvision.transforms.Normalize(mean, stdev)

def preprocess(camera_value):
    global device, normalize
    x = camera_value
    x = cv2.resize(x,(224,224),interpolation=cv2.INTER_CUBIC)
    x = cv2.cvtColor(x, cv2.COLOR_BGR2RGB)
    x = x.transpose((2, 0, 1))
    x = np.ascontiguousarray(x, dtype=np.float32)
    x = normalize(torch.from_numpy(x)).unsqueeze(0)
    return x

## 4.检测模型是否能正常使用

我们通过numpy创建与我们将要预测的图片格式一致的形状为（224，224，3）的数组，这里我们创建的全为1的数组将这个数组经过预处理再将数据放入模型中，如果能运行通过说明模型可以正常使用了。

In [None]:
try:
    img_data = np.ones([224, 224, 3],np.uint8)
    model(preprocess(img_data).to(device))
except:
    print('请检查模型是否正确')

## 5.创建可视化界面
1. 通过“widgets.Image()”创建图像窗口显示机器人摄像头画面；
2. 再创建一个有障碍的滑块，显示有障碍的概率。

In [None]:
image_widget = widgets.Image(format='jpeg', width=224, height=224)
blocked_slider = widgets.FloatSlider(description='blocked', min=0.0, max=1.0, orientation='vertical')

## 6.图像识别

1. 把图像数据进行预处理；
2. 把处理后的数据输入网络得到预测结果；
3. 通过预测得到的结果来控制小车移动，如果无障碍就继续向前行驶，如果有障碍就向左转。

In [None]:
def on_new_image(evt):
    # 把机器人摄像头画面的数据传给图像窗口。
    image_widget.value=bgr8_to_jpeg(evt.dict['data'])
    
    x = evt.dict['data']
    x = preprocess(x).to(device)
    y = model(x)
    # 我们运用“softmax”函数对输出的结果进行处理，使其输出的值为一个概率值(0-1)。
    y = F.softmax(y, dim=1)
    # 这里的y.flatten()[0]表示有障碍的概率，如果是y.flatten()[1]就表示无障碍的概率
    prob_blocked = float(y.flatten()[0])
    
    # 将图像数据传给显示界面。
    blocked_slider.value = prob_blocked
    
    # 如果有障碍的概率小于0.7，就前进
    if prob_blocked < 0.7:
        rbt.base.forward(0.1)
    # 否则就左转
    else:
        rbt.base.turnleft(0.3)

## 7.启动机器人，进行避障演示
1. 通过“rbt.connect()” 连接小车
2. 通过“rbt.set_ptz(-15)”调整摄像头向下15°，获取最佳的障碍识别视角。
3. 通过“rbt.camera.start()”打开摄像头。
4. 通过“rbt.event_manager.add_event_listener(event.EventTypes.NEW_CAMERA_IMAGE,on_new_image)”获取机器人图像数据，并将图像数据传给“图像识别”函数，进行预测；
5. 通过“display(widgets.HBox([image_widget, blocked_slider]))”将图像显示出来，并且通过滑块展示当前预测障碍的概率值。

In [None]:
rbt = Robot()
rbt.connect()        
rbt.base.set_ptz(-15)
rbt.camera.start()
rbt.event_manager.add_event_listener(event.EventTypes.NEW_CAMERA_IMAGE,on_new_image)
display(widgets.HBox([image_widget, blocked_slider]))

## 8.结论
如果机器人没有很好地避开障碍，我们可以通过收集更多的场景数据来使机器人做得更好:)

提示：如果想运行其他示例，需要先将机器人断开连接。

In [None]:
# rbt.disconnect()