---

# Conociendo la JETBOT

<img src="images/jetbot.jpeg" width=50%>

1. Jetson Nano, dispositivo de cómputo de bajo consumo con GPU integrada.


2. Camara, que servirá de entrada a la aplicación.


3. PioLed, que muestra información del sistema operativo y la ip del equipo (parte de atrás).


4. Motores independientes para el movimiento de las llantas.


5. Batería de 10000 mAH, 5V y un puerto usb3.0 de 3A, y un usb2.0 de 2A.

<br>


## Encender el Equipo

1. Inserte la microSD con el sistema operativo en la Jetson Nano o asegurese que ya está puesta.


2. Conecte el motor y la Jetson Nano a los puertos usb de la batería.

    <table>
      <tr>
          <td><img src="images/j1.jpeg" width=50%></td>
          <td><img src="images/j2.jpeg"></td>
      </tr>
    </table>
    

2. Espere a que la PioLed encienda e ingrese a la dirección mostrada y el puerto 8888.

    - Por ejemplo, 192.168.1.13:8888
    - La contraseña es *jetbot*
    
    
3. Al encender la jetbot un servicio de notebook es lanzado automáticamente, abra un nuevo *notebook* en la jetbot y siga las instrucciones de movimientos básicos.

<img src="images/j3.png" width=50%>

<br>
<br>

## Movimientos Básicos

La JetBot tiene 5 acciones básicos para el control del equipo:

1. forward, mover hacia adelante.
2. backward, mover hacia atrás.
3. left, girar a la izquierda.
4. right, girar a la derecha.
5. stop, detener el motor.

Para acceder a estos movimientos es necesario importar la clase Robot desde Jetbot

In [None]:
from jetbot import Robot

Creamos una instancia de la clase Robot, para acceder a todos los movimientos básicos.

In [None]:
robot = Robot()

<br>
<br>

## Manejar el robot

# **<font color='red'>ADVERTENCIA #1: </font>** 
LOS SIGUIENTES COMANDOS MUEVEN EL ROBOT, ASEGURESE QUE EL ROBOT TIENE ESPACIO LIBRE.


# **<font color='red'>ADVERTENCIA #2: </font>** 

EL ROBOT ES MUY RÁPIDO, SIEMPRE ASEGURESE DE AJUSTAR LA VELOCIDAD SOLO AL 30%

In [None]:
# El robot gira hacia la izquierda sin detenerse
robot.left(speed=0.3)

In [None]:
# Podemos detener el robot
robot.stop()

Si queremos que el robot se mueva solo por poco tiempo podemos usar la función **sleep** del paquete **time**

In [3]:
import time

In [None]:
robot.right(speed=0.3)
time.sleep(2)
robot.stop()

Combinando los movimientos básicos y la función **sleep**, podemos generar movimientos mas complejos para el movimiento del carro.

In [None]:
def u_turn():
    robot.left(speed=0.3)
    time.sleep(2)
    robot.forward(speed=0.3)
    time.sleep(2)
    robot.stop()
    
u_turn()

## Acceder a la cámara

Podemos acceder a la cámara usando otras Clases que proporciona JETBOT

In [None]:
import traitlets
import ipywidgets.widgets as widgets
from IPython.display import display
from jetbot import Camera, bgr8_to_jpeg

# Creamos una instancia de la cámara, para acceder a esta.
camera = Camera.insance(width=224, height=224)
# Creamos una 'imagen' en notebook para mostrar lo que observa la cámara
image = widgets.Image(format='jpeg', width=224, height=224)
# Enlazamos la información de la cámara con la imagen creada
camera_link = traitlets.dlink((camera, 'value'), (image, 'value'), transform=bgr8_to_jpeg)
# Mostramos la imagen en el notebook
display(widgets.HBox([image]))


### Experimente por un tiempo con los comandos básicos, y apague la JetBot para ahorrar energía.

Pidale ayuda a un instructor si hay algún problema.


---


<br>
<br>



# Deep Learning

<img src="images/dl_context.png" width=70%>

---
<br>
<br>

<img src="images/ml_vs_dl.png">

---
<br>
<br>

![SegmentLocal](images/neural_net.gif "neural network")

Los métodos de Deep Learning apuntan a aprender características jerárquicas, donde las características de alto nivel están formadas por la composición de características de bajo nivel.

<img src="images/cnn_feature_hierarchy.png">


Cada una de las neuronas presentes en una red neuronal funciona de la siguiente manera:

1. Recibe unas entradas $X_i$, que pueden ser los valores de un grupo de pixeles.


2. Cada entrada $X_i$ es multiplicada por un peso $W_i$, estos pesos se aprenden durante el entrenamiento de la red.


3. Todas las multiplicaciones son sumadas $\sum^n_{i=1}X_iW_i$


4. Al resultado de esta suma se le aplica una función de activación, y es pasada como una entrada a la siguiente capa en la red neuronal.

![neuron](images/neuron.png "neuron")


Si ampliamos esta operación a redes neuronales muy profundas y con gran cantidad de neuronas por cada capa, el número de operaciones de multiplicación y suma aumenta exponencialmente, pero podemos destacar unas características clave.


* Las operaciones dentro de la red son muy simples (sumas y multipliaciones)


* Todas las operaciones en cada una de las capas son independientes.

<br>
<br>
<br>

### Las GPU y Deep Learning

![cpu_gpu_1](images/cpu_gpu_1.png)

![cpu_gpu_1](images/cpu_gpu_2.png)

<br>
<br>
<br>


### La cantidad de imágenes y Deep Learning 

Los algoritmos de Deep Learning necesitan una gran cantidad de imágenes, debido a la enorme cantidad de parámetros que tienen.


<img src="images/dl.png" width=70%>
  

<br>
<br>

---

## Razones para la popularidad del Deep Learning

### 1. Aparición de enormes conjuntos de datos etiquetados.

- Clasificación: [IMAGENET](http://image-net.org/)

- Detección y Segmentación: [Microsoft COCO](http://cocodataset.org/#home)

<img src="images/datasets_sample.jpeg">

### 2. Computación masivamente paralela con GPUs.

ILSVRC = Imagenet Large Scale Visual Recognition Competition

<img src="images/imagenet_progress.png">

### 3. Desarrollo de Frameworks de DL.

Para la competencia usaremos el framework Pytorch

<img src="images/dl_frameworks.jpg" width=70%>

### 4. Investigación en arquitecturas de redes neuronales y funciones de activación.

Para la competencia usaremos Alexnet

<img src="images/dl_architectures.png" width=70%>


AlexNet tiene:

- 660.000 neuronas
- 61 Millónes de parámetros
- 600 Millones de conexiones

---

<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>


# Flujo de Trabajo de un proyecto en Deep Learning

<img src="images/dl_workflow.jpeg">

Fuente: [WTF is Machine Learning?](https://towardsdatascience.com/wtf-is-machine-learning-a-quick-guide-39457e49c65b)
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>


## Ejemplo: Evitar Colisiones con la JetBot

Vamos a intentar resolver este problema usando deep learning, la jetson nano y el sensor de la cámara.


### Paso 1: Obtener Datos

El robot está limitado a la información que obtiene desde la camara, desde este punto de vista necesitamos crear una "burbuja de seguridad" al rededor del robot, para evitar que entre en escenarios donde se golpee.

Tenemos entonces dos estados para el robot:

1. **blocked:** El robot tiene algún obstaculo de frente por lo cual debe girar y buscar otro camino.

2. **free:** El robot puede avanzar libremente.

<table>
    <tr>
        <td><img src="images/free.jpeg"></td>
        <td><img src="images/blocked.jpeg"></td>
    </tr>
</table>

**<font color='green'>RECOMENDACIÓN #1: </font>** Tome videos con el celular teniendo en cuenta la perspectiva del robot, para ambos estados. Recuerde las dimensiones del robot y los diferentes obstaculos que puede tener (puertas, sillas, zapatos, otros jetbot).

**<font color='green'>RECOMENDACIÓN #2: </font>** Tome video donde el camino este libre todo el tiempo, tome videos cortos donde el camino esté bloqueado todo el tiempo, trate de no mezclar los dos casos para que sea mas fácil crear el dataset de imágenes.


<br>
<br>



### Paso 2: Limpiar, preparar y manipular los datos.

Una vez terminada la obtención de los videos, es necesario crear el dataset de imágenes en los dos estados que tiene nuestro equipo. Para obtener las imágenes que usaremos para el entrenamiento necesitamos separar los **frames** de los videos y guardarlas en imágenes.

1. **Cree un directorio llamado 'dataset' y en este dos subdirectorios llamados 'blocked' y 'free'.**

Extraiga las imágenes de los videos con el siguiente comando y guardelas en los respectivos directorios, según su criterio.

```bash
ffmpeg -i video.mp4 img_%04d.jpg -hide_banner
```

2. **Entre a la página del [Centro de Supercomputación](http://www.sc3.uis.edu.co/) y en la pestaña 'SERVICIOS' seleccione 'JUPYTERHUB'.**

    - Ingrese con su nombre de usuario/contraseña y reserve un notebook con 1 core por 1 hora.
    
    - Suba la carpeta 'dataset' al cluster de Guane en su /home de estudiante. Consulte con un instructor si tiene dudas.
   

<br>
<br>


### Paso 3: Entrenar el modelo

1. Cree un nuevo notebook en blanco, que usaremos para entrenar el modelo.


2. Copie el código en la siguiente celda al notebook de Guane para entrenar el modelo.


3. Analice los comentarios y los objetos creados para el entrenamiento de la red neuronal.

Usaremos el framework *Pytorch* para entrenar el modelo para nuestras dos clases (blocked, free).

**<font color='green'>RECOMENDACIÓN #3: </font>** Entender este código puede darles una gran ventaja en la competencia.


**<font color='BLUE'>Discusión: </font>** Responda en su grupo las siguientes preguntas, mirando el código o Google.

- Cuantas lineas de código son usadas para crear la red Alexnet?


- Cómo ingresan las imágenes a la red? 


- Cuál es la función de los objetos 'dataset', 'train_dataset' y 'train_loader'?


- Por qué dividimos el dataset en Train y Test? Cuantas imágenes tiene test_dataset? Son suficientes?


- Qué es una EPOCH?

In [None]:
# Importamos el framework y las utilidades necesarias
import torch
import torch.optim as optim
import torch.nn.functional as F
import torchvision
import torchvision.datasets as datasets
import torchvision.models as models
import torchvision.transforms as transforms


# Creamos la instancia 'dataset' para acceder a las imágenes,
# Componemos una secuencia de transformaciones para virtualmente aumentar la cantidad de los datos.
#     - ColorJitter, modifica la luz, contraste e iluminación de la imagen por un porcentaje.
#     - Resize, cambia el tamaño de las imágenes
#     - ToTensor, convierte un grupo de imágenes a un tensor
#     - Normalize, normaliza los colores de la imagen bajo ciertos parámetros

# Existen otras transformaciones que pueden ayudar al entrenamiento de la red y dar la ventaja en la competencia.
# Consultelas en https://pytorch.org/docs/stable/torchvision/transforms.html 

dataset = datasets.ImageFolder(
    'dataset',
    transforms.Compose([
        transforms.ColorJitter(0.1, 0.1, 0.1, 0.1),
        transforms.Resize((224, 224)),
        transforms.ToTensor(),
        transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
    ])
)

# Dividimos el dataset en training y test, es una parte fundamental para comprobar el comportamiento
# de la red sobre datos que no ha visto durante el entrenamiento
train_dataset, test_dataset = torch.utils.data.random_split(dataset, [len(dataset) - 50, 50])


# Creamos dos 'cargadores de datos' los cuales producen grupos aleatorios de imágenes 
# y son cargados en paralelo para ser usados en el entrenamiento de la red.
train_loader = torch.utils.data.DataLoader(
    train_dataset,
    batch_size=16,
    shuffle=True,
    num_workers=4
)

test_loader = torch.utils.data.DataLoader(
    test_dataset,
    batch_size=16,
    shuffle=True,
    num_workers=4
)


# DEFINIR EL MODELO DE RED NEURONAL
# El paquete torchvision proporciona una colección de redes preentrenadas que podemos usar.
# En un proceso llamado 'transferencia de aprendizaje' podemos cambiar el propósito de una red entrenada
# sobre millones de imágenes y reusarlo para una tarea diferente.
model = models.alexnet(pretrained=True)

# La red Alexnet fue entrenada en un dataset con 1000 clases, pero nuestro dataset solo tiene 2 clases.
# Por lo tanto debemos reemplazar la capa final de la red con una nueva capa con solo 2 salidas.
model.classifier[6] = torch.nn.Linear(model.classifier[6].in_features, 2)


# ENTRENAR LA RED NEURONAL
# Usando el código siguiente podemos entrenar la red neuronal por 30 EPOCHS y guardar el mejor modelo
# después de cada EPOCH.
NUM_EPOCHS = 30
BEST_MODEL_PATH = 'best_model_floor.pth'
best_accuracy = 0.0

optimizer = optim.SGD(model.parameters(), lr=0.001, momentum=0.9)

for epoch in range(NUM_EPOCHS):
    
    for images, labels in iter(train_loader):
        optimizer.zero_grad()
        outputs = model(images)
        loss = F.cross_entropy(outputs, labels)
        loss.backward()
        optimizer.step()
    
    test_error_count = 0.0
    for images, labels in iter(test_loader):
        outputs = model(images)
        test_error_count += float(torch.sum(torch.abs(labels - outputs.argmax(1))))
    
    test_accuracy = 1.0 - float(test_error_count) / float(len(test_dataset))
    print('%d: %f' % (epoch, test_accuracy))
    if test_accuracy > best_accuracy:
        torch.save(model.state_dict(), BEST_MODEL_PATH)
        best_accuracy = test_accuracy



### Paso 4: Probar el Modelo

1. Encendemos la JETBOT y accedemos por la IP mostrada, como se indicó en el manejo de comandos básicos.


2. Copiamos el modelo entrenado desde el cluster de Guane a un directorio de trabajo en la JETBOT.


3. Abrimos un notebook en la JETBOT, en el mismo directorio donde se encuentra el modelo.


4. Copiamos el código en la siguiente celda a el notebook en la JETBOT.


5. Antes de ejecutar, analice el código en la celda y responda las siguientes preguntas:



- ¿Cómo se está cargando el modelo entrenado por nosotros?
    
    
- ¿Cómo se enlaza la imagen de la cámara, para que sirva de entrada a la red neuronal?
    
    
- ¿Qué es la salida de la red neuronal, y qué hacemos con este valor?
    
    
- ¿Donde se están dando las ordenes para el movimiento del carro?


### PRIMERA ETAPA

1. Cargamos el modelo entrenado sobre una red Alexnet


2. Pasamos la ejecución del modelo a la GPU que tiene la Jetson Nano


3. Creamos una función para procesar las imágenes, teniendo en cuenta que las imágenes del celular que usamos para entrenar y las que ve la cámara son diferentes.

In [None]:
# Importamos todos los paquetes necesarios
import cv2
import numpy as np
import torch
import torchvision
import torch.nn.functional as F
import time

import traitlets
from IPython.display import display
import ipywidgets.widgets as widgets
from jetbot import Robot, Camera, bgr8_to_jpeg

# Creamos el model de la red neuronal Alexnet, sin valores preentrenados
model = torchvision.models.alexnet(pretrained=False)
model.classifier[6] = torch.nn.Linear(model.classifier[6].in_features, 2)

# Cargamos el modelo que entrenamos con nuestro dataset
model.load_state_dict(torch.load('best_model.pth'))

# Pasamos el modelo a ejecución por GPU
device = torch.device('cuda')
model = model.to(device)

# Es necesario transformar las imágenes tomadas por la cámara al formato de imágenes
# usadas para entrenar la red neuronal.
# Para esto creamos una función de preprocesamiento.
mean = 255.0 * np.array([0.485, 0.456, 0.406])
stdev = 255.0 * np.array([0.229, 0.224, 0.225])

normalize = torchvision.transforms.Normalize(mean, stdev)

def preprocess(camera_value):
    global device, normalize
    x = camera_value
    x = cv2.cvtColor(x, cv2.COLOR_BGR2RGB)
    x = x.transpose((2, 0, 1))
    x = torch.from_numpy(x).float()
    x = normalize(x)
    x = x.to(device)
    x = x[None, ...]
    return x


### SEGUNDA ETAPA

1. Accedemos a la cámara y la mostramos en pantalla, ejecute la celda de acceso a la cámara solo una vez para evitar errores.

In [None]:

# Creamos un widget para acceder a la cámara
camera = Camera.instance(width=224, height=224)
image = widgets.Image(format='jpeg', width=224, height=224)
camera_link = traitlets.dlink((camera, 'value'), (image, 'value'), transform=bgr8_to_jpeg)
display(widgets.HBox([image]))


2. Definimos la función `update` donde se obtiene la salida de la red neuronal, y con esta información decidimos los movimientos del vehículo.

3. Enlazamos la función `update` con la cámara para que se actualice cuando existan cambios en la imagen.

In [None]:
# Creamos una instancia Robot y conectamos:
#    - la imagen de la camara
#    - la red neuronal
#    - los movimientos del robot

robot = Robot()


def update(change):
    global robot
    # Imagen de la cámara, es pasada a la red neuronal
    x = change['new'] 
    x = preprocess(x)
    y = model(x)
    
    # Aplicamos la función 'softmax' para normalizar el vector de salida de la red neuronal
    # Todos los valores suman a 1, convirtiendo esta salida en una distribución de probabilidad
    y = F.softmax(y, dim=1)
    
    # Obtenemos la probabilidad que el robot esté bloqueado del primer elemento del vector
    prob_blocked = float(y.flatten()[0])
    
    # Si la red considera que hay una probabilidad menor al 50% de estar bloqueado, avanzamos
    if prob_blocked < 0.5:
        robot.forward(0.3)
    else:
    # Si está bloqueado, el robot gira a la izquierda
        robot.left(0.3)
    
    # Esperamos 1 milisegundo antes de la siguiente decisión
    time.sleep(0.1)
      


## **<font color='red'>ADVERTENCIA #3: </font>** LOS SIGUIENTES COMANDOS MUEVEN EL ROBOT, ASEGURESE QUE EL ROBOT TIENE ESPACIO LIBRE.

In [None]:
# Llamamos la función una vez para inicializar
update({'new': camera.value})

# Enlazamos la función 'update' a el valor de la camara
camera.observe(update, names='value')

**Si quiere cambiar el comportamiento del robot, desvincule la función 'update', detenga el vehiculo y haga los cambios.**

In [None]:
camera.unobserve(update, names='value')
robot.stop()

**Para detener el robot en cualquier momento, ejecute las siguientes celdas.**

In [None]:
robot.stop()

<br>
<br>
<br>


### Paso 5: Mejorar

El mejoramiento continuo es una característica fundamental en un proyecto de inteligencia artificial, para este proyecto se sugieren dos aspectos para mejorar el comportamiento del vehículo autónomo.

1. **DATOS:** Analice el comportamiento del vehículo y los fallos que presenta, adquiera más imágenes que permitan al robot evitar estos errores. Añada las imágenes al dataset y entrene un nuevo modelo.


2. **MOVIMIENTOS:** Según el nivel de bloqueo que reporta la red neuronal (de 0 a 1) otra variedad y combinación de movimientos puede mejorar el comportamiento del vehículo sobre la pista.


