# Машинне навчання для промислової робототехніки
## Навчання та впровадження моделей комп'ютерного зору для автоматизації

---

![Промислове компютерне бачення](assets/Vision%20Tech.jpg)

*Фото: Промисловий робот з комп'ютерним зором*

## План Заняття

Сьогодні ми розглянемо повний робочий процес впровадження машинного зору в промисловій робототехніці:

1. **Вступ до МН в промисловій робототехніці**
   - Переваги та ключові застосування
   - Як МН трансформує традиційні підходи

2. **Збір даних та маркування з Roboflow**
   - Налаштування проектів
   - Створення якісних навчальних наборів даних

3. **Завантаження та підготовка наборів даних**
   - Структура набору даних для навчання
   - Налаштування конфігураційного файлу

4. **Локальне навчання моделі комп'ютерного зору**
   - Використання YOLOv8 для виявлення об'єктів
   - Оптимізація для різного апаратного забезпечення

5. **Розгортання для виведення з USB-камерою**
   - Виявлення об'єктів у реальному часі
   - Аспекти продуктивності

6. **Демонстрація та питання-відповіді**
   - Жива демонстрація
   - Відкрита дискусія

## Вступ до МН в промисловій робототехніці

Машинне навчання революціонізувало промислову робототехніку, дозволяючи системам "бачити" та інтелектуально взаємодіяти з навколишнім середовищем. Розглянемо ключові аспекти:

- **Переваги МН в робототехніці**
- **Ключові застосування** 
- **Традиційні підходи у порівнянні з підходами на основі МН**

### Переваги МН в робототехніці

- **Підвищення ефективності**: Скорочення циклу виробництва та збільшення продуктивності
  
- **Покращена точність**: Підвищення точності виявлення та маніпулювання об'єктами
  
- **Більша гнучкість**: Адаптація до нових продуктів без перепрограмування
  
- **Зниження витрат**: Зменшення витрат на робочу силу та відходів через помилки
  
- **Покращення безпеки**: Краще виявлення людей у робочому просторі

#### Ключові застосування

1. **Ідентифікація об'єктів**:
   - Розпізнавання різноманітних деталей на виробничій лінії
   - Визначення положення об'єктів у 3D-просторі
   - Класифікація типів продукції

2. **Відстеження об'єктів**:
   - Моніторинг руху деталей на виробничій лінії
   - Одночасне відстеження декількох об'єктів
   - Забезпечення координації між різними роботами

3. **Захоплення та розміщення**:
   - Визначення оптимальних точок захоплення
   - Робота з об'єктами різних форм і розмірів
   - Адаптація до змінних умов середовища

#### Традиційні підходи vs МН-підходи

<div style="font-size: 120%;">
<table>
<thead>
<tr>
<th><strong>Аспект</strong></th>
<th><strong>Традиційний підхід</strong></th>
<th><strong>Підхід на основі МН</strong></th>
</tr>
</thead>
<tbody>
<tr>
<td><strong>Програмування</strong></td>
<td>Жорстко запрограмовані правила</td>
<td>Навчання на прикладах</td>
</tr>
<tr>
<td><strong>Адаптивність</strong></td>
<td>Обмежена, потребує перепрограмування</td>
<td>Висока, адаптується до змін</td>
</tr>
<tr>
<td><strong>Точність</strong></td>
<td>Добра в структурованому середовищі</td>
<td>Висока навіть у складних умовах</td>
</tr>
<tr>
<td><strong>Розробка</strong></td>
<td>Тривала і трудомістка</td>
<td>Швидша з існуючими моделями</td>
</tr>
<tr>
<td><strong>Обробка винятків</strong></td>
<td>Потребує окремих правил для кожного випадку</td>
<td>Узагальнює на основі досвіду</td>
</tr>
</tbody>
</table>
</div>

# Збір даних та маркування з Roboflow

Перший крок у створенні моделі машинного зору — це збір та маркування навчальних даних. 

Roboflow — це платформа, яка спрощує цей процес, особливо для початківців.

![Roboflow інтерфейс маркування](assets/annotations.png)

# Демонстрація Roboflow

## Створення якісних навчальних наборів даних

### Збір зображень:

- **Методи збору**:
  - Знімки з камери робота в реальному середовищі
  - Запис відео та вилучення кадрів
  - Використання існуючих наборів даних з доповненнями

- **Рекомендації для якісних даних**:
  - Включіть зображення з різних кутів та відстаней
  - Зафіксуйте варіації освітлення
  - Включіть різні фони та можливі перешкоди
  - Мінімум 50 зображень на клас для простого доказу концепції

### Підготовка даних:

1. **Маркування зображень**:
   - Окреслення обмежувальних рамок навколо об'єктів
   - Присвоєння класу (мітки) кожній рамці
   - Перегляд та коригування міток за потреби

2. **Обробка даних**:
   - **Розділення набору даних**: Автоматичний поділ на тренувальну, валідаційну та тестову вибірки
   - **Аугментація**: Створення додаткових тренувальних зразків через обертання, віддзеркалення, регулювання яскравості тощо
   - **Попередня обробка**: Зміна розміру зображень, коригування кольорів тощо

# Завантаження та підготовка наборів даних

Після маркування даних у Roboflow, необхідно завантажити їх для локального навчання моделі. Розглянемо як це зробити та підготувати дані для тренування.


## Структура набору даних для навчання

1. **Структура каталогів YOLO**:
   - `/data/назва_проекту/` - основний каталог
   - `/train/` - зображення та мітки для навчання
   - `/valid/` - зображення та мітки для валідації
   - `/test/` - зображення та мітки для тестування

2. **Формат міток**:
   - Текстові файли `.txt` для кожного зображення
   - Кожен рядок містить: `клас x_центр y_центр ширина висота`
   - Координати нормалізовані від 0 до 1

3. **Організація даних**:
   - Зображення: JPG або PNG формати
   - Однакове розміщення файлів зображень та міток
   - Належне розділення між навчальним, валідаційним та тестовим наборами

## Налаштування конфігураційного файлу

1. **Файл data.yaml**:
   ```yaml
   path: ../data/назва_проекту  # Шлях до набору даних
   train: train/images          # Зображення для тренування
   val: valid/images            # Зображення для валідації
   test: test/images            # Зображення для тестування
   
   nc: 2                        # Кількість класів
   names: ['об'єкт1', 'об'єкт2'] # Назви класів

## Завантаження через Roboflow API

Після маркування даних у Roboflow, необхідно завантажити їх для локального навчання моделі. Розглянемо як це зробити та підготувати дані для тренування.

In [None]:
# Встановимо або перевіримо наявність бібліотек, які потрібні для роботи
%pip install -r requirements.txt

In [None]:
# Імпортуємо необхідні бібліотеки
from roboflow import Roboflow
import torch

# Перевірка доступності CUDA (не застосовується для Apple Silicon, але корисно включити для портативності)
print(f"Версія PyTorch: {torch.__version__}")
if torch.cuda.is_available():
    device = torch.device("cuda")
    print("Використовується CUDA")
# Перевірка доступності MPS (Metal Performance Shaders) для Apple Silicon
elif hasattr(torch.backends, 'mps') and hasattr(torch.backends.mps, 'is_available'):
    device = torch.device("mps")
    print("Використовується MPS (Metal Performance Shaders)")
else:
    device = torch.device("cpu")
    print("MPS не доступний у цій версії PyTorch, використовується CPU")

### Завантаження даних з Roboflow

Щоб завантажити дані з Roboflow, вам знадобиться API-ключ та інформація про проект:

In [None]:
# Завантаження даних з Roboflow
# Зверніть увагу, що для використання Roboflow API вам потрібно зареєструватися на їхньому сайті та отримати API ключ
# Зазначте, що ви повинні мати файл .env з вашим API ключем
# або ви можете вказати його безпосередньо в коді (не рекомендується з міркувань безпеки)

# Також, необхідно вказати назву вашого проекту та версію набору даних
import os
from dotenv import load_dotenv

# Завантаження змінних середовища з файлу .env
# Переконайтеся, що у вас є файл .env з вашим API ключем
load_dotenv()

# Отримання API ключа з змінних середовища
api_key = os.getenv('ROBOFLOW_API_KEY')

# Визначення версії набору даних
dataset_version = 3  # Змініть на вашу фактичну версію набору даних

rf = Roboflow(api_key=api_key)
project = rf.workspace().project("orange-ball-detection")
version = project.version(dataset_version)  # Змініть 1 на ваш фактичний номер версії

# Завантаження набору даних у форматі YOLO (сумісний з YOLOv8)
dataset = version.download(model_format="yolov8", location=f"data/robotics_dataset_v{dataset_version}", overwrite=False)

print("Завантаження завершено.")
print("Набір даних успішно завантажено до:", dataset.location)



## Локальне навчання моделі комп'ютерного зору

Тепер, коли ми підготували наші дані, настав час навчити модель комп'ютерного зору. Ми будемо використовувати базову модель YOLOv8n (YOLOv8 Nano) для виявлення об'єктів. Це легка модель, яка підходить для навчання на комп'ютерах з обмеженими ресурсами, таких як MacBook з M1.

### Варіанти навчання

1. **Локальне навчання на Mac M1**:
   - Підходить для невеликих наборів даних та швидких демонстрацій
   - Використовує Metal Performance Shaders (MPS) для прискорення
   - Обмежено доступною пам'яттю та обчислювальною потужністю
2. **Навчання на (віддаленому) високопродуктивному GPU (рекомендується)**:
   - Значно швидше навчання з GPU, такими як NVIDIA 3090Ti
   - Може обробляти більші моделі (середні, великі) та більше даних
   - Створіть таку ж структуру каталогів на віддаленій машині
   - Скопіюйте свій набір даних на віддалену машину
   - Запустіть код навчання там і завантажте файл ваги після завершення

In [None]:
# Імпортуємо необхідні бібліотеки
from ultralytics import YOLO

# Налаштування шляху до файлу data.yaml
# Зазначте, що YOLOv8 автоматично генерує data.yaml файл під час завантаження набору даних
data_yaml = f"{dataset.location}/data.yaml"

# Для локального навчання на Mac M1 (для демонстраційних цілей)
# Ініціалізуємо попередньо навчену модель YOLOv8n (маленький розмір для швидшого навчання)
model = YOLO('yolov8n.pt')

# Тренування моделі
# Зверніть увагу, що для реального навчання вам слід використовувати більше епох
# та налаштувати параметри навчання відповідно до ваших потреб
# Для демонстраційних цілей ми зменшили кількість епох до 10
results = model.train(
    data=data_yaml,     # Шлях до файлу data.yaml
    epochs=50,          # Кількість епох
    patience=5,         # Кількість епох без покращення для ранньої зупинки
    imgsz=640,          # Розмір зображення (640px)
    save_period=1,      # Зберігати модель кожну епоху
    device=device,      # Пристрій для навчання (визначили вище)
    batch=8,            # Розмір пакету (налаштуйте на основі RAM)
    workers=2,          # Кількість потоків для завантаження даних
    cache='disk',       # Кешувати зображення для швидшого навчання
    project="models",   # Назва проекту для збереження результатів
    name=f"robotics_model_v{dataset_version}",  # Назва моделі 
    amp=True            # Увімкнути змішану точність для швидкості та економії пам'яті
)

print(f"Навчання завершено! Модель збережено в ./models/robotics_model_v{dataset_version}/weights/best.pt")

New https://pypi.org/project/ultralytics/8.3.141 available 😃 Update with 'pip install -U ultralytics'
[34m[1mengine/trainer: [0magnostic_nms=False, amp=True, augment=False, auto_augment=randaugment, batch=8, bgr=0.0, box=7.5, cache=disk, cfg=None, classes=None, close_mosaic=10, cls=0.5, conf=None, copy_paste=0.0, copy_paste_mode=flip, cos_lr=False, cutmix=0.0, data=/home/levko/repos/kai-lecture/data/robotics_dataset_v3/data.yaml, degrees=0.0, deterministic=True, device=None, dfl=1.5, dnn=False, dropout=0.0, dynamic=False, embed=None, epochs=50, erasing=0.4, exist_ok=False, fliplr=0.5, flipud=0.0, format=torchscript, fraction=1.0, freeze=None, half=False, hsv_h=0.015, hsv_s=0.7, hsv_v=0.4, imgsz=640, int8=False, iou=0.7, keras=False, kobj=1.0, line_width=None, lr0=0.01, lrf=0.01, mask_ratio=4, max_det=300, mixup=0.0, mode=train, model=yolov8n.pt, momentum=0.937, mosaic=1.0, multi_scale=False, name=robotics_mode_v33, nbs=64, nms=False, opset=None, optimize=False, optimizer=auto, overl

[34m[1mtrain: [0mScanning /home/levko/repos/kai-lecture/data/robotics_dataset_v3/train/labels.cache... 1043 images, 161 backgrounds, 0 corrupt: 100%|██████████| 1043/1043 [00:00<?, ?it/s]
[34m[1mtrain: [0mCaching images (6.0GB Disk): 100%|██████████| 1043/1043 [00:00<00:00, 77680.57it/s]


[34m[1mval: [0mFast image access ✅ (ping: 0.0±0.0 ms, read: 3322.0±1971.7 MB/s, size: 228.4 KB)


[34m[1mval: [0mScanning /home/levko/repos/kai-lecture/data/robotics_dataset_v3/valid/labels.cache... 346 images, 46 backgrounds, 0 corrupt: 100%|██████████| 346/346 [00:00<?, ?it/s]
[34m[1mval: [0mCaching images (2.0GB Disk): 100%|██████████| 346/346 [00:00<00:00, 55284.92it/s]


Plotting labels to models/robotics_mode_v33/labels.jpg... 
[34m[1moptimizer:[0m 'optimizer=auto' found, ignoring 'lr0=0.01' and 'momentum=0.937' and determining best 'optimizer', 'lr0' and 'momentum' automatically... 
[34m[1moptimizer:[0m AdamW(lr=0.002, momentum=0.9) with parameter groups 57 weight(decay=0.0), 64 weight(decay=0.0005), 63 bias(decay=0.0)
Image sizes 640 train, 640 val
Using 2 dataloader workers
Logging results to [1mmodels/robotics_mode_v33[0m
Starting training for 50 epochs...

      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


       1/50      1.15G     0.5401      1.031     0.8389         13        640: 100%|██████████| 131/131 [00:06<00:00, 18.93it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:01<00:00, 21.73it/s]

                   all        346       1584      0.954      0.924      0.922      0.847






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


       2/50       1.2G     0.4688     0.5215     0.8199         37        640: 100%|██████████| 131/131 [00:06<00:00, 20.32it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:01<00:00, 21.65it/s]

                   all        346       1584      0.985      0.934      0.951      0.872






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


       3/50       1.2G     0.4783     0.4823     0.8261         25        640: 100%|██████████| 131/131 [00:06<00:00, 20.70it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:00<00:00, 22.23it/s]


                   all        346       1584      0.986      0.939      0.953      0.831

      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


       4/50       1.2G     0.4805     0.4533     0.8194         28        640: 100%|██████████| 131/131 [00:06<00:00, 20.74it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:00<00:00, 22.72it/s]


                   all        346       1584      0.987      0.939      0.954      0.902

      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


       5/50      1.21G     0.4518     0.4077     0.8201         20        640: 100%|██████████| 131/131 [00:06<00:00, 21.04it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:00<00:00, 23.98it/s]

                   all        346       1584      0.995      0.937      0.954      0.884






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


       6/50      1.21G     0.4205     0.3898     0.8127         20        640: 100%|██████████| 131/131 [00:06<00:00, 20.83it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:00<00:00, 23.32it/s]

                   all        346       1584      0.994      0.931      0.954      0.896






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


       7/50      1.21G     0.4074     0.3466     0.8112         18        640: 100%|██████████| 131/131 [00:06<00:00, 21.17it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:00<00:00, 24.07it/s]

                   all        346       1584      0.989       0.94      0.956      0.911






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


       8/50      1.21G     0.3701     0.3181     0.8044         17        640: 100%|██████████| 131/131 [00:06<00:00, 20.91it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:00<00:00, 24.20it/s]

                   all        346       1584      0.981      0.942      0.958      0.929






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


       9/50      1.21G     0.3818      0.311     0.8039         23        640: 100%|██████████| 131/131 [00:06<00:00, 21.04it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:01<00:00, 21.15it/s]

                   all        346       1584      0.989      0.942      0.966      0.934






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      10/50      1.21G     0.3596     0.2959      0.802         28        640: 100%|██████████| 131/131 [00:06<00:00, 20.59it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:00<00:00, 23.48it/s]

                   all        346       1584      0.984      0.944       0.96      0.926






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      11/50      1.21G     0.3713     0.2953     0.8058         50        640: 100%|██████████| 131/131 [00:06<00:00, 21.00it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:00<00:00, 23.47it/s]

                   all        346       1584      0.984      0.946      0.958       0.92






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      12/50      1.21G     0.3569     0.2879     0.8024         14        640: 100%|██████████| 131/131 [00:06<00:00, 19.95it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:00<00:00, 24.43it/s]

                   all        346       1584       0.99      0.938      0.968      0.937






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      13/50      1.21G     0.3443     0.2743     0.8009         21        640: 100%|██████████| 131/131 [00:06<00:00, 21.08it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:00<00:00, 24.40it/s]

                   all        346       1584      0.988      0.942      0.961      0.933






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      14/50      1.21G     0.3473     0.2695     0.8041         21        640: 100%|██████████| 131/131 [00:06<00:00, 20.79it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:00<00:00, 23.12it/s]

                   all        346       1584      0.985      0.947      0.962      0.931






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      15/50      1.21G      0.344     0.2633     0.7992         26        640: 100%|██████████| 131/131 [00:06<00:00, 20.36it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:00<00:00, 23.96it/s]

                   all        346       1584       0.99      0.942      0.966      0.936






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      16/50      1.21G     0.3298     0.2558     0.7982         18        640: 100%|██████████| 131/131 [00:06<00:00, 20.09it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:00<00:00, 23.90it/s]

                   all        346       1584      0.983      0.947      0.968      0.936






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      17/50      1.25G     0.3233     0.2488     0.7989         25        640: 100%|██████████| 131/131 [00:06<00:00, 21.10it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:00<00:00, 24.25it/s]

                   all        346       1584      0.994      0.942      0.971      0.944






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      18/50      1.25G     0.3142     0.2458     0.7979         17        640: 100%|██████████| 131/131 [00:06<00:00, 20.17it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:00<00:00, 22.26it/s]

                   all        346       1584      0.989      0.939      0.965      0.927






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      19/50      1.25G      0.328     0.2499     0.8018         46        640: 100%|██████████| 131/131 [00:06<00:00, 20.95it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:00<00:00, 22.67it/s]

                   all        346       1584      0.989      0.945      0.966      0.935






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      20/50      1.25G     0.3383     0.2534     0.8022         44        640: 100%|██████████| 131/131 [00:06<00:00, 20.64it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:00<00:00, 23.83it/s]

                   all        346       1584      0.993      0.944      0.969      0.937






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      21/50      1.25G      0.317     0.2415     0.7968         32        640: 100%|██████████| 131/131 [00:06<00:00, 20.48it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:00<00:00, 23.21it/s]

                   all        346       1584      0.993      0.944      0.967      0.934






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      22/50      1.25G     0.3062      0.231     0.7955         11        640: 100%|██████████| 131/131 [00:06<00:00, 20.24it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:00<00:00, 22.86it/s]

                   all        346       1584      0.987      0.946      0.975      0.952






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      23/50      1.25G     0.3051     0.2279     0.7993         14        640: 100%|██████████| 131/131 [00:06<00:00, 20.71it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:00<00:00, 24.57it/s]

                   all        346       1584      0.996      0.943       0.97      0.942






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      24/50      1.25G     0.3107     0.2307     0.7951         33        640: 100%|██████████| 131/131 [00:06<00:00, 20.73it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:00<00:00, 23.42it/s]

                   all        346       1584       0.99      0.944      0.957      0.927






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      25/50      1.25G     0.3115     0.2303      0.801         26        640: 100%|██████████| 131/131 [00:06<00:00, 20.99it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:00<00:00, 25.17it/s]

                   all        346       1584      0.987      0.949      0.975      0.952






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      26/50      1.25G        0.3     0.2249     0.7953         42        640: 100%|██████████| 131/131 [00:06<00:00, 20.70it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:00<00:00, 23.14it/s]

                   all        346       1584      0.987      0.949      0.966      0.938






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      27/50      1.25G      0.292     0.2184     0.7937         17        640: 100%|██████████| 131/131 [00:06<00:00, 21.20it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:00<00:00, 24.07it/s]

                   all        346       1584      0.989      0.947      0.977      0.955






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      28/50      1.31G     0.2918     0.2175     0.7961          7        640: 100%|██████████| 131/131 [00:06<00:00, 20.94it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:00<00:00, 23.76it/s]

                   all        346       1584      0.981      0.955      0.974       0.95






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      29/50      1.31G     0.2906      0.214     0.7919         35        640: 100%|██████████| 131/131 [00:06<00:00, 21.11it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:00<00:00, 25.39it/s]

                   all        346       1584       0.99      0.947      0.977      0.953






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      30/50      1.31G     0.2898      0.214     0.7937         23        640: 100%|██████████| 131/131 [00:06<00:00, 21.20it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:00<00:00, 23.59it/s]

                   all        346       1584      0.991      0.946      0.975      0.954






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      31/50      1.31G     0.2838     0.2059     0.7938         30        640: 100%|██████████| 131/131 [00:06<00:00, 20.21it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:00<00:00, 22.89it/s]

                   all        346       1584      0.987      0.949      0.972      0.949






      Epoch    GPU_mem   box_loss   cls_loss   dfl_loss  Instances       Size


      32/50      1.31G     0.2831     0.2051     0.7907         16        640: 100%|██████████| 131/131 [00:06<00:00, 20.52it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:00<00:00, 25.86it/s]

                   all        346       1584      0.984      0.952      0.976      0.955
[34m[1mEarlyStopping: [0mTraining stopped early as no improvement observed in last 5 epochs. Best results observed at epoch 27, best model saved as best.pt.
To update EarlyStopping(patience=5) pass a new patience value, i.e. `patience=300` or use `patience=0` to disable EarlyStopping.






32 epochs completed in 0.066 hours.
Optimizer stripped from models/robotics_mode_v33/weights/last.pt, 6.2MB
Optimizer stripped from models/robotics_mode_v33/weights/best.pt, 6.2MB

Validating models/robotics_mode_v33/weights/best.pt...
Ultralytics 8.3.140 🚀 Python-3.8.10 torch-2.4.1+cu121 CUDA:0 (NVIDIA GeForce RTX 3090 Ti, 24090MiB)
Model summary (fused): 72 layers, 3,005,843 parameters, 0 gradients, 8.1 GFLOPs


                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 22/22 [00:02<00:00,  8.53it/s]


                   all        346       1584      0.989      0.947      0.977      0.955
Speed: 0.1ms preprocess, 0.5ms inference, 0.0ms loss, 1.0ms postprocess per image
Results saved to [1mmodels/robotics_mode_v33[0m
Навчання завершено! Модель збережено в ./models/robotics_model_v3/weights/best.pt


### Поради та оптимізація навчання

#### Для Apple Silicon

1. **Використовуйте прискорення MPS**: PyTorch 2.0+ підтримує Metal Performance Shaders (MPS) для Mac M1/M2.

2. **Оптимізація розміру пакету**: Почніть з розміру пакету 16 та коригуйте відповідно до доступної пам'яті.

3. **Вибір розміру моделі**: Використовуйте менші моделі, такі як YOLOv8n або YOLOv8s, для швидшого локального навчання.

4. **Кешування даних**: Використовуйте параметр `cache=True` для прискорення навчання.

#### Для NVIDIA 3090Ti або інших GPU

1. **Більший розмір пакету**: Використовуйте розміри пакетів 32 або 64, щоб повністю використовувати пам'ять GPU.

2. **Кілька робочих потоків**: Збільште значення `workers` до 8 або 16 для швидшого завантаження даних.

3. **Більші моделі**: Використовуйте переваги потужного GPU, застосовуючи моделі YOLOv8m або YOLOv8l.

4. **Змішана точність**: Додайте `amp=True` для використання навчання зі змішаною точністю для кращої продуктивності.

5. **Більше епох**: Навчайте модель протягом 50-100 епох для кращої конвергенції.

#### Загальні поради

1. **Трансферне навчання**: Ми використовуємо попередньо навчені моделі та дооптимізуємо їх, що значно пришвидшує навчання.

2. **Аугментація зображень**: Використовуйте можливості аугментації Roboflow для збільшення різноманітності набору даних.

## Deploying the Model for Inference with a USB Camera
## Запуск моделі з USB-камерою

З натренованою моделлю ми можемо використовувати її для виявлення об'єктів у реальному часі за допомогою USB-камери.

In [None]:
# Імпортуємо необхідні бібліотеки
# Примітка: цей код призначений для запуску в окремому Python скрипті, а не в Jupyter
import cv2
import time
from ultralytics import YOLO
import argparse

# Зберемо шлях до моделі
model_path = f"./models/robotics_model_v{dataset_version}/weights/best.pt"

# Функція для запуску об'єктного виявлення на USB-камері
def main():
    parser = argparse.ArgumentParser(description='Запуск об\'єктного виявлення на USB-камері')
    parser.add_argument('--model', type=str, default='yolov8n.pt', 
                        help='Шлях до моделі YOLOv8')
    parser.add_argument('--conf', type=float, default=0.25, 
                        help='Поріг впевненості для виявлення об\'єктів')
    parser.add_argument('--camera', type=int, default=0, 
                        help='Індекс камери (зазвичай 0 для вбудованої, 1 для USB)')
    args = parser.parse_args()

    # Завантаження моделі
    try:
        model = YOLO(args.model)
        print(f"Завантажено модель з {args.model}")
    except Exception as e:
        print(f"Помилка при завантаженні моделі: {e}")
        return

    # Відкриття камери
    cap = cv2.VideoCapture(args.camera)
    if not cap.isOpened():
        print(f"Помилка: Не вдалося відкрити камеру з індексом {args.camera}")
        print("Спробуйте інший індекс камери, використовуючи аргумент --camera")
        return

    # Налаштування параметрів камери
    cap.set(cv2.CAP_PROP_FRAME_WIDTH, 640)
    cap.set(cv2.CAP_PROP_FRAME_HEIGHT, 480)

    print("Камера успішно відкрита. Натисніть 'q', щоб вийти.")

    # Змінні для обчислення FPS
    fps = 0
    frame_count = 0
    start_time = time.time()
    
    while True:
        # Зчитування кадру з камери
        ret, frame = cap.read()
        if not ret:
            print("Помилка: Не вдалося зчитати зображення з камери")
            break

        # Збільшення лічильника кадрів  
        frame_count += 1

        # Виконання інференсу
        results = model(frame, conf=args.conf)

        # Обробка результатів
        annotated_frame = results[0].plot()

        # Обчислення FPS
        elapsed_time = time.time() - start_time
        if elapsed_time >= 1.0:
            fps = frame_count / elapsed_time
            frame_count = 0
            start_time = time.time()
            
        cv2.putText(annotated_frame, f"FPS: {fps:.2f}", (10, 30), 
                    cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2)
        
        # Відображення кадру
        cv2.imshow('Об\'єктне виявлення', annotated_frame)
        
        # Вихід з циклу при натисканні 'q'
        if cv2.waitKey(1) & 0xFF == ord('q'):
            break

    # Завершення роботи
    cap.release()
    cv2.destroyAllWindows()

if __name__ == '__main__':
    main()

## Запуск скрипта для виведення

Щоб запустити скрипт виведення з вашою USB-камерою:

1. Переконайтеся, що ваше віртуальне середовище активоване:
   ```
   source venv/bin/activate  # На macOS/Linux
   ```
   або
   ```
   venv\Scripts\activate  # На Windows
   ```
2. Запустіть скрипт з терміналу:
   ```
   python run_robot_vision.py
   ```
3. Ви можете налаштувати поведінку за допомогою цих параметрів:
   - Щоб використовувати певну камеру: `--camera 1` 
   - Щоб використовувати вашу натреновану модель: `--model ./models/robotics_model/weights/best.pt`
   - Щоб налаштувати впевненість виявлення: `--conf 0.4`

Для прикладу:

```
python run_robot_vision.py --camera 1 --model ./models/robotics_model/weights/best.pt --conf 0.4
```

Якщо у вас виникають проблеми з індексом камери, спробуйте різні значення (0, 1, 2 тощо), поки не знайдете те, що відповідає вашій USB-камері.

## Висновок та наступні кроки

Вітаємо! Тепер ви успішно:

1. ✅ Дізналися, як машинне навчання може покращити завдання промислової робототехніки  
2. ✅ Створили й проанотували набір даних за допомогою Roboflow  
3. ✅ Підготували дані для локального навчання  
4. ✅ Навчили власну модель комп’ютерного зору, оптимізовану для вашого M1 Mac  
5. ✅ Розгорнули модель для реального часу з USB-камерою  

### Що робити далі

Тепер, коли у вас є базові навички, ось кілька шляхів для подальшого розвитку:

1. **Створіть більший набір даних**: спробуйте зібрати більше знімків у різних умовах освітлення та під різними кутами, щоб підвищити стійкість моделі.  
2. **Експериментуйте з різними моделями**: YOLOv8 доступний у різних розмірах (nano, small, medium, large). Навчіть той самий набір даних на різних архітектурах і порівняйте швидкість та точність. Також спробуйте інші моделі YOLO (наприклад, YOLOv11). 
3. **Оптимізація швидкодії**: досліджуйте методи квантизації або обрізки (pruning), щоб модель працювала ще швидше на низько ресурсних пристроях які будуть встановлені безпосередньо біля роботів.  
4. **Налаштування мультикамерної системи**: для більш складних застосунків встановіть кілька камер для отримання різних ракурсів тієї самої сцени.  

### Корисні ресурси

- [Документація Ultralytics YOLOv8](https://docs.ultralytics.com/) — детальні поради щодо роботи з моделлю  
- [Документація Roboflow](https://docs.roboflow.com/) — розширені прийоми аугментації та розмітки даних  
- [Документація PyTorch](https://pytorch.org/docs/) — щоб зрозуміти фреймворк глибинного навчання  
- [OpenCV Python Tutorials](https://docs.opencv.org/master/d6/d00/tutorial_py_root.html) — для просунутих операцій комп’ютерного зору  

Не забувайте тримати віртуальне середовище активним під час роботи над проєктом та не соромтеся експериментувати з моделлю на різних об’єктах!  
