# Установка

## Установка Yolov8

In [1]:
!pip install ultralytics

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/


## Установим переводчик

In [2]:
!pip install git+https://github.com/neuml/txtai#egg=txtai[pipeline]

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting txtai[pipeline]
  Cloning https://github.com/neuml/txtai to /tmp/pip-install-f6n2r0na/txtai_733cf179fc224f43abdf08f87ac8fb4f
  Running command git clone --filter=blob:none --quiet https://github.com/neuml/txtai /tmp/pip-install-f6n2r0na/txtai_733cf179fc224f43abdf08f87ac8fb4f
  Resolved https://github.com/neuml/txtai to commit aa6e0128807a49b8673e53903dbf80ba9e626a7c
  Installing build dependencies ... [?25l[?25hdone
  Getting requirements to build wheel ... [?25l[?25hdone
  Preparing metadata (pyproject.toml) ... [?25l[?25hdone


In [3]:
from ultralytics import YOLO
from txtai.pipeline import Translation  # Переводчик
from IPython import display
from google.colab.patches import cv2_imshow
# import cv2

# Краткий help по yolov8

## Аргументы

*  **source = 'ultralytics/assets'**	исходный каталог для изображений или видео

*  **conf = 0.25**	порог достоверности объекта для обнаружения
*  **iou = 0.7**	пороговое значение пересечения над объединением (IoU) для NMS
*  **half = False**	использовать половинную точность (FP16)
*  **device = None**	устройство для запуска, например cuda device=0/1/2/3 или 
*  **device = cpu**
*  **show	= False**	покажите результаты если можно
*  **save =	False**	сохранять изображения с результатами
*  **save_txt =	False**	сохранить результаты в виде файла .txt
*  **save_conf = False**	сохранить результаты с оценками достоверности
*  **save_crop = False**	сохранять обрезанные изображения с результатами
*  **hide_labels = False**	скрыть ярлыки
*  **hide_conf = False**	скрыть показатели уверенности
*  **max_det = 300**	максимальное количество обнаружений на изображение
*  **vid_stride = False**	шаг частоты кадров видео
*  **line_thickness = 3**	толщина ограничивающей рамки (в пикселях)
*  **visualize = False**	визуализировать особенности модели
*  **augment = False**	применять увеличение изображения к источникам предсказания
*  **agnostic_nms = False**	класс-независимая NMS
*  **retina_masks =	False**	использовать маски сегментации с высоким разрешением
*  **classes = None**	фильтровать результаты по классу, т.е. class=0 или class=[0,2,3]
*  **boxes = True**	Показывать поля в прогнозах сегментации


## Результаты

Объект Results содержит следующие компоненты:

*  **Results.boxes**: Boxesобъект со свойствами и методами для управления ограничивающими прямоугольниками.

*  **Results.masks**: Masksобъект для индексации масок или получения координат сегмента

*  **Results.probs**: torch.Tensorсодержит вероятности классов или логиты

*  **Results.orig_img**: Исходное изображение загружено в память

*  **Results.path**: Pathсодержит путь к входному изображению

Каждый результат по умолчанию состоит из a torch.Tensor, что позволяет легко манипулировать:

# Данные

Возьмём картинки с сайта видеопереворота

In [4]:
url_list = [
  'https://videoperevorot.ru/images/invite_1.jpg',
  'https://videoperevorot.ru/images/invite_2.jpg',
  'https://videoperevorot.ru/images/invite_3.jpg'
]

## 1. Детекция

### Детекция с порогом 0.2

In [5]:
model = YOLO('yolov8n.pt')  # load a pretrained YOLOv8n detection model
predict = model.predict(source=url_list, conf=0.2)  # predict on an image

for i in range(3):
  res_plotted = predict[i].plot()
  cv2_imshow(res_plotted)
  print()

Output hidden; open in https://colab.research.google.com to view.

### Детекция с порогом 0.5

In [6]:
model = YOLO('yolov8n.pt')  # load a pretrained YOLOv8n detection model
predict = model.predict(source=url_list, conf=0.5)  # predict on an image

for i in range(3):
  res_plotted = predict[i].plot()
  cv2_imshow(res_plotted)
  print()

Output hidden; open in https://colab.research.google.com to view.

# 2. Сегментация

### Сегментация с порогом 0.2

In [7]:
model = YOLO('yolov8n-seg.pt')  # load a pretrained YOLOv8n detection model
predict = model.predict(source=url_list, conf=0.2)  # predict on an image

for i in range(3):
  res_plotted = predict[i].plot()
  cv2_imshow(res_plotted)
  print()

Output hidden; open in https://colab.research.google.com to view.

### Сегментация с порогом 0.5

In [8]:
model = YOLO('yolov8n-seg.pt')  # load a pretrained YOLOv8n detection model
predict = model.predict(source=url_list, conf=0.5)  # predict on an image

for i in range(3):
  res_plotted = predict[i].plot()
  cv2_imshow(res_plotted)
  print()

Output hidden; open in https://colab.research.google.com to view.

## 3. Классификация

### Подключим переводчик для имён классов

In [9]:
# Create translation model
translate = Translation()

# Test
translation = translate("Checking the translator's work", "ru")  # Test
translation



'Проверка работы переводчика'

### Классификация с порогом 0.01, 0.2

In [10]:
model = YOLO('yolov8n-cls.pt')  # load a pretrained YOLOv8n detection model
predict = model.predict(source=url_list[0])  # predict on an image

names_list = predict[0].names

result_dict_001 = {}  # Результат с порогом 0.01
result_dict_02 = {}  # Результат с порогом 0.2
for i in range(predict[0].probs.shape[0]):
  acc = predict[0].probs[i]
  if acc > 0.02:
    name = names_list[i]
    translation = translate(name, "ru")
    if str(i) in result_dict_001:
      result_dict_001[str(i)][1] += 1
    else:
      result_dict_001[str(i)] = [translation, 1]
  if acc > 0.1:
    name = names_list[i]
    translation = translate(name, "ru")
    if str(i) in result_dict_02:
      result_dict_02[str(i)][1] += 1
    else:
      result_dict_02[str(i)] = [translation, 1]


Found https://videoperevorot.ru/images/invite_1.jpg locally at invite_1.jpg
image 1/1 /content/invite_1.jpg: 224x224 grand_piano 0.22, desk 0.19, laptop 0.10, desktop_computer 0.10, file 0.07, 44.4ms
Speed: 0.1ms preprocess, 44.4ms inference, 0.1ms postprocess per image at shape (1, 3, 224, 224)


In [11]:
result_dict_001

{'526': ['рабочий стол', 1],
 '527': ['настольные компьютеры', 1],
 '553': ['файл', 1],
 '579': ['Гран-пианино', 1],
 '620': ['Ноутбук', 1],
 '664': ['монитор', 1],
 '681': ['Записная книжка', 1],
 '745': ['проектор', 1],
 '881': ['вертикально', 1]}

In [12]:
result_dict_02

{'526': ['рабочий стол', 1], '579': ['Гран-пианино', 1], '620': ['Ноутбук', 1]}