# Применение модели  
### детектирование объектов на видео и фото  


### Модель __YOLOv8n__ (Ultralytics YOLOv8 Nano) – самый лёгкий вариант, быстрый.  



In [1]:
import cv2
from ultralytics import YOLO

# Параметры
video_path = "video3.avi"  # Путь к входному видео
output_video_path = "video_boxed.avi"  # Путь к выходному видео
model_path = "best.pt"  # Файл обученной модели



# Загружаем модель YOLO
model = YOLO(model_path)


# Размер экрана
screen_width = 1024
screen_height = 1024

width = 512
height = 512


conf = 0.2
iou=0.4



# Открываем видео
cap = cv2.VideoCapture(video_path)

# Получаем информацию о видео (размер кадра, fps и т.д.)
frame_width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
frame_height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))

# Создаем объект VideoWriter для записи выходного видео
fourcc = cv2.VideoWriter_fourcc(*'XVID')  # Используем кодек XVID для AVI
out = cv2.VideoWriter(output_video_path, fourcc, 20, (screen_width, screen_height))

while cap.isOpened():
    ret, frame = cap.read()
    if not ret:
        break
    
    # Масштабируем кадр, чтобы он поместился в экран
    frame_resized = cv2.resize(frame, (screen_width, screen_height))
    img_resized = cv2.resize(frame, (width, height))
    # Применяем детекцию (модель, которая у тебя уже есть)
    results = model.predict(frame_resized, conf=conf, iou=iou)

    # Здесь выполняется рисование на кадре (если нужно)
    for result in results:
        boxes = result.boxes.xyxy.cpu().numpy()
        labels = result.boxes.cls.cpu().numpy()
        scores = result.boxes.conf.cpu().numpy()

        for box, label, score in zip(boxes, labels, scores):
            x1, y1, x2, y2 = map(int, box)
            frame_resized = cv2.rectangle(frame_resized, (x1, y1), (x2, y2), (0, 255, 0), 2)
    
    # Записываем кадр в выходное видео
    out.write(frame_resized)

    # Отображаем кадр
    cv2.imshow('Frame', frame_resized)
    
    # Прерываем по нажатию 'q'
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# Завершаем захват и закрываем окна
cap.release()
out.release()
cv2.destroyAllWindows()



0: 512x512 17 buildings, 1 prefabricated-house, 1 well, 4.3ms
Speed: 2.9ms preprocess, 4.3ms inference, 109.7ms postprocess per image at shape (1, 3, 512, 512)

0: 512x512 22 buildings, 1 prefabricated-house, 1 well, 4.9ms
Speed: 1.8ms preprocess, 4.9ms inference, 0.7ms postprocess per image at shape (1, 3, 512, 512)

0: 512x512 23 buildings, 1 well, 4.2ms
Speed: 1.1ms preprocess, 4.2ms inference, 0.8ms postprocess per image at shape (1, 3, 512, 512)

0: 512x512 21 buildings, 1 well, 5.0ms
Speed: 1.6ms preprocess, 5.0ms inference, 0.7ms postprocess per image at shape (1, 3, 512, 512)

0: 512x512 19 buildings, 1 well, 4.1ms
Speed: 1.2ms preprocess, 4.1ms inference, 1.4ms postprocess per image at shape (1, 3, 512, 512)

0: 512x512 21 buildings, 1 well, 3.9ms
Speed: 1.3ms preprocess, 3.9ms inference, 0.7ms postprocess per image at shape (1, 3, 512, 512)

0: 512x512 19 buildings, 1 prefabricated-house, 1 well, 4.2ms
Speed: 1.2ms preprocess, 4.2ms inference, 0.7ms postprocess per image at 