In [1]:
import torch

if torch.cuda.is_available():
    device = torch.device("cuda")
    print("GPU is available")
    print("Device name:", torch.cuda.get_device_name(0))
else:
    device = torch.device("cpu")
    print("GPU is not available, using CPU instead")

print(f"Using device: {device}")

GPU is not available, using CPU instead
Using device: cpu


In [2]:
import cv2
from PIL import Image
from ultralytics import YOLO

# Model
model = YOLO("./runs/detect/train/weights/best.pt")

In [7]:

results = model(source=0, show=True, conf=0.5)


1/1: 0... Success ✅ (inf frames of shape 1280x720 at 29.00 FPS)

inference results will accumulate in RAM unless `stream=True` is passed, causing potential out-of-memory
errors for large sources or long-running streams and videos. See https://docs.ultralytics.com/modes/predict/ for help.

Example:
    results = model(source=..., stream=True)  # generator of Results objects
    for r in results:
        boxes = r.boxes  # Boxes object for bbox outputs
        masks = r.masks  # Masks object for segment masks outputs
        probs = r.probs  # Class probabilities for classification outputs

0: 384x640 1 face, 67.8ms
0: 384x640 1 face, 60.3ms
0: 384x640 1 face, 79.7ms
0: 384x640 1 face, 83.6ms
0: 384x640 1 face, 75.7ms
0: 384x640 1 face, 54.9ms
0: 384x640 1 face, 53.9ms
0: 384x640 1 face, 55.2ms
0: 384x640 1 face, 52.6ms
0: 384x640 1 face, 56.1ms
0: 384x640 1 face, 49.7ms
0: 384x640 1 face, 49.5ms
0: 384x640 1 face, 54.3ms
0: 384x640 1 face, 52.6ms
0: 384x640 1 face, 49.7ms
0: 384x640 1 

KeyboardInterrupt: 

In [None]:
cap = cv2.VideoCapture(0)

if not cap.isOpened():
    raise IOError("Невозможно открыть веб-камеру")

try:
    while True:
        ret, frame = cap.read()
        if not ret:
            print("Конец видеопотока")
            break

        # Получение результатов обнаружения объектов
        results = model(frame, stream=True, conf=0.5)  # conf=0.5 - порог уверенности 50%

        # Отображение результатов на кадре
        for res in results:
            boxes = res.boxes  # Объекты класса ultralytics.engine.results.Boxes
            for box in boxes:
                # Получение координат ограничивающего прямоугольника
                x1, y1, x2, y2 = box.xyxy[0]  # [0] т.к. box.xyxy - это тензор с одной строкой (для одного объекта)
                x1, y1, x2, y2 = int(x1), int(y1), int(x2), int(y2)  # Преобразование в целые числа

                # Получение класса объекта
                class_id = int(box.cls[0])  # [0] т.к. box.cls - это тензор с одной строкой (для одного объекта)

                # Получение уверенности обнаружения
                confidence = float(box.conf[0])  # [0] т.к. box.conf - это тензор с одной строкой (для одного объекта)

                # Получение названия класса (если доступно в модели)
                if hasattr(res, 'names'):
                    class_name = res.names[class_id]
                else:
                    class_name = f"Class {class_id}" # Если у `res` нет атрибута `names`

                # Рисование ограничивающего прямоугольника и подписи на кадре
                label = f"{class_name} {confidence:.2f}"
                cv2.rectangle(frame, (x1, y1), (x2, y2), (0, 255, 0), 2)
                cv2.putText(frame, label, (x1, y1 - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2)


        # Отображение кадра с результатами
        cv2.imshow("YOLOv8 Real-Time Detection", frame)

        # Выход из цикла при нажатии клавиши 'q'
        if cv2.waitKey(1) & 0xFF == ord('q'):
            break

except Exception as e:
    print(f"Произошла ошибка: {e}")

finally:
    # Освобождение ресурсов
    cap.release()
    cv2.destroyAllWindows()


0: 384x640 1 face, 63.9ms
Speed: 3.9ms preprocess, 63.9ms inference, 0.8ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 1 face, 88.9ms
Speed: 3.0ms preprocess, 88.9ms inference, 0.8ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 1 face, 46.0ms
Speed: 1.7ms preprocess, 46.0ms inference, 0.7ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 1 face, 52.8ms
Speed: 2.4ms preprocess, 52.8ms inference, 0.7ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 1 face, 46.4ms
Speed: 2.0ms preprocess, 46.4ms inference, 0.7ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 1 face, 50.9ms
Speed: 1.9ms preprocess, 50.9ms inference, 0.7ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 1 face, 47.6ms
Speed: 1.9ms preprocess, 47.6ms inference, 0.7ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 1 face, 92.1ms
Speed: 4.3ms preprocess, 92.1ms inference, 1.3ms postprocess per image at shape (1, 3, 384, 640)

0: 384x

KeyboardInterrupt: 

: 