# **Детекция при помощи YOLOv11s**

## **Адрес камеры**

In [1]:
import cv2
import time

In [2]:
stream_url = "rtsp://admin:zyitJk2X3Kn!@192.168.1.2:554/Streaming/Channels/101"
window_name = "IP Camera"

In [3]:
def open_stream():
    cap = cv2.VideoCapture(stream_url, cv2.CAP_FFMPEG)
    return cap

cap = open_stream()

if not cap.isOpened():
    print("Не удалось открыть поток.")
    exit(1)

# Читаем первый кадр, чтобы узнать реальный размер видео
ok, frame = cap.read()
if not ok:
    print("Не удалось получить первый кадр.")
    exit(1)

## **Загрузка модели**

In [4]:
import torch
from ultralytics import YOLO

print("CUDA available:", torch.cuda.is_available())
if torch.cuda.is_available():
    print("Device:", torch.cuda.get_device_name(0))

CUDA available: True
Device: NVIDIA GeForce RTX 3060


In [5]:
model = YOLO("yolo11s.pt")
model.to("cuda")          # переносим на GPU
model.fuse()              # лёгкое ускорение слоёв
#warmup = torch.zeros(1, 3, 640, 640).half().cuda()
#_ = model.model(warmup)   # короткий прогрев (кастом, можно пропустить)

YOLO11s summary (fused): 100 layers, 9,443,760 parameters, 0 gradients, 21.5 GFLOPs


In [6]:
# ID класса "bird" из модели YOLOv11
bird_class_ids = [i for i, n in model.names.items() if n.lower() == "bird"]

print("bird_class_ids:", bird_class_ids)

bird_class_ids: [14]


### **Параметры детекции**

In [7]:
CONF_THRES = 0.30
IOU_THRES = 0.50
IMGSZ = 640  # можно 512 для ещё большей скорости

results = model.predict(
    source=frame,
    device=0,           # первая CUDA-GPU
    conf=CONF_THRES,
    iou=IOU_THRES,
    imgsz=IMGSZ,
    classes=bird_class_ids if bird_class_ids else None,
    half=True,
    verbose=False
)


### **Стрим с IP-камеры + детекция**

In [None]:
stream_url = "rtsp://admin:zyitJk2X3Kn!@192.168.1.2:554/Streaming/Channels/101"

cap = cv2.VideoCapture(stream_url)
if not cap.isOpened():
    raise RuntimeError("Не удалось открыть поток. Проверь stream_url / доступ.")

window_name = "Bird Feeder YOLOv11 (press ESC to exit)"
cv2.namedWindow(window_name, cv2.WINDOW_NORMAL)

fps, frames, t0 = 0.0, 0, time.time()

try:
    while True:   
        ok, frame = cap.read()
        if not ok:
            print("Потерян кадр..."); 
            continue

        results = model.predict(
            source=frame,
            device=0,
            imgsz=IMGSZ,
            conf=CONF_THRES,
            iou=IOU_THRES,
            classes=bird_class_ids,
            half=True,
            verbose=False,
            show=False 
        )

        # Готовый отрисованный кадр от Ultralytics
        annotated = results[0].plot()

        # Подсчёт FPS
        frames += 1
        now = time.time()
        if now - t0 >= 1.0:
            fps = frames / (now - t0)
            frames, t0 = 0, now

        # Оверлей с FPS и числом детекций птиц на кадр
        birds = (results[0].boxes.cls == bird_class_ids[0]).sum().item() if results[0].boxes.cls is not None else 0
        cv2.putText(annotated, f"FPS: {fps:.1f}", (10, 28), cv2.FONT_HERSHEY_SIMPLEX, 0.75, (0,255,255), 2, cv2.LINE_AA)
        cv2.putText(annotated, f"Birds: {birds}", (150, 28), cv2.FONT_HERSHEY_SIMPLEX, 0.75, (0,255,255), 2, cv2.LINE_AA)

        cv2.imshow(window_name, annotated)

        key = cv2.waitKey(1) & 0xFF
        if cv2.getWindowProperty(window_name, cv2.WND_PROP_VISIBLE) < 1:
            break
        if key == 27:
            break
finally:
    cap.release()
    cv2.destroyAllWindows()
