# **Детекция при помощи YOLOv11s**

In [2]:
import os
import time
from datetime import datetime
from collections import deque

## **Адрес камеры**

In [3]:
import cv2

In [4]:
stream_url = "rtsp://admin:zyitJk2X3Kn!@192.168.1.2:554/Streaming/Channels/101"
window_name = "IP Camera"

In [5]:
def open_stream():
    cap = cv2.VideoCapture(stream_url, cv2.CAP_FFMPEG)
    return cap

cap = open_stream()

if not cap.isOpened():
    print("Не удалось открыть поток.")
    exit(1)

# Читаем первый кадр, чтобы узнать реальный размер видео
ok, frame = cap.read()
if not ok:
    print("Не удалось получить первый кадр.")
    exit(1)

## **Загрузка модели**

In [6]:
import torch
from ultralytics import YOLO

print("CUDA available:", torch.cuda.is_available())
if torch.cuda.is_available():
    print("Device:", torch.cuda.get_device_name(0))

CUDA available: True
Device: NVIDIA GeForce RTX 3060


In [7]:
model = YOLO("yolo11m.pt")
model.to("cuda")          # переносим на GPU
model.fuse()              # лёгкое ускорение слоёв
#warmup = torch.zeros(1, 3, 640, 640).half().cuda()
#_ = model.model(warmup)   # короткий прогрев (кастом, можно пропустить)

YOLO11m summary (fused): 125 layers, 20,091,712 parameters, 0 gradients, 68.0 GFLOPs


In [8]:
# ID класса "bird" из модели YOLOv11
bird_class_ids = [i for i, n in model.names.items() if n.lower() == "bird"]

print("bird_class_ids:", bird_class_ids)

bird_class_ids: [14]


### **Параметры детекции**

In [9]:
CONF_THRES = 0.30
IOU_THRES = 0.50
IMGSZ = 640  # можно 512 для ещё большей скорости

results = model.predict(
    source=frame,
    device=0,           # первая CUDA-GPU
    conf=CONF_THRES,
    iou=IOU_THRES,
    imgsz=IMGSZ,
    classes=bird_class_ids if bird_class_ids else None,
    half=True,
    verbose=False
)


### **Параметры записи видео в директорию records**

In [10]:
PRE_SEC = 5              # N секунд до появления рамки детекции (преролл и постролл)
COOLDOWN_SEC = 3         # K секунд кулдауна после появления рамки детекции
OUTPUT_DIR = "records"
os.makedirs(OUTPUT_DIR, exist_ok=True) # создание директории records

fourcc = cv2.VideoWriter_fourcc(*'mp4v') # формирование специального четырёхсимвольного код mp4v для выбора формата сжатия видео

### **Стрим с IP-камеры + детекция**

Параметры камеры

In [11]:
stream_url = "rtsp://admin:zyitJk2X3Kn!@192.168.1.2:554/Streaming/Channels/101"
window_name = "Bird Feeder YOLOv11 (press ESC to exit)"

**Создание потока**

In [12]:
cap = cv2.VideoCapture(stream_url)

if not cap.isOpened():
    raise RuntimeError("Не удалось открыть поток. Проверь stream_url / доступ.")

ok, frame = cap.read() # первый кадр
height, width = frame.shape[:2]

# FPS (если камера не отдаёт — ставим 25)
fps = cap.get(cv2.CAP_PROP_FPS)
if not fps or fps <= 1e-2:
    fps = 25.0

cv2.namedWindow(window_name, cv2.WINDOW_NORMAL)
cv2.resizeWindow(window_name, width, height) 


Создание буфера

In [13]:
prebuffer = deque(maxlen=int(PRE_SEC * fps)) # очередь, которая хранит последние PRE_SEC секунд кадров
recording = False
writer = None
last_detection_ts = None
cooldown_deadline = None
postroll_deadline = None

Начало записи

In [14]:
def start_recording():
    global writer, recording
    ts = datetime.now().strftime("%Y%m%d_%H%M%S")
    out_path = os.path.join(OUTPUT_DIR, f"bird_{ts}.mp4")
    writer = cv2.VideoWriter(out_path, fourcc, fps, (width, height))
    for f, _ in prebuffer: 
        writer.write(f)  # каждый кадр f записывается в видеофайл, timestamp не нужен
    recording = True
    print(f"[REC] Начата запись: {out_path}")

Конец записи

In [15]:
def stop_recording():
    global writer, recording, cooldown_deadline, postroll_deadline
    if writer:
        writer.release()
        writer = None
    recording = False
    cooldown_deadline = None
    postroll_deadline = None
    prebuffer.clear()
    print("[REC] Остановлена и сохранена.")

In [16]:
frames, t0, fps_counter = 0, time.time(), 0.0

try:
    while True:   
        ok, frame = cap.read()
        now = time.time() # текущее время в секундах

        if not ok:
            print("Потерян кадр...")
            key = cv2.waitKey(1) & 0xFF # закрытие окна в случае потери кадра
            if cv2.getWindowProperty(window_name, cv2.WND_PROP_VISIBLE) < 1 or key == 27: 
                break
            continue

        prebuffer.append((frame.copy(), now)) # добавление кадра в буфер (преролл)

        results = model.predict(
            source=frame,
            device=0,
            imgsz=IMGSZ,
            conf=CONF_THRES,
            iou=IOU_THRES,
            classes=bird_class_ids,
            half=True,
            verbose=False,
            show=False 
        )

        # Проверка наличия птиц
        birds = 0
        if results and results[0].boxes and results[0].boxes.cls is not None:
            birds = (results[0].boxes.cls == bird_class_ids[0]).sum().item()
        bird_now = birds > 0

        # Готовый отрисованный кадр от Ultralytics
        annotated = results[0].plot()

        # Подсчёт FPS
        frames += 1
        if now - t0 >= 1.0:
            fps_counter  = frames / (now - t0)
            frames, t0 = 0, now

        # Оверлей с FPS и числом детекций птиц на кадр
        cv2.putText(annotated, f"FPS: {fps_counter :.1f}", (10, 28),
                     cv2.FONT_HERSHEY_SIMPLEX, 0.75, (0,255,255), 2, cv2.LINE_AA)
        cv2.putText(annotated, f"Birds: {birds}", (150, 28),
                     cv2.FONT_HERSHEY_SIMPLEX, 0.75, (0,255,255), 2, cv2.LINE_AA)
        
        # логика заПиси
        if bird_now:
            last_detection_ts = now
            if not recording:
                start_recording()
            cooldown_deadline = None
            postroll_deadline = None
        else:
            if recording:
                if cooldown_deadline is None:
                    cooldown_deadline = now + COOLDOWN_SEC
                elif now >= cooldown_deadline:
                    if postroll_deadline is None:
                        postroll_deadline = now + PRE_SEC
                    elif now >= postroll_deadline:
                        stop_recording()

        # ЗаПись
        if recording and writer:
            writer.write(annotated)

        # Показ окна
        cv2.imshow(window_name, annotated)

        # Закрытие окна
        key = cv2.waitKey(1) & 0xFF
        if cv2.getWindowProperty(window_name, cv2.WND_PROP_VISIBLE) < 1 or key == 27:
            break
finally:
    if recording:
        stop_recording()
    cap.release()
    cv2.destroyAllWindows()


[REC] Начата запись: records\bird_20251007_191505.mp4
[REC] Остановлена и сохранена.
