In [2]:
import cv2
from ultralytics import YOLO

# Pfad zu Ihrem trainierten YOLOv11-Modell
model_path = './model/m.pt'

# Laden des Modells
model = YOLO(model_path)

# Setze die Vertrauensschwelle
confidence_threshold = 0.5  # 50%

# Zugriff auf die Webcam (Standardkamera)
cap = cv2.VideoCapture(0)

# Setze die Auflösung auf 1080p
cap.set(cv2.CAP_PROP_FRAME_WIDTH, 1280)
cap.set(cv2.CAP_PROP_FRAME_HEIGHT, 720)

if not cap.isOpened():
    print("Fehler beim Zugriff auf die Webcam.")
    exit()

while True:
    ret, frame = cap.read()
    if not ret:
        print("Fehler beim Lesen des Frames.")
        break

    # Objekterkennung auf dem aktuellen Frame mit definierter Vertrauensschwelle
    results = model(frame, conf=confidence_threshold)

    # Ergebnisse auf dem Frame darstellen
    annotated_frame = results[0].plot()

    # Anzeige des Frames mit erkannten Objekten
    cv2.imshow('YOLOv11 Objekterkennung', annotated_frame)

    # Beenden bei Drücken der Taste 'q'
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# Ressourcen freigeben
cap.release()
cv2.destroyAllWindows()



0: 384x640 (no detections), 19.3ms
Speed: 2.1ms preprocess, 19.3ms inference, 1.4ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 (no detections), 13.3ms
Speed: 1.1ms preprocess, 13.3ms inference, 0.3ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 (no detections), 10.3ms
Speed: 1.5ms preprocess, 10.3ms inference, 0.3ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 (no detections), 9.7ms
Speed: 1.9ms preprocess, 9.7ms inference, 0.9ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 (no detections), 9.5ms
Speed: 1.6ms preprocess, 9.5ms inference, 0.4ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 (no detections), 13.4ms
Speed: 14.0ms preprocess, 13.4ms inference, 0.4ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 (no detections), 9.9ms
Speed: 1.6ms preprocess, 9.9ms inference, 0.9ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 (no detections), 9.2ms
Speed: 1.1ms preprocess, 9.2ms inferenc

KeyboardInterrupt: 

In [2]:
import cv2
from ultralytics import YOLO

# Pfad zu Ihrem trainierten YOLOv11-Segmentierungsmodell
model_path = './model/n.pt'

# Laden des Modells
model = YOLO(model_path)

# Setze die Vertrauensschwelle
confidence_threshold = 0.5  # 50%

# Zugriff auf die Webcam (Standardkamera)
cap = cv2.VideoCapture(0)

# Setze die Auflösung auf 1080p
cap.set(cv2.CAP_PROP_FRAME_WIDTH, 1920)
cap.set(cv2.CAP_PROP_FRAME_HEIGHT, 1080)

if not cap.isOpened():
    print("Fehler beim Zugriff auf die Webcam.")
    exit()

while True:
    ret, frame = cap.read()
    if not ret:
        print("Fehler beim Lesen des Frames.")
        break

    # Objekterkennung auf dem aktuellen Frame mit definierter Vertrauensschwelle
    results = model(frame, conf=confidence_threshold)

    # Überprüfen, ob Masken vorhanden sind
    if results[0].masks is not None:
        masks = results[0].masks
        for mask in masks.data:
            # Konvertiere die Maske in ein Format, das mit OpenCV kompatibel ist
            mask = mask.cpu().numpy().astype('uint8') * 255
            contours, _ = cv2.findContours(mask, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
            cv2.drawContours(frame, contours, -1, (0, 255, 0), 2)

    # Anzeige des Frames mit den erkannten Objekten
    cv2.imshow('YOLOv11 Instanzsegmentierung', frame)

    # Beenden bei Drücken der Taste 'q'
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# Ressourcen freigeben
cap.release()
cv2.destroyAllWindows()


0: 384x640 (no detections), 6.8ms
Speed: 1.0ms preprocess, 6.8ms inference, 0.2ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 (no detections), 7.0ms
Speed: 2.1ms preprocess, 7.0ms inference, 0.3ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 (no detections), 6.7ms
Speed: 1.3ms preprocess, 6.7ms inference, 0.3ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 (no detections), 6.4ms
Speed: 1.5ms preprocess, 6.4ms inference, 0.2ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 (no detections), 8.4ms
Speed: 1.6ms preprocess, 8.4ms inference, 0.3ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 (no detections), 6.5ms
Speed: 1.4ms preprocess, 6.5ms inference, 0.3ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 (no detections), 6.4ms
Speed: 1.4ms preprocess, 6.4ms inference, 0.3ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 (no detections), 7.6ms
Speed: 1.4ms preprocess, 7.6ms inference, 1.3ms 