In [1]:
import cv2
import math
from ultralytics import YOLO
import cvzone
import numpy as np

In [2]:
video_path = "/Users/abdulbarisoylemez/Documents/Visual Code/Car_Detection/video.mov"
cap = cv2.VideoCapture(video_path)


In [3]:
# YOLO modelini yükle
model = YOLO("yolov8l.pt")


Downloading https://github.com/ultralytics/assets/releases/download/v0.0.0/yolov8l.pt to 'yolov8l.pt'...
100%|██████████| 83.7M/83.7M [00:03<00:00, 28.7MB/s]


In [4]:
class_names =[ 'person', 'bicycle', 'car', 'motorcycle', 'airplane', 'bus', 'train', 'truck', 'boat', 'traffic light',
         'fire hydrant', 'stop sign', 'parking meter', 'bench', 'bird', 'cat', 'dog', 'horse', 'sheep', 'cow',
         'elephant', 'bear', 'zebra', 'giraffe', 'backpack', 'umbrella', 'handbag', 'tie', 'suitcase', 'frisbee',
         'skis', 'snowboard', 'sports ball', 'kite', 'baseball bat', 'baseball glove', 'skateboard', 'surfboard',
         'tennis racket', 'bottle', 'wine glass', 'cup', 'fork', 'knife', 'spoon', 'bowl', 'banana', 'apple',
         'sandwich', 'orange', 'broccoli', 'carrot', 'hot dog', 'pizza', 'donut', 'cake', 'chair', 'couch',
         'potted plant', 'bed', 'dining table', 'toilet', 'tv', 'laptop', 'mouse', 'remote', 'keyboard', 'cell phone',
         'microwave', 'oven', 'toaster', 'sink', 'refrigerator', 'book', 'clock', 'vase', 'scissors', 'teddy bear',
         'hair drier', 'toothbrush' ]

In [5]:
# Daha hızlı bir işlem için her 2 frame'i işle
frame_skip = 2
frame_count = 0

while True:
    # Kameradan bir kare oku
    success, img = cap.read()
    if success==False:
        break

    frame_count += 1

    # Her iki frameden birini işle
    if frame_count % frame_skip == 0:
        # YOLO modelini kullanarak nesne tespiti yap
        results = model(img, stream=True)

        for i in results:
            # Her bir sonuç için sınırlayıcı kutuları al
            boxes = i.boxes

            for box in boxes:
                # Güven değerini ve sınıf etiketini al
                conf = math.ceil((box.conf[0] * 100)) / 100
                cls = int(box.cls[0])

                # Sadece "car", "bus", ve "truck" sınıflarını işle
                if class_names[cls] in ["car", "bus", "truck"]:
                    # Sınırlayıcı kutuyu al ve koordinatları ayarla
                    x1, y1, x2, y2 = map(int, box.xyxy[0])

                    # Sınırlayıcı kutunun genişliği ve yüksekliği
                    w, h = (x2 - x1), (y2 - y1)

                    # Eğer boyutlar 0 veya negatifse, bu durumu ele al
                    if w > 0 and h > 0:
                        # Sınırlayıcı kutuyu çiz
                        cv2.rectangle(img, (x1, y1), (x2, y2), (255, 0, 0), 3)

                        # Köşeleri çiz
                        cvzone.cornerRect(img, (x1, y1, w, h), l=15)

                        # Sınıf adını ve güven değerini metin olarak çiz
                        text = f"{class_names[cls]} {conf}"

                        # Etiketi sınırlayıcı kutunun üzerine yaz
                        cv2.putText(img, text, (x1, max(y1 - 10, 0)), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 255, 255), 2)

        # Sonuçları göster
        cv2.imshow("Object Detection", img)

    # Klavyeden bir tuşa basıldığını kontrol et
    key = cv2.waitKey(1) & 0xFF

    # Eğer 'q' tuşuna basıldıysa döngüden çık
    if key == ord('q'):
        break

# Pencereyi kapat
cap.release()
cv2.destroyAllWindows()


0: 384x640 13 persons, 4 cars, 1 truck, 296.6ms
Speed: 2.0ms preprocess, 296.6ms inference, 11.4ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 11 persons, 3 cars, 1 bus, 1 truck, 1 backpack, 284.7ms
Speed: 0.7ms preprocess, 284.7ms inference, 0.6ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 11 persons, 3 cars, 1 truck, 1 backpack, 239.6ms
Speed: 0.7ms preprocess, 239.6ms inference, 0.6ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 9 persons, 3 cars, 237.6ms
Speed: 0.6ms preprocess, 237.6ms inference, 0.4ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 10 persons, 4 cars, 1 truck, 239.3ms
Speed: 0.7ms preprocess, 239.3ms inference, 0.7ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 8 persons, 4 cars, 239.6ms
Speed: 0.6ms preprocess, 239.6ms inference, 0.4ms postprocess per image at shape (1, 3, 384, 640)

0: 384x640 6 persons, 3 cars, 2 trucks, 1 traffic light, 240.5ms
Speed: 0.7ms preprocess, 240.5ms inferen