<a href="https://colab.research.google.com/github/MahuL88/SpecialSkill/blob/main/Car_Tracking.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#Day 1

## Bagian 1

* Clone YOLOv5 dan install dependensi

In [None]:
# Melakukan perintah clone kode YOLOV5 dari github repo ultralytics ke collab melalui terimnal
!git clone https://github.com/ultralytics/yolov5
# Pindah direktori dari direktori/folder utama collab ke yolov5 dengan bantuan magic command
%cd yolov5
# Menginstall semua library/pustaka yang dibutuhkan oleh YOLOv5 di file requirement.txt melalui terminal.
!pip install -r requirements.txt

# Menginstall library deep sort untuk tracking(memberi ID) melalui terminal
!pip install deep_sort_realtime

* Untuk contoh file videonya bisa diakses/didownload di sini : [teks link](https://drive.google.com/file/d/1_fvKmLqrQlRKEIqrdfixIRfcV5dkU-cT/view?usp=sharing)

In [None]:
from google.colab import files # Impor modul files dari library collab.

uploaded = files.upload() # Mendefinisikan variabel uploaded agar dapat mengunggah file

Saving car_video.mp4 to car_video.mp4


* Sebelumnya saya membandingkan model YOLOv5(s,m,l,x) untuk melihat mana yang akurat melakukan bounding box dan proses training yang tidak lama dari sebuah gambar. akhirnya, saya memilih model YOLOv5m

In [None]:
# Impor torch dari framework PyTorch, impor modul deepsort, dan pustaka OpenCV(untuk mengolah model dan video)
import torch
import cv2
from deep_sort_realtime.deepsort_tracker import DeepSort

# Membuat variabel model dimana torch mendownload model versi "m" yang sudah dilatih sebelumnya (pretrained).
model = torch.hub.load('ultralytics/yolov5', 'yolov5m', pretrained=True)
# Mengecek apakah GPU aktif di Google Colab.
# Untuk Mengaktifkannya, di fitur runtime, ubah jenis runtime dengan runtume GPU (akan mengembalikan bool True jika aktif)
print(torch.cuda.is_available())

#Day 2

In [None]:
# Inisialisasi Deep SORT tracker yg akan menyimpan objek yg hilang selama 30 frame
tracker = DeepSort(max_age=30)

# Variabel video_path yang akan menyimpan nama file video
video_path = 'car_video.mp4'

# membuka/membaca video tersebut yang akan memproses frame demi frame, lalu menyimpannya ke variabel cap
cap = cv2.VideoCapture(video_path)

# Variabel output_path utk simpan hasil file yang sudah di bounding box nantinya
output_path = 'output.avi'

# Variabel Four Character Code utk memilih format kompresi video outputnya dengan jenis kompresi XVID
fourcc = cv2.VideoWriter_fourcc(*'XVID')

# Mengambil/membaca lebarnya frame dengan satuan pixel bertipe integer
width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
# Mengambil/membaca Tingginya frame dengan satuan pixel bertipe integer
height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))

# Membuat objek VideoWriter untuk menulis frame ke dalam file video
# Dengan parameter, nama file output, format video disimpan, frame per second, dan ukuran frame video output
out = cv2.VideoWriter(output_path, fourcc, 20.0, (width, height))

# Perulangan dengan kondisi selama video masih bisa dibuka, baca frame dan kembalikan status True
# Jika status sudah False, artinya video sudah selesai dan loop berhenti
while cap.isOpened():
    ret, frame = cap.read()
    if not ret:
        break

    # Model mendeteksi objek " di dalam frame dan disimpan ke variabel results
    results = model(frame)
    # mengembalikan hasil deteksi dalam bentuk tabel(pandas df) yang memiliki kolom class dan nama
    detections = results.pandas().xyxy[0]

    # menyiapkan list kosong untuk menyimpan data yg akan ditracker
    dets_for_sort = []

    # Melakukan Bounding Box dan filter hanya untuk class saja
    for _, row in detections.iterrows():  # baca hasil deteksi baris demi baris
        if row['name'] == 'car':          # filter hanya utk class car

            # Ambil koordinat kotak dari setiap baris yg sudah difilter
            x1, y1, x2, y2 = map(int, [row['xmin'], row['ymin'], row['xmax'], row['ymax']])

            # Menghitung lebar (w) dan tinggi (h) kotak mobil
            w, h = x2 - x1, y2 - y1

            # Menghitung tingkat keyakinan model mendeteksi mobil
            conf = row['confidence']

            # masukkan data ke list kosong sebelumnya dalam format [x, y, w, h], confidence, dan label
            dets_for_sort.append(([x1, y1, x2 - x1, y2 - y1], conf, 'car'))

    # Update tracker dengan mengirim hasil deteksi, diproses tracker, lalu tiap mobil diberikan ID unik
    tracks = tracker.update_tracks(dets_for_sort, frame=frame)

    # Perulangan untuk melihat mobil/objek yang ada di tracks
    for track in tracks:
        # Jika objek masih belum terkonfirmasi (track tidak valid), lewatkan
        if not track.is_confirmed():
            continue

        # Mengambil ID unik untuk setiap mobil/objek.
        track_id = track.track_id

        # Membaca/mengambil koordinat kotak(bounding box) dalam format left, top, right, and bottom(ltrb)
        ltrb = track.to_ltrb()

        # Ubah semua elemen di ltrb jadi integer agar mudah dipakai OpenCV utk menggambar boxnya
        x1, y1, x2, y2 = map(int, ltrb)

        # Menggambar kotak biru(kode 255, 0, 0) di sekeliling class(mobil)
        cv2.rectangle(frame, (x1, y1), (x2, y2), (255,0,0), 2)

        # Menulis text di atas kotak untuk ID object/mobil
        # dengan warna text hijau dan posisi text 10 piksel di atas kotak di sebelah kiri atas.
        cv2.putText(frame, f'ID {track_id}', (x1, y1 - 10),
                    cv2.FONT_HERSHEY_SIMPLEX, 0.6, (0,255,0), 2)

    # simpan framenya(yg sudah di kotakin) ke variabel video_path
    out.write(frame)

# Menutup file video input
cap.release()
# Menutup file video output
out.release()

In [None]:
# Mengunduh file output hasil yang telah di bounding box ke perangkat lokal(komputer)
files.download('/content/yolov5/output.avi')

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

## Ringkasan

Tracking mobil ini mendeteksi mobil menggunakan model YOLOv5m yang akan melihat dan memberi kotak pembatas (bounding box) pada setiap mobil di tiap frame video. lalu, hasilnya diteruskan ke Deep Sort untuk melacak dan memberikan ID unik untuk setiap object(dalam kasus ini mobil), sehingga mobil yang sama bisa dikenali secara konsisten sepanjang video secara real-time.