## Python ile Nesne Takibi

![](test/gif0.gif)

#### 1. Nesne Takibi (Object Tracking)

Nesne takibi, bir nesnenin video içerisindeki hareket sürecinin baştan sona takip edildiği/izlendiği bilgisayarlı görü uygulamasına verilen addır. 

Başka bir deyişle, bir videodaki hareketli nesnelerin konumları ile ilgili bilgileri tahmin etme görevidir.

![](test/resim0.png)

Nesne takibi, hedef nesnenin başlangıç konumu tanımlandıktan sonra bir videodaki ardışık her karede hedef nesnenin konumunu tahmin etme anlamına gelir. Yani nesne takibi nesnenin yörüngesini izlemek için eğitilmiştir.

Nesne tanıma ise bir videonun tek bir karesindeki hedef nesneyi tanıma işlemidir. Yani nesne tanıma algoritmaları temel olarak tanıma/tespit amaçlı eğitilirler.

#### 2. Nesne Takip Algoritmaları

Bu bölümle toplamda 10 adet nesne takip algoritmasını öğreneceğiz. Bu algoritmaların birbirlerine göre avantajlarını ve dezavantajlarını inceleyeceğiz.

1. Boosting
2. MIL
3. KCF
4. CSRT
5. Medianflow
6. TLD
7. MOSSE
8. Goturn
9. Sparse Optical Flow
10. Dense Optical Flow


##### 2.1. Boosting & MIL

![](test/resim2.jpg)

Boosting tekniği, Adaboost algoritması ile çalışmaktadır. Mantık olarak Haarcascade ile nesne tespiti yöntemine benzemektedir. Pozitif ve negatif batch'ler oluşturulup anlık tespitler gerçekleştirilir.

MIL (Multiple Instance Learning) tekniği Boosting ile oldukça benzemektedir. Farkı ise seçilen nesnenin etrafında hem pozitif hem negatif batch'ler oluşturur.

##### 2.2. KCF & CSRT

![](test/resim3.jpg)

KCF tekniğinde seçilen bölge merkezli olarak pek çok filtre oluşturularak takip işlemi gerçekleştirilir. Hızlı akan videolarda başarılıdır.

CSRT ise, KCF tekniğinin gelişmiş versiyonudur. Bu teknikte, yavaş videolarda başarılıdır.

##### 2.3. MedianFlow

![](test/resim4.png)

Nesnenin ilerlediği doğrultudaki birim yönün vektörü üzerinden bir tahmin gerçekleştirir.
Hızlı videolar için pek uygun değildir. Nesneyi takip etmek için nesnenin ardışık 2 kare arasındaki hareketinin farkını hesaplar.

##### 2.4. TLD

![](test/resim5.png)

TLD (Tracking Learning Detection) algoritması adından da anlaşılacağı üzere 3 aşamada çalışmaktadır.
- Tracking
- Learning 
- Detection


##### 2.5. MOSSE

En hızlı çalışan algoritmadır, corelation filter tekniğini kullanılır.
Girdi görüntüsüne birçok filtre uygulayarak bir çıktı üretir.

![](test/resim6.png)

##### 2.6. GOTURN

Deep learning tabanlı çalışır.

- current frame -- roi ---- conv layer -----fcn --- prediction

- previous frame -- roi --- conv layer------|

![](test/resim5.jpg)

Özetle;

- CSRT:  Yüksek doğruluk fakat yavaş
- KCF: Düşük doğruluk fakat hızlı
- MOSSE: En hızlısı

##### 2.7. MEANSHIFT & CAMSHIFT

Feature space analysis denen bir teknikle, renk tabanlı olarak komşu noktaları olasılıklarını belirler.


Meanshift iyileştirilmiş halidir. Adaptive BBox'lar kullanılır.

![](test/gif3.gif)

##### 2.8. OPTICAL FLOW

Optical flow, bir videodaki nesnelerin iki ardışı kare boyunca yaptığı hareketin yolunu ifade eden vektörler topluluğuna verilen addır. Bu vektörler 2 boyutludur ve nesnenin başlangıç noktasından bitiş noktasına doğrudur. 

Aşağıdaki örnekte bir topun 5 ardışık kare boyunca hareketi ve bu harekete bağlı oluşan yer değiştirme vektörü görülmektedir.

![](test/resim4.jpg)

![](test/gif1.gif)

Optical flow algoritmaları sparse ve dense olmak üzere ikiye ayrılmaktadır. 

Sparse yönteminde nesnelerin kenarları tespit edilip takibi yapılırken dense tekniğinde nesneler bir bütün olarak değerlendirilir.

![](test/gif2.gif)

#### Tekli Nesne Takibi

In [1]:
import cv2
print(cv2.__version__)

import sys
from random import randint

4.8.0


In [2]:
trackers = ["BOOSTING", "MIL", "KCF", "CSRT", "TLD", "MEDIANFLOW", "MOSSE"]

In [None]:
i = randint(0,6)
tracker_algorithm = trackers[i]

if tracker_algorithm == "BOOSTING":
    tracker = cv2.legacy.TrackerBoosting_create()
    print(tracker)
    
elif tracker_algorithm == "MIL":
    tracker = cv2.legacy.TrackerMIL_create()
    print(tracker)
    
elif tracker_algorithm == "KCF":
    tracker = cv2.legacy.TrackerKCF_create()    
    print(tracker)
    
elif tracker_algorithm == "CSRT":
    tracker = cv2.legacy.TrackerCSRT_create()   
    print(tracker)
    
elif tracker_algorithm == "TLD":
    tracker = cv2.legacy.TrackerTLD_create()  
    print(tracker)
    
elif tracker_algorithm == "MEDIANFLOW":
    tracker = cv2.legacy.TrackerMedianFlow_create()   
    print(tracker)
    
elif tracker_algorithm == "MOSSE":
    tracker = cv2.legacy.TrackerMOSSE_create()
    print(tracker)
    
else:
    print("[ERROR].. number out of index !")

In [None]:
cap = cv2.VideoCapture("test/videos/test.mp4")

ret, frame = cap.read()

if ret == False:
    print("[ERROR].. something went wrong when loading !")
elif ret == None:
    print("[ERROR].. wrong path !")
else:
    pass

box = cv2.selectROI(frame)
print("[INFO]... Box Coordinates: ", box)

ret = tracker.init(frame, box)
print("[INFO]... Return: ", ret)

color = (randint(0,255), randint(0,255), randint(0,255))
print("[INFO].. Color that geneated with randint method: ",color)

while True:
    ret, frame = cap.read()

    # KONTROL BLOĞU
    if ret == False:
        print("[ERROR].. something went wrong when loading !")
        break
    elif ret  == None:
        print("[ERROR].. wrong path !")
    else:
        pass
    
# ----------------------
    ret, box = tracker.update(frame)
    if ret == True:
        (x,y,w,h) = [int(i) for i in box]
        loc = (x,y,w,h)
        print("[INFO].. Location that calculated: ",loc)
    
        cv2.rectangle(frame, (x,y), (x+w, y+h), color, 2, 1)
        cv2.putText(frame, tracker_algorithm, (100,100), cv2.FONT_HERSHEY_SIMPLEX, 2, color, 2)
# -----------------------
    else:
        cv2.putText(frame, "..[ERROR]..", (100,100), cv2.FONT_HERSHEY_SIMPLEX, 2, color, 2)
# -----------------------
    
    cv2.imshow("Single Tracking", frame)
    if cv2.waitKey(10) & 0xFF == ord("q"):
        break
        
cap.release()
cv2.destroyAllWindows()

#### 2. Çoklu Nesne Takibi

In [None]:
import cv2
from random import randint

In [None]:
def createTracker(i):
    
    trackers = ["BOOSTING", "MIL", "KCF", "CSRT", "TLD", "MEDIANFLOW", "MOSSE"]
    tracker_algorithm = trackers[i]

    if tracker_algorithm == "BOOSTING":
        tracker = cv2.legacy.TrackerBoosting_create()

    elif tracker_algorithm == "MIL":
        tracker = cv2.legacy.TrackerMIL_create()

    elif tracker_algorithm == "KCF":
        tracker = cv2.legacy.TrackerKCF_create()    

    elif tracker_algorithm == "CSRT":
        tracker = cv2.legacy.TrackerCSRT_create()   

    elif tracker_algorithm == "TLD":
        tracker = cv2.legacy.TrackerTLD_create()  

    elif tracker_algorithm == "MEDIANFLOW":
        tracker = cv2.legacy.TrackerMedianFlow_create()   

    elif tracker_algorithm == "MOSSE":
        tracker = cv2.legacy.TrackerMOSSE_create()

    else:
        print("[ERROR].. number out of index !")
        
    return tracker

In [None]:
cap = cv2.VideoCapture("test/videos/test.mp4") 
ret, frame = cap.read()

if ret == False:
    print("[ERROR].. something went wrong when loading !")
elif ret == None:
    print("[ERROR].. wrong path !")
else:
    pass

boxes = []
colors = []

while True:
    box = cv2.selectROI("MultiTracker", frame)
    #print(box)
    boxes.append(box)
    
    color_generator = (randint(0,255), randint(0,255), randint(0,255))
    colors.append(color_generator)
        
    print("[INFO].. Press Q to start tracking")
    print("[INFO].. Press any key to select the next object")
        
    if cv2.waitKey(0) & 0xFF ==ord("q"):
        break
    
print("[INFO].. Boxes: ",boxes)
print("[INFO].. Colors: ",colors)

# trackers = ["BOOSTING", "MIL", "KCF", "CSRT", "TLD", "MEDIANFLOW", "MOSSE"]
tracker_index = 3 # CSRT
multi_tracker = cv2.legacy.MultiTracker_create()

for box in boxes:
    multi_tracker.add(createTracker(tracker_index), frame, box)

while True:
    ret, frame = cap.read()
    
    # KONTROL BLOĞU
    if ret == False:
        print("[ERROR].. something went wrong when loading !")
        break
    elif ret  == None:
        print("[ERROR].. wrong path !")
    else:
        pass
    
    ret, multiBoxes = multi_tracker.update(frame)
    
    for i, bbox in enumerate(multiBoxes):
        (x,y,w,h) = [int(j) for j in bbox]
        cv2.rectangle(frame, (x,y), (x+w, y+h), colors[i], 2)
        
    cv2.imshow("Multi Tracker", frame)
    if cv2.waitKey(1) & 0xFF == ord("q"):
        break
        
cap.release()
cv2.destroyAllWindows()

#### 3. Goturn Algoritması ile Nesne Takibi

In [None]:
import cv2
from random import randint

In [None]:
tracker = cv2.TrackerGOTURN_create()

cap = cv2.VideoCapture("test/videos/test.mp4")
ret, frame = cap.read()

box = cv2.selectROI(frame)
ret = tracker.init(frame, box)

color = (randint(0,255), randint(0,255), randint(0,255))

while True:
    
    ret, frame = cap.read()
    # KONTROL BLOĞU
    if ret == False:
        print("[ERROR].. something went wrong when loading !")
        break
    elif ret  == None:
        print("[ERROR].. wrong path !")
    else:
        pass
    
    ret1, box = tracker.update(frame)
    if ret1 == True:
        (x,y,w,h) = [int(j) for j in box]
        cv2.rectangle(frame, (x,y), (x+w, y+h), color, 2)
        
    else:
        cv2.putText(frame, "..[ERROR]..", (100,100), cv2.FONT_HERSHEY_SIMPLEX, 2, color, 2)
        
    cv2.putText(frame, "GOTURN", (100,100), cv2.FONT_HERSHEY_SIMPLEX, 2, color, 2)
    
    cv2.imshow("Goturn", frame)
    if cv2.waitKey(1) & 0xFF == ord("q"):
        break
        
cap.release()
cv2.destroyAllWindows()

#### 4. Nesne Tanıma & Nesne Takibi

In [None]:
import cv2
from random import randint

In [None]:
cap = cv2.VideoCapture("test/videos/walking.avi")
cascade = cv2.CascadeClassifier("test/cascade/fullbody.xml")

tracker = cv2.legacy.TrackerCSRT_create()
ret, frame = cap.read()

In [None]:
def detector():
    while True:
        ret, frame = cap.read()
        gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        detections = cascade.detectMultiScale(gray, minSize=(60,60))

        for (x,y,w,h) in detections:
            cv2.rectangle(frame, (x,y), (x+w), (y+h), (0,255,0), 2)
            cv2.imshow("Detection", frame)
            
            if x>0:
                return x, y, w, h

In [None]:
box = cv2.selectROI(frame)
ret = tracker.init(frame, box)

color = (randint(0,255), randint(0,255), randint(0,255))

while True:
    ret, frame = cap.read()
    # KONTROL BLOĞU
    if ret == False:
        print("[ERROR].. something went wrong when loading !")
        break
    elif ret  == None:
        print("[ERROR].. wrong path !")
    else:
        pass
    
    ret1, box = tracker.update(frame)
    
    if ret1 == True:
        (x,y,w,h) = [int(j) for j in box]
        cv2.rectangle(frame, (x,y), (x+w, y+h), color, 2)
        
    else:
        print("[INFO].. Tracker failed, detector is initializing !")
        box = detector()
        tracker = cv2.legacy.trackerTLD_create()
        tracker.init(frame, box)
        
    cv2.imshow("Tracking", frame)
    if cv2.waitKey(1) & 0xFF == ord("q"):
        break
        
cap.release()
cv2.destroyAllWindows()

#### 5. Meanshift ile Nesne Takibi

In [None]:
import cv2
import matplotlib.pyplot as plt

In [None]:
cap = cv2.VideoCapture("test/videos/test.mp4") # webcam için 0 (sıfır)
ret, frame = cap.read()

box = cv2.selectROI(frame)
x, y, w, h = box
#print(x, y, w, h)
tracking_rectangle = (x, y, w, h)

roi = frame[y:y+h, x:x+w]
cv2.imshow("roi",roi)
#cv2.waitKey(0)
#cv2.destroyAllWindows()

hsv = cv2.cvtColor(roi, cv2.COLOR_BGR2HSV)
#cv2.imshow("hsv",hsv)
#cv2.waitKey(0)
#cv2.destroyAllWindows()

hist = cv2.calcHist([hsv], [0], None, [180], [0,180])
plt.hist(roi.ravel(), 180, [0,180])
#plt.show()

hist = cv2.normalize(hist, hist, 0, 255, cv2.NORM_MINMAX)
parameter = (cv2.TERM_CRITERIA_EPS | cv2.TERM_CRITERIA_COUNT, 10, 1)

while True:
    ret, frame = cap.read()
    if ret == False:
        break
        
    hsv_frame = cv2.cvtColor(frame, cv2.COLOR_BGR2HSV)
    
    dst = cv2.calcBackProject([hsv_frame], [0], hist, [0,180], 1)
    ret, tracking_rectangle = cv2.meanShift(dst, (x,y,w,h), parameter)
    
    (x,y,w,h) = tracking_rectangle
    cv2.rectangle(frame, (x,y), (x+w,y+h), (0,255,0),  2)
    
    cv2.imshow("MeanShift", frame)
    cv2.imshow("DST", dst)
    
    if cv2.waitKey(100) & 0xFF == ord("q"):
        break
        
cap.release()
cv2.destroyAllWindows()


#### 6. CAMShift ile Nesne Takibi

In [None]:
import cv2
import numpy as np
import matplotlib.pyplot as plt

In [None]:
cap = cv2.VideoCapture("test/videos/walking.avi") # webcam için 0 (sıfır)
ret, frame = cap.read()

box = cv2.selectROI(frame)
x, y, w, h = box
#print(x, y, w, h)
tracking_rectangle = (x, y, w, h)

roi = frame[y:y+h, x:x+w]
cv2.imshow("roi",roi)
#cv2.waitKey(0)
#cv2.destroyAllWindows()

hsv = cv2.cvtColor(roi, cv2.COLOR_BGR2HSV)
#cv2.imshow("hsv",hsv)
#cv2.waitKey(0)
#cv2.destroyAllWindows()

hist = cv2.calcHist([hsv], [0], None, [180], [0,180])
hist = cv2.normalize(hist, hist, 0, 255, cv2.NORM_MINMAX)
parameter = (cv2.TERM_CRITERIA_EPS | cv2.TERM_CRITERIA_COUNT, 10, 1)

while True:
    ret, frame = cap.read()
    if ret == False:
        break
        
    hsv_frame = cv2.cvtColor(frame, cv2.COLOR_BGR2HSV)
    dst = cv2.calcBackProject([hsv_frame], [0], hist, [0,180], 1)
    
    ret, tracking_rectangle = cv2.CamShift(dst, (x,y,w,h), parameter)
    
    points = cv2.boxPoints(ret)
    points = np.int0(points)
    
    img = cv2.polylines(frame, [points], True, 255, 2)
    
    cv2.imshow("CamShift", img)
    
    if cv2.waitKey(100) & 0xFF == ord("q"):
        break
        
cap.release()
cv2.destroyAllWindows()