## Mini Project #5 - Object Detection using SIFT

In [None]:
import cv2
import numpy as np


def sift_detector(new_image, image_template):
    # Function that compares input image to template
    # It then returns the number of SIFT matches between them
    
    image1 = cv2.cvtColor(new_image, cv2.COLOR_BGR2GRAY)
    image2 = image_template
    
    # Create SIFT detector object
    sift = cv2.SIFT()

    # Obtain the keypoints and descriptors using SIFT
    keypoints_1, descriptors_1 = sift.detectAndCompute(image1, None)
    keypoints_2, descriptors_2 = sift.detectAndCompute(image2, None)

    # Define parameters for our Flann Matcher
    FLANN_INDEX_KDTREE = 0
    index_params = dict(algorithm = FLANN_INDEX_KDTREE, trees = 3)
    search_params = dict(checks = 100)

    # Create the Flann Matcher object
    flann = cv2.FlannBasedMatcher(index_params, search_params)

    # Obtain matches using K-Nearest Neighbor Method
    # the result 'matchs' is the number of similar matches found in both images
    matches = flann.knnMatch(descriptors_1, descriptors_2, k=2)

    # Store good matches using Lowe's ratio test
    good_matches = []
    for m,n in matches:
        if m.distance < 0.7 * n.distance:
            good_matches.append(m) 

    return len(good_matches)


cap = cv2.VideoCapture(0)

# Load our image template, this is our reference image
image_template = cv2.imread('images/box_in_scene.png', 0) 

while True:

    # Get webcam images
    ret, frame = cap.read()

    # Get height and width of webcam frame
    height, width = frame.shape[:2]

    # Define ROI Box Dimensions
    top_left_x = width / 3
    top_left_y = (height / 2) + (height / 4)
    bottom_right_x = (width / 3) * 2
    bottom_right_y = (height / 2) - (height / 4)
    
    # Draw rectangular window for our region of interest   
    cv2.rectangle(frame, (top_left_x,top_left_y), (bottom_right_x,bottom_right_y), 255, 3)
    
    # Crop window of observation we defined above
    cropped = frame[bottom_right_y:top_left_y , top_left_x:bottom_right_x]
    
    # Flip frame orientation horizontally
    frame = cv2.flip(frame,1)
    
    # Get number of SIFT matches
    matches = sift_detector(cropped, image_template)

    # Display status string showing the current no. of matches 
    cv2.putText(frame,str(matches),(450,450), cv2.FONT_HERSHEY_COMPLEX, 2,(0,255,0),1)
    
    # Our threshold to indicate object deteciton
    # We use 10 since the SIFT detector returns little false positves
    threshold = 10
    
    # If matches exceed our threshold then object has been detected
    if matches > threshold:
        cv2.rectangle(frame, (top_left_x,top_left_y), (bottom_right_x,bottom_right_y), (0,255,0), 3)
        cv2.putText(frame,'Object Found',(50,50), cv2.FONT_HERSHEY_COMPLEX, 2 ,(0,255,0), 2)
    
    cv2.imshow('Object Detector using SIFT', frame)
    if cv2.waitKey(1) == 13: #13 is the Enter Key
        break

cap.release()
cv2.destroyAllWindows()   

این کد یک سیستم تشخیص شیء با استفاده از الگوریتم SIFT و OpenCV پیاده‌سازی می‌کند. در ادامه توضیح بخش‌های مختلف کد آورده شده است:سیستم تشخیص شیء با استفاده از الگوریتم SIFT و OpenCV پیاده‌سازی می‌کند. در ادامه توضیح بخش‌های مختلف کد آورده شده است:

- ابتدا کتابخانه‌های مورد نیاز (`cv2` و `numpy`) وارد می‌شوند.- ابتدا کتابخانه‌های مورد نیاز (`cv2` و `numpy`) وارد می‌شوند.
- تابع `sift_detector` دو تصویر را دریافت می‌کند و تعداد نقاط کلیدی مشابه بین آن‌ها را با استفاده از الگوریتم SIFT محاسبه می‌کند.- تابع `sift_detector` دو تصویر را دریافت می‌کند و تعداد نقاط کلیدی مشابه بین آن‌ها را با استفاده از الگوریتم SIFT محاسبه می‌کند.
    - تصاویر به خاکستری تبدیل می‌شوند.
    - شیء SIFT ساخته می‌شود و نقاط کلیدی و توصیف‌گرها استخراج می‌شوند.ا استخراج می‌شوند.
    - با استفاده از Flann Matcher، نقاط کلیدی مشابه بین دو تصویر پیدا می‌شوند.ویر پیدا می‌شوند.
    - با استفاده از تست Lowe، فقط تطابق‌های خوب نگه داشته می‌شوند.- با استفاده از تست Lowe، فقط تطابق‌های خوب نگه داشته می‌شوند.
    - تعداد تطابق‌های خوب بازگردانده می‌شود.
- دوربین وبکم فعال می‌شود و تصویر مرجع (template) بارگذاری می‌شود. تصویر مرجع (template) بارگذاری می‌شود.
- در یک حلقه بی‌نهایت: یک حلقه بی‌نهایت:
    - تصویر جدید از وبکم خوانده می‌شود.ی‌شود.
    - ابعاد تصویر گرفته می‌شود و یک ناحیه ROI (مستطیل) در تصویر مشخص می‌شود.ته می‌شود و یک ناحیه ROI (مستطیل) در تصویر مشخص می‌شود.
    - این ناحیه برش داده می‌شود.    - این ناحیه برش داده می‌شود.
    - تصویر افقی برعکس می‌شود.
    - تعداد تطابق‌های SIFT بین ناحیه برش‌خورده و تصویر مرجع محاسبه می‌شود.ی‌شود.
    - تعداد تطابق‌ها روی تصویر نمایش داده می‌شود.
    - اگر تعداد تطابق‌ها از یک آستانه (۱۰) بیشتر باشد، شیء شناسایی شده و مستطیل سبز و متن "Object Found" نمایش داده می‌شود.    - اگر تعداد تطابق‌ها از یک آستانه (۱۰) بیشتر باشد، شیء شناسایی شده و مستطیل سبز و متن "Object Found" نمایش داده می‌شود.
    - تصویر خروجی نمایش داده می‌شود و با فشردن کلید Enter حلقه متوقف می‌شود.ن کلید Enter حلقه متوقف می‌شود.
- در پایان، دوربین و پنجره‌ها آزاد و بسته می‌شوند.‌ها آزاد و بسته می‌شوند.

این کد برای شناسایی یک شیء خاص در تصویر زنده وبکم با استفاده از ویژگی‌های SIFT کاربرد دارد.ر زنده وبکم با استفاده از ویژگی‌های SIFT کاربرد دارد.


## Object Detection using ORB

In [None]:
import cv2
import numpy as np


def ORB_detector(new_image, image_template):
    # Function that compares input image to template
    # It then returns the number of ORB matches between them
    
    image1 = cv2.cvtColor(new_image, cv2.COLOR_BGR2GRAY)

    # Create ORB detector with 1000 keypoints with a scaling pyramid factor of 1.2
    orb = cv2.ORB(1000, 1.2)

    # Detect keypoints of original image
    (kp1, des1) = orb.detectAndCompute(image1, None)

    # Detect keypoints of rotated image
    (kp2, des2) = orb.detectAndCompute(image_template, None)

    # Create matcher 
    # Note we're no longer using Flannbased matching
    bf = cv2.BFMatcher(cv2.NORM_HAMMING, crossCheck=True)

    # Do matching
    matches = bf.match(des1,des2)

    # Sort the matches based on distance.  Least distance
    # is better
    matches = sorted(matches, key=lambda val: val.distance)

    return len(matches)

cap = cv2.VideoCapture(0)

# Load our image template, this is our reference image
image_template = cv2.imread('images/box_in_scene.png', 0) 
# image_template = cv2.imread('images/kitkat.jpg', 0) 

while True:

    # Get webcam images
    ret, frame = cap.read()
    
    # Get height and width of webcam frame
    height, width = frame.shape[:2]

    # Define ROI Box Dimensions (Note some of these things should be outside the loop)
    top_left_x = width / 3
    top_left_y = (height / 2) + (height / 4)
    bottom_right_x = (width / 3) * 2
    bottom_right_y = (height / 2) - (height / 4)
    
    # Draw rectangular window for our region of interest
    cv2.rectangle(frame, (top_left_x,top_left_y), (bottom_right_x,bottom_right_y), 255, 3)
    
    # Crop window of observation we defined above
    cropped = frame[bottom_right_y:top_left_y , top_left_x:bottom_right_x]

    # Flip frame orientation horizontally
    frame = cv2.flip(frame,1)
    
    # Get number of ORB matches 
    matches = ORB_detector(cropped, image_template)
    
    # Display status string showing the current no. of matches 
    output_string = "Matches = " + str(matches)
    cv2.putText(frame, output_string, (50,450), cv2.FONT_HERSHEY_COMPLEX, 2, (250,0,150), 2)
    
    # Our threshold to indicate object deteciton
    # For new images or lightening conditions you may need to experiment a bit 
    # Note: The ORB detector to get the top 1000 matches, 350 is essentially a min 35% match
    threshold = 350
    
    # If matches exceed our threshold then object has been detected
    if matches > threshold:
        cv2.rectangle(frame, (top_left_x,top_left_y), (bottom_right_x,bottom_right_y), (0,255,0), 3)
        cv2.putText(frame,'Object Found',(50,50), cv2.FONT_HERSHEY_COMPLEX, 2 ,(0,255,0), 2)
    
    cv2.imshow('Object Detector using ORB', frame)
    
    if cv2.waitKey(1) == 13: #13 is the Enter Key
        break

cap.release()
cv2.destroyAllWindows()   

این کد یک سیستم تشخیص شیء با استفاده از الگوریتم ORB و OpenCV پیاده‌سازی می‌کند. در ادامه بخش‌های مختلف کد توضیح داده شده است:سیستم تشخیص شیء با استفاده از الگوریتم ORB و OpenCV پیاده‌سازی می‌کند. در ادامه بخش‌های مختلف کد توضیح داده شده است:

- ابتدا کتابخانه‌های مورد نیاز (`cv2` و `numpy`) وارد می‌شوند.- ابتدا کتابخانه‌های مورد نیاز (`cv2` و `numpy`) وارد می‌شوند.
- تابع `ORB_detector` دو تصویر را دریافت می‌کند و تعداد نقاط کلیدی مشابه بین آن‌ها را با استفاده از الگوریتم ORB محاسبه می‌کند:- تابع `ORB_detector` دو تصویر را دریافت می‌کند و تعداد نقاط کلیدی مشابه بین آن‌ها را با استفاده از الگوریتم ORB محاسبه می‌کند:
    - تصویر ورودی به خاکستری تبدیل می‌شود.
    - یک شیء ORB با ۱۰۰۰ نقطه کلیدی ساخته می‌شود.
    - نقاط کلیدی و توصیف‌گرها برای هر دو تصویر استخراج می‌شوند.ند.
    - یک BFMatcher با معیار Hamming ساخته می‌شود.- یک BFMatcher با معیار Hamming ساخته می‌شود.
    - تطابق بین توصیف‌گرها انجام و بر اساس فاصله مرتب می‌شود.‌شود.
    - تعداد تطابق‌ها بازگردانده می‌شود.    - تعداد تطابق‌ها بازگردانده می‌شود.
- دوربین وبکم فعال می‌شود و تصویر مرجع (template) بارگذاری می‌شود.
- در یک حلقه بی‌نهایت:
    - تصویر جدید از وبکم خوانده می‌شود.    - تصویر جدید از وبکم خوانده می‌شود.
    - ابعاد تصویر گرفته می‌شود و یک ناحیه ROI (مستطیل) در تصویر مشخص می‌شود.ه ROI (مستطیل) در تصویر مشخص می‌شود.
    - این ناحیه برش داده می‌شود.
    - تصویر افقی برعکس می‌شود.    - تصویر افقی برعکس می‌شود.
    - تعداد تطابق‌های ORB بین ناحیه برش‌خورده و تصویر مرجع محاسبه می‌شود.‌خورده و تصویر مرجع محاسبه می‌شود.
    - تعداد تطابق‌ها روی تصویر نمایش داده می‌شود.
    - اگر تعداد تطابق‌ها از یک آستانه (۳۵۰) بیشتر باشد، شیء شناسایی شده و مستطیل سبز و متن "Object Found" نمایش داده می‌شود.    - اگر تعداد تطابق‌ها از یک آستانه (۳۵۰) بیشتر باشد، شیء شناسایی شده و مستطیل سبز و متن "Object Found" نمایش داده می‌شود.
    - تصویر خروجی نمایش داده می‌شود و با فشردن کلید Enter حلقه متوقف می‌شود.یش داده می‌شود و با فشردن کلید Enter حلقه متوقف می‌شود.
- در پایان، دوربین و پنجره‌ها آزاد و بسته می‌شوند.

این کد برای شناسایی یک شیء خاص در تصویر زنده وبکم با استفاده از ویژگی‌های ORB کاربرد دارد.این کد برای شناسایی یک شیء خاص در تصویر زنده وبکم با استفاده از ویژگی‌های ORB کاربرد دارد.
