# تمرین سری هفتم
object detection on **Pascal VOC** using **Fast R-CNN**

## هدف
 یادگیری استفاده از الگوریتم Fast R-CNN برای وظایف شناسایی اشیا.


# در پایان این تمرین، شما قادر خواهید بود یک مدل Fast R-CNN آموزش دهید و از آن برای شناسایی اشیا در تصاویر استفاده کنید.

------------------------------------------------------

# بخش اول


راه اندازی محیط

In [None]:
# نصب کتابخانه‌های مورد نیاز
!pip install tensorflow opencv-python matplotlib

In [None]:
import tensorflow as tf
import numpy as np
import cv2
import matplotlib.pyplot as plt
import os
import xml.etree.ElementTree as ET



# بخش دوم



آماده سازی داده

دانلود مجموعه داده
**Pascal VOC**  
و آماده سازی آن.

 آماده‌سازی مجموعه داده با تبدیل حاشیه‌نویسی‌ها به فرمت مورد نیاز (جعبه‌های مرزی و برچسب‌های کلاس).

In [None]:
def load_pascal_voc_dataset(data_path):
    """
    بارگذاری مجموعه داده Pascal VOC و آماده‌سازی آن.

    ورودی‌ها:
    - data_path (str): مسیر دایرکتوری که مجموعه داده در آن قرار دارد.

    خروجی‌ها:
    - images (list of str): لیست مسیرهای تصاویر.
    - bboxes (list of list): لیست جعبه‌های مرزی برای هر تصویر.
    - labels (list of list): لیست برچسب‌ها برای هر تصویر.
    """
    images = []
    bboxes = []
    labels = []
    for root, _, files in os.walk(data_path):
        for file in files:
            if file.endswith('.xml'):
                tree = ET.parse(os.path.join(root, file))
                root = tree.getroot()
                filename = root.find('filename').text
                image_path = os.path.join(root.find('folder').text, filename)
                images.append(image_path)
                boxes = []
                lbls = []
                for obj in root.findall('object'):
                    bbox = obj.find('bndbox')
                    box = [
                        int(bbox.find('xmin').text),
                        int(bbox.find('ymin').text),
                        int(bbox.find('xmax').text),
                        int(bbox.find('ymax').text)
                    ]
                    boxes.append(box)
                    lbls.append(obj.find('name').text)
                bboxes.append(boxes)
                labels.append(lbls)
    return images, bboxes, labels

data_path = '/path/to/VOCdevkit/VOC2012'  # مسیر خود را به مجموعه داده Pascal VOC تنظیم کنید
images, bboxes, labels = load_pascal_voc_dataset(data_path)



# بخش سوم


بارگزاری و نمایش مجموعه داده ها

In [None]:
#TODO: نوشتن تابع برای نمایش تصاویر و جعبه‌های مرزی آن‌ها
def visualize_image_with_bboxes(image_path, bboxes, labels=None):
    """
    نمایش یک تصویر با جعبه‌های مرزی.

    ورودی‌ها:
    - image_path (str): مسیر فایل تصویر.
    - bboxes (list of list): لیست جعبه‌های مرزی، هرکدام به صورت [xmin, ymin, xmax, ymax].
    - labels (list of str, اختیاری): لیست برچسب‌ها که متناظر با جعبه‌های مرزی هستند.

    خروجی‌ها:
    - هیچکدام: تصویر با جعبه‌های مرزی نمایش داده می‌شود.
    """
    image = cv2.imread(image_path)
    for i, bbox in enumerate(bboxes):
        cv2.rectangle(image, (bbox[0], bbox[1]), (bbox[2], bbox[3]), (0, 255, 0), 2)
        if labels:
            cv2.putText(image, labels[i], (bbox[0], bbox[1]-10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2)
    plt.imshow(cv2.cvtColor(image, cv2.COLOR_BGR2RGB))
    plt.axis('off')
    plt.show()

# نمایش نمونه‌ای از داده‌ها
visualize_image_with_bboxes(images[0], bboxes[0], labels[0])



# مرحله 4


آماده سازی مدل

بارگذاری یک مدل پیش‌آموزش دیده

***Fast R-CNN***

از مدل

***zoo***

در


***tensorflow***

In [None]:
# مرحله 4: آماده‌سازی مدل
#  از مدل زو TensorFlow (Fast R-CNN می‌تواند به روشی مشابه استفاده شود).

# TODO: نوشتن تابع برای بارگذاری یک مدل Faster R-CNN پیش‌آموزش دیده
def load_pretrained_model():
    """
    بارگذاری یک مدل Faster R-CNN پیش‌آموزش دیده از مدل زو TensorFlow.

    خروجی‌ها:
    - model: مدل Faster R-CNN پیش‌آموزش دیده.
    """
    # دانشجویان باید این قسمت را تکمیل کنند
    pass

model = load_pretrained_model()

# مرحله ششم

استنتاج

نوشتن تابع برای انجام استنتاج بر روی یک تصویر با استفاده از مدل


***Faster R-CNN.***

In [None]:
# TODO: نوشتن تابع برای پیش‌پردازش تصویر برای استنتاج مدل
def preprocess_image(image_path):
    """
    پیش‌پردازش یک تصویر برای استنتاج مدل.

    ورودی‌ها:
    - image_path (str): مسیر فایل تصویر.

    خروجی‌ها:
    - input_image (آرایه numpy): تصویر پیش‌پردازش شده آماده برای ورودی مدل.
    - original_image (آرایه numpy): تصویر اصلی برای نمایش.
    """
    # دانشجویان باید این قسمت را تکمیل کنند
    pass

In [None]:
# TODO: نوشتن تابع برای شناسایی اشیا
def detect_objects(model, image_path, threshold=0.5):
    """
    شناسایی اشیا در یک تصویر با استفاده از یک مدل پیش‌آموزش دیده.

    ورودی‌ها:
    - model: مدل پیش‌آموزش دیده.
    - image_path (str): مسیر فایل تصویر.
    - threshold (شناور): آستانه شناسایی.

    خروجی‌ها:
    - هیچکدام: تصویر با جعبه‌های مرزی شناسایی شده نمایش داده می‌شود.
    """
    # دانشجویان باید این قسمت را تکمیل کنند
    pass

# دانشجویان باید 'path_to_your_image.jpg' را با یک مسیر تصویر واقعی جایگزین کنند
detect_objects(model, images[0])

# مرحله هفتم

ارزیابی

In [None]:
# TODO:  نوشتن تابع ارزیابی مدل با استفاده از معیار های خواسته شده
def evaluate_model(model, dataset):
    """
    ارزیابی عملکرد مدل بر روی یک مجموعه اعتبارسنجی.

    ورودی‌ها:
    - model: مدل آموزش دیده.
    - dataset: مجموعه داده اعتبارسنجی.

    خروجی‌ها:
    - metrics: دیکشنری حاوی معیارهای ارزیابی مانند میانگین دقت متوسط (mAP).
    """
    # دانشجویان باید این قسمت را تکمیل کنند
    pass

