بخش 1: بارگیری کتابخانه‌ها

In [6]:

import os
import urllib.request
from PIL import Image
import torch
from torchvision import transforms, models
import locale 
import re


شرح:

این بخش کتابخانه‌های لازم برای پردازش تصویر، یادگیری عمیق و ارزیابی مدل را بارگیری می‌کند.

کتابخانه‌ها:

os: برای کار با سیستم عامل
urllib.request: برای دانلود فایل‌ها
PIL: برای پردازش تصاویر
torch: برای یادگیری عمیق
torchvision: برای بینایی رایانه
locale: برای تنظیم رمزگذاری
re: برای عبارات منظم

بخش 2: تنظیم مسیر پوشه تصاویر

In [7]:
image_folder = "car"

شرح:

این بخش مسیر پوشه حاوی تصاویر ماشین را تنظیم می‌کند. شما باید این مسیر را با توجه به محل ذخیره‌سازی تصاویر خود تغییر دهید.
ImageNet

بخش 3: دانلود برچسب‌های کلاس 


In [8]:
url = "https://raw.githubusercontent.com/joe-papa/pytorch-book/main/files/imagenet_class_labels.txt"
fpath = 'imagenet_class_labels.txt'
urllib.request.urlretrieve(url, fpath)


('imagenet_class_labels.txt', <http.client.HTTPMessage at 0x1a6be29a650>)

شرح:

این بخش برچسب‌های کلاس ImageNet را از URL مشخص‌شده دانلود می‌کند و در فایل imagenet_class_labels.txt ذخیره می‌کند.

ImageNet

بخش 4: بارگیری برچسب‌های کلاس 

In [4]:
with open('imagenet_class_labels.txt') as f:
    classes = [line.strip() for line in f.readlines()]


شرح:

این بخش برچسب‌های کلاس ImageNet را از فایل imagenet_class_labels.txt بارگیری می‌کند و در لیست classes ذخیره می‌کند.

بخش 5: تعریف تبدیلات تصویر

In [9]:
transform = transforms.Compose([
  transforms.Resize(256),
  transforms.CenterCrop(224),
  transforms.ToTensor(),
  transforms.Normalize(
  mean=[0.485, 0.456, 0.406],
  std=[0.229, 0.224, 0.225])])


شرح:

این بخش تبدیلات تصویر را برای پیش‌پردازش تصاویر قبل از ورود به مدل تعریف می‌کند.

تبدیلات:

Resize(256): تصویر را به اندازه 256x256 تغییر اندازه می‌دهد.
CenterCrop(224): یک برش 224x224 از مرکز تصویر را استخراج می‌کند.
ToTensor(): تصویر را به یک تانسور PyTorch تبدیل می‌کند.
Normalize(): تصویر را با استفاده از میانگین و انحراف معیار استاندارد ImageNet نرمال می‌کند.
AlexNet

بخش 6: بارگیری مدل 


In [10]:
model = models.alexnet(weights=models.AlexNet_Weights.DEFAULT)

شرح:

این بخش مدل AlexNet را با استفاده از torchvision.models بارگیری می‌کند.

آرگومان‌ها:

weights=models.AlexNet_Weights.DEFAULT: مدل را با پارامترهای پیش‌آموزش‌شده ImageNet بارگیری می‌کند.


بخش 7: تعریف تابع پیش‌بینی


In [11]:
def predict(img_path):

    img = Image.open(img_path)


    img_tensor = transform(img)

    batch = torch.unsqueeze(img_tensor, 0)


    model.eval()

    y = model(batch)

    return torch.argmax(y, dim=1).item()


با کمال میل! شرح کامل کد را برای شما در ادامه ارائه می‌کنم:

بخش 8: ارزیابی مدل روی تصاویر ماشین

In [12]:
correct = 0
total = 0
for filename in os.listdir(image_folder):
 img_path = os.path.join(image_folder, filename)

prediction = predict(img_path)

true_label = classes[prediction]

if re.search("car", true_label):
 correct += 1

 total += 1


شرح:

این بخش مدل را روی تصاویر موجود در پوشه image_folder ارزیابی می‌کند. برای هر تصویر:

مسیر تصویر با استفاده از os.path.join دریافت می‌شود.
کلاس تصویر با استفاده از تابع predict پیش‌بینی می‌شود.
برچسب واقعی تصویر با استفاده از لیست classes و شاخص پیش‌بینی‌شده (prediction) استخراج می‌شود.
اگر پیش‌بینی صحیح باشد، تعداد correct افزایش می‌یابد.
تعداد کل تصاویر (total) افزایش می‌یابد.


بخش 9: محاسبه دقت

In [13]:
accuracy = (correct / total) * 100

شرح:

این بخش دقت مدل را با استفاده از تقسیم تعداد پیش‌بینی‌های صحیح (correct) بر تعداد کل تصاویر (total) و ضرب در 100 محاسبه می‌کند.

بخش 10: چاپ دقت

In [14]:
print(f"accuracy: {accuracy:.2f}%")

accuracy: 100.00%


شرح:

این بخش دقت مدل را با دو رقم اعشار چاپ می‌کند.