<p dir="rtl">
برای استفاده از خودِ <b>PyTorch</b>، یعنی همه‌ی امکانات اصلی مثل ساخت <b>Tensor</b>‌ها و اجرای عملیات روی <b>GPU/CPU</b>
</p>

In [1]:
import torch 

<p dir="rtl">
این خط برای وارد کردن <b>torch.nn</b> است؛ 
کتابخانه‌ای که اجازه می‌دهد لایه‌های شبکه عصبی مانند <b>Conv2d</b> و <b>Pooling</b> را بسازیم.
</p>

In [2]:
import torch.nn as nn

<p dir="rtl">
این خط برای وارد کردن <b>torch.nn.functional</b> است؛
که توابع آماده مانند <b>ReLU</b>، <b>softmax</b> و سایر عملیات ریاضی روی لایه‌ها را فراهم می‌کند.
</p>


In [3]:
import torch.nn.functional as F

<p dir="rtl">
این خط برای وارد کردن <b>torch.optim</b> است؛
که به ما اجازه می‌دهد بهینه‌سازهایی مانند <b>SGD</b> و <b>Adam</b> را برای بروزرسانی وزن‌ها استفاده کنیم.
</p>


In [4]:
import torch.optim as optim

<p dir="rtl">
این خط برای وارد کردن <b>torchvision</b> است؛
کتابخانه‌ای که دیتاست‌ها و ترنسفورم‌های آماده تصاویر مانند <b>MNIST</b> و <b>CIFAR</b> را فراهم می‌کند.
</p>


In [5]:
import torchvision

<p dir="rtl">
این خط برای وارد کردن <b>torchvision.transforms</b> است؛
که امکان انجام تبدیل‌ها و پیش‌پردازش تصاویر مانند <b>Resize</b>، <b>Normalize</b> و تبدیل به <b>Tensor</b> را فراهم می‌کند.
</p>

In [6]:
import torchvision.transforms as transforms

<p dir="rtl">
این خط برای تعریف یک کلاس <b>CNN</b> ساده است.
سازنده <b>__init__</b> آماده می‌شود تا بتوانیم لایه‌ها را در آن اضافه کنیم.
</p>


<p dir="rtl">
استفاده از <b>super()</b> در اینجا برای فراخوانی سازنده کلاس پایه <b>nn.Module</b> است.
این کار لازم است تا <b>CNN</b> ما بتواند تمام امکانات داخلی <b>nn.Module</b> مانند مدیریت پارامترها و ثبت لایه‌ها را داشته باشد.
بدون <b>super()</b> ممکن است شبکه بدرستی عمل نکند یا خطا بدهد.
</p>

In [7]:
class SimpleCNN(nn.Module): #1
    def __init__(self): #1
        super(SimpleCNN, self).__init__() #1
        # Conv layer
        self.conv1 = nn.Conv2d( #2
            in_channels=1,  #2
            out_channels=16, #2
            kernel_size=3, #2
            stride=1, #2
            padding=1 #2
        ) #2
        self.relu = nn.ReLU() #3
        self.pool = nn.MaxPool2d(kernel_size=2, stride=2) #5
        self.conv2 = nn.Conv2d( #7
            in_channels=16,  #7
            out_channels=32,  #7
            kernel_size=3,  #7
            stride=1,  #7
            padding=1 #7
        ) #7
        self.relu = nn.ReLU() #7
        self.pool2 = nn.MaxPool2d(kernel_size=2, stride=2) #9
        # Dense layer
        self.fc1 = nn.Linear(32 * 7 * 7, 128) #11
        self.relu_fc1 = nn.ReLU() #12
        self.fc2 = nn.Linear(128, 10) #13


    def forward(self, x): #4
        x = self.conv1(x) #4
        x = self.relu(x) #4
        x = self.pool(x) #6
        x = self.conv2(x) #8
        x = self.relu(x) #8
        x = self.pool2(x) #10
        x = torch.flatten(x, 1) #11
        x = self.fc1(x) #11
        x = self.relu_fc1(x) #11
        x = self.fc2(x) #14
        return x #4


## self.conv1 = nn.Conv2d(...)

<p dir="rtl">
این خط یک لایه <b>Conv2d</b> اول در <b>CNN</b> ایجاد می‌کند.
- <b>in_channels=1</b> : تعداد کانال‌های ورودی (مثلاً تصاویر سیاه‌وسفید)  
- <b>out_channels=16</b> : تعداد فیلترهای خروجی  
- <b>kernel_size=3</b> : اندازه کرنل 3×3  
- <b>stride=1</b> : گام حرکت کرنل  
- <b>padding=1</b> : اضافه کردن لبه‌ها برای حفظ ابعاد
</p>


<p dir="rtl">
تعداد <b>out_channels=16</b> در لایه اول <b>Conv2d</b> یک انتخاب متداول و منطقی است.  
- هر فیلتر (کانال خروجی) یک ویژگی خاص تصویر را استخراج می‌کند، پس با 16 فیلتر، شبکه می‌تواند 16 ویژگی مختلف را یاد بگیرد.  
- اگر تعداد فیلترها کمتر باشد (مثلاً 4 یا 8)، ممکن است شبکه نتواند جزئیات تصویر را به خوبی تشخیص دهد.  
- اگر تعداد فیلترها خیلی زیاد باشد (مثلاً 64 یا 128)، حجم محاسبات و مصرف حافظه افزایش می‌یابد و برای لایه‌های ابتدایی معمولاً لازم نیست اینقدر فیلتر داشته باشیم.  
بنابراین 16 یک تعادل مناسب بین <b>قدرت استخراج ویژگی</b> و <b>کارایی محاسباتی</b> ایجاد می‌کند و انتخاب رایجی برای لایه اول CNN است.
</p>



<p dir="rtl">
اندازه <b>kernel_size=3</b> یعنی فیلتر 3×3 روی تصویر اعمال می‌شود.  
- فیلتر 3×3 یک انتخاب متداول در CNNهاست زیرا به اندازه کافی کوچک است تا جزئیات محلی تصویر را بگیرد،  
و همزمان محاسبات زیادی نیاز ندارد.  
- اندازه بزرگتر (مثلاً 5×5 یا 7×7) ویژگی‌های وسیع‌تر را می‌گیرد ولی محاسبات سنگین‌تر می‌شود و ممکن است جزئیات ریز را از دست بدهد.  
- بنابراین <b>3×3</b> تعادل خوبی بین دقت و کارایی محاسباتی ایجاد می‌کند و در اکثر شبکه‌ها استفاده می‌شود.
</p>


<p dir="rtl">
پارامتر <b>stride=1</b> مشخص می‌کند فیلتر <b>Conv2d</b> در هر حرکت فقط یک پیکسل به جلو برود.  
- با <b>stride=1</b> تصویر خروجی تقریباً همان ابعاد ورودی را حفظ می‌کند (به شرط اینکه padding مناسب باشد).  
- اگر stride بزرگتر باشد (مثلاً 2 یا 3)، اندازه خروجی کاهش می‌یابد و اطلاعات محلی جزئی از بین می‌رود.  
- بنابراین <b>stride=1</b> انتخاب رایج در لایه‌های ابتدایی CNN است تا جزئیات تصویر حفظ شود.
</p>


<p dir="rtl">
پارامتر <b>padding=1</b> مشخص می‌کند که اطراف تصویر <b>یک لایه صفر</b> اضافه شود.  
- این کار باعث می‌شود بعد از اعمال <b>Conv2d</b>، ابعاد تصویر تقریباً همانند ورودی باقی بماند.  
- بدون padding، اندازه تصویر خروجی کوچک‌تر می‌شود و لبه‌های تصویر کمتر در فرآیند یادگیری در نظر گرفته می‌شوند.  
- بنابراین <b>padding=1</b> تعادل خوبی بین حفظ ابعاد و استخراج ویژگی‌ها ایجاد می‌کند و در لایه‌های ابتدایی CNN معمولاً استفاده می‌شود.
</p>


## self.relu = nn.ReLU()

<p dir="rtl">
این خط یک <b>تابع فعال‌سازی ReLU</b> برای <b>CNN</b> ایجاد می‌کند.
ReLU به شبکه اجازه می‌دهد تا <b>غیرخطی بودن</b> داشته باشد و یادگیری ویژگی‌ها بهتر انجام شود.
</p>


<p dir="rtl">
همیشه بعد از هر لایه <b>Conv2d</b> لازم نیست تابع فعال‌سازی گذاشته شود،  
اما معمولاً در اکثر شبکه‌های CNN بعد از لایه پیچشی یک تابع فعال‌سازی مانند <b>ReLU</b> قرار می‌دهند.  
- هدف این است که شبکه <b>غیرخطی</b> شود و بتواند ویژگی‌های پیچیده‌تر تصویر را یاد بگیرد.  
- در برخی لایه‌ها یا معماری‌ها ممکن است فعال‌سازی بعدی اعمال نشود، مثلاً در لایه خروجی برای برخی وظایف خاص.
</p>


## self.pool = nn.MaxPool2d(kernel_size=2, stride=2)

<p dir="rtl">
این خط یک لایه <b>MaxPool2d</b> در <b>CNN</b> ایجاد می‌کند.  
- <b>kernel_size=2</b> : اندازه پنجره 2×2 برای pooling  
- <b>stride=2</b> : حرکت پنجره ۲ پیکسل به جلو  
- وظیفه <b>Pooling</b> کاهش ابعاد و تمرکز روی ویژگی‌های مهم است.
</p>


## def forward(self, x): ... return x

<p dir="rtl">
متد <b>forward</b> مسیر عبور داده‌ها در <b>CNN</b> را مشخص می‌کند.  
- <b>x = self.conv1(x)</b> : داده ورودی از لایه پیچشی اول عبور می‌کند.  
- <b>x = self.relu(x)</b> : تابع فعال‌سازی ReLU روی خروجی اعمال می‌شود.  
- <b>return x</b> : خروجی نهایی این مرحله بازگردانده می‌شود.  
بدون <b>forward</b>، شبکه نمی‌تواند پیش‌بینی کند یا آموزش ببیند.
</p>


## def forward(self, x): x = self.pool(x) 

<p dir="rtl">
این خط در <b>forward</b> قرار دارد و لایه <b>MaxPool2d</b> را اعمال می‌کند.  
- کاهش ابعاد خروجی و تمرکز روی ویژگی‌های مهم  
- کمک به کاهش محاسبات و جلوگیری از Overfitting
</p>


<p dir="rtl">
<b>Overfitting</b> زمانی رخ می‌دهد که شبکه <b>خیلی خوب روی داده‌های آموزش</b> یاد می‌گیرد ولی توانایی تعمیم به داده‌های جدید را ندارد.  
- به عبارتی، مدل جزئیات نویز و ویژگی‌های خاص آموزش را یاد می‌گیرد و عملکردش روی داده‌های تست ضعیف می‌شود.  
- روش‌هایی مانند <b>MaxPooling</b>، <b>Dropout</b> و <b>Regularization</b> به کاهش Overfitting کمک می‌کنند.
</p>




##  self.conv2 = nn.Conv2d(...)

<p dir="rtl">
اضافه کردن لایه <b>Conv2d دوم</b> در <b>CNN</b> به این دلیل است که:  
- لایه اول ویژگی‌های ساده تصویر مانند لبه‌ها و گوشه‌ها را یاد می‌گیرد.  
- لایه دوم می‌تواند ویژگی‌های پیچیده‌تر و ترکیبی را استخراج کند، مانند بافت‌ها و شکل‌های پیچیده.  

همچنین توجه داشته باش که بعد از تعریف <b>Conv2</b> در <b>__init__</b>،  
در <b>forward</b> هم باید این لایه استفاده شود تا خروجی آن محاسبه و به مراحل بعدی شبکه ارسال شود:  
<code>
x = self.conv2(x)  
x = self.relu(x)
</code>
بدون استفاده در <b>forward</b>، لایه تعریف شده عملاً روی داده‌ها اعمال نمی‌شود.
</p>

## self.pool2 = nn.MaxPool2d(kernel_size=2, stride=2)

<p dir="rtl">
این خط یک <b>دومین لایه MaxPool2d</b> در <b>CNN</b> ایجاد می‌کند.  
- <b>kernel_size=2</b> و <b>stride=2</b> : همانند Pooling اول برای کاهش ابعاد خروجی و تمرکز روی ویژگی‌های مهم.  
- اضافه کردن Pooling دوم کمک می‌کند تا ابعاد تصویر کاهش یافته و شبکه برای مراحل Fully Connected آماده شود.
</p>


<p dir="rtl">
دومین لایه <b>MaxPooling</b> به آماده شدن خروجی برای مرحله <b>Fully Connected</b> کمک می‌کند:<br>
<span><b>1. کاهش ابعاد تصویر:</b> بعد از دو لایه Pooling، ارتفاع و عرض Feature Mapها کاهش یافته و تعداد نورون‌ها برای لایه Fully Connected کمتر و قابل مدیریت می‌شود.</span><br>
<span><b>2. تمرکز روی ویژگی‌های مهم:</b> MaxPooling ویژگی‌های برجسته را نگه می‌دارد و نویز و جزئیات کم‌اهمیت حذف می‌شوند، تا لایه Dense روی مهم‌ترین ویژگی‌ها تصمیم بگیرد.</span><br>
<span><b>3. آماده‌سازی برای Flatten:</b> خروجی آخرین Pooling به بردار یک‌بعدی تبدیل می‌شود تا به لایه Dense وصل شود. بدون Pooling کافی، Flatten ممکن است بردار خیلی بزرگ تولید کند و محاسبات سنگین شود.</span>
</p>



## x = self.pool2(x)

<p dir="rtl">
این خط در <b>forward</b> خروجی <b>Conv2 + ReLU</b> را با <b>MaxPooling دوم</b> کاهش ابعاد می‌دهد.  
- کاهش ابعاد خروجی برای اتصال به لایه Fully Connected  
- تمرکز روی ویژگی‌های برجسته و کاهش نویز  
- کمک به کاهش حجم محاسبات و جلوگیری از Overfitting
</p>


## self.fc1 = nn.Linear(32 * 7 * 7, 128)

<p dir="rtl">
این خط یک لایه <b>Fully Connected</b> در <b>CNN</b> ایجاد می‌کند.  
- <b>32 * 7 * 7</b> : اندازه ورودی برابر با تعداد عناصر خروجی آخرین Pooling است.  
- <b>128</b> : تعداد نورون‌های Dense برای یادگیری ویژگی‌های ترکیبی و پیچیده.  
- این لایه به شبکه اجازه می‌دهد تصمیم نهایی یا پیش‌بینی را بر اساس ویژگی‌های استخراج شده بگیرد.
</p>


## self.relu_fc1 = nn.ReLU()

<p dir="rtl">
این خط یک تابع فعال‌سازی <b>ReLU</b> بعد از لایه <b>Fully Connected اول</b> اضافه می‌کند.  
- اعمال <b>ReLU</b> باعث <b>غیرخطی شدن</b> شبکه می‌شود و توانایی یادگیری ویژگی‌های پیچیده‌تر را افزایش می‌دهد.  
- بدون فعال‌سازی، لایه Dense صرفاً ترکیبی خطی از ویژگی‌ها را تولید می‌کند و عمق شبکه بی‌معنی می‌شود.
</p>


## self.fc2 = nn.Linear(128, 10)

<p dir="rtl">
این خط یک لایه <b>Fully Connected خروجی</b> در <b>CNN</b> ایجاد می‌کند.  
- <b>128</b> : تعداد نورون‌های ورودی از FC1  
- <b>10</b> : تعداد کلاس‌ها برای پیش‌بینی (مثلاً ارقام 0 تا 9 در MNIST)  
- این لایه نتیجه نهایی شبکه را برای اعمال <b>Softmax</b> یا تابع Loss مناسب آماده می‌کند.
</p>


## x = self.fc2(x)

<p dir="rtl">
این خط در <b>forward</b> خروجی <b>Fully Connected آخر</b> را محاسبه می‌کند.  
- خروجی برداری با طول ۱۰ (تعداد کلاس‌ها) است.  
- این خروجی معمولاً برای محاسبه <b>Loss</b> یا اعمال تابع <b>Softmax</b> استفاده می‌شود تا پیش‌بینی نهایی کلاس‌ها انجام شود.
</p>


## نکته مهم

<p dir="rtl">
مسیر عبور داده در شبکه <b>SimpleCNN</b> به صورت زیر است:<br>
<b>Conv1 → ReLU → Pool → Conv2 → ReLU → Pool2 → Flatten → FC1 → ReLU → FC2</b><br><br>
شبکه آماده است تا یک تصویر MNIST یا مشابه را دریافت کرده و خروجی <b>۱۰ کلاس</b> تولید کند.<br>
در مرحله بعد، می‌توانیم یک نمونه تصویر واقعی را از شبکه عبور داده و خروجی پیش‌بینی آن را مشاهده کنیم.
</p>


## شبکه کامل شد. بریم برای ایجاد نمونه شبکه و ارسال به حافظه سیستم

In [8]:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model = SimpleCNN().to(device)

<p dir="rtl">
این خط شبکه <b>SimpleCNN</b> را روی دستگاه مناسب قرار می‌دهد:  
- <b>GPU</b> اگر موجود باشد برای محاسبات سریع  
- در غیر اینصورت <b>CPU</b>  
- این کار باعث می‌شود عملیات آموزش و تست سریع و بهینه انجام شود.
</p>


In [9]:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model = SimpleCNN().to(device)

# ← اینجا اضافه کن
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)


In [10]:
from torch.utils.data import DataLoader

# تبدیل تصویر به Tensor
transform = transforms.Compose([
    transforms.ToTensor()
])

# بارگذاری دیتاست تست MNIST
test_dataset = torchvision.datasets.MNIST(
    root=r"D:\GitHubProjects\Daily-Neural-Network-Exercise\data\mnist_standard",  # پوشه استاندارد MNIST
    train=False,        # دیتاست تست
    download=True,      # اگر فایل‌ها موجود نبود، دانلود می‌کند
    transform=transform
)

# ساخت DataLoader
test_loader = DataLoader(dataset=test_dataset, batch_size=1, shuffle=True)


<p dir="rtl" style="text-align: right; font-family: Tahoma, sans-serif;">
<strong>توضیح دقیق پارامترها:</strong>
<ul>
<li><b>root</b> : مسیر پوشه‌ای که فایل‌های استاندارد MNIST در آن هستند. این مسیر باید شامل فایل‌هایی مانند <code>train-images-idx3-ubyte</code> باشد.</li>
<li><b>train</b> : <code>True</code> برای دیتاست آموزش، <code>False</code> برای دیتاست تست.</li>
<li><b>download</b> : <code>True</code> باعث دانلود خودکار MNIST در صورت عدم وجود فایل‌ها می‌شود، <code>False</code> فایل‌ها را استفاده می‌کند.</li>
<li><b>transform=transforms.ToTensor()</b> : تبدیل تصویر از <b>ماتریس numpy با مقادیر 0 تا 255</b> به <b>Tensor PyTorch با مقادیر 0 تا 1</b>. دلیل تبدیل: شبکه عصبی PyTorch روی Tensorها عمل می‌کند و مقیاس [0,1] باعث پایدارتر شدن آموزش می‌شود.</li>
<li><b>batch_size</b> : تعداد نمونه‌هایی که در هر بار عبور از شبکه پردازش می‌شوند. اینجا 1 یعنی هر بار فقط یک تصویر پردازش می‌شود.</li>
<li><b>shuffle</b> : اگر <code>True</code>، ترتیب تصاویر در هر epoch به صورت تصادفی انتخاب می‌شود تا شبکه ترتیب ثابت یاد نگیرد.</li>
</ul>
</p>


In [11]:
'''
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        # لایه‌ها
        self.fc1 = nn.Linear(28*28, 128)  # ورودی: 784 پیکسل -> 128 نرون
        self.fc2 = nn.Linear(128, 64)     # 128 -> 64
        self.fc3 = nn.Linear(64, 10)      # 64 -> 10 خروجی (10 رقم)

    def forward(self, x):
        # تبدیل تصویر 28x28 به یک وکتور 784تایی
        x = x.view(-1, 28*28)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)  # این خروجی Logits هست
        return x
'''

'\nclass Net(nn.Module):\n    def __init__(self):\n        super(Net, self).__init__()\n        # لایه\u200cها\n        self.fc1 = nn.Linear(28*28, 128)  # ورودی: 784 پیکسل -> 128 نرون\n        self.fc2 = nn.Linear(128, 64)     # 128 -> 64\n        self.fc3 = nn.Linear(64, 10)      # 64 -> 10 خروجی (10 رقم)\n\n    def forward(self, x):\n        # تبدیل تصویر 28x28 به یک وکتور 784تایی\n        x = x.view(-1, 28*28)\n        x = F.relu(self.fc1(x))\n        x = F.relu(self.fc2(x))\n        x = self.fc3(x)  # این خروجی Logits هست\n        return x\n'

In [12]:
num_epochs = 5  # تعداد دوره‌های آموزش

for epoch in range(num_epochs):
    running_loss = 0.0
    for images, labels in train_loader:
        images, labels = images.to(device), labels.to(device)
        optimizer.zero_grad()
        outputs = model(images)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()
        running_loss += loss.item()
    print(f"Epoch [{epoch+1}/{num_epochs}], Loss: {running_loss/len(train_loader):.4f}")


NameError: name 'train_loader' is not defined

In [None]:
import matplotlib.pyplot as plt
# 4. گرفتن یک نمونه از دیتاست
images, labels = next(iter(test_loader))

# 5. نمایش تصویر
plt.imshow(images[0][0], cmap="gray")
plt.title(f"Label: {labels.item()}")
plt.show()

# 6. عبور از شبکه
model = SimpleCNN()   # شبکه‌ای که قبلا تعریف کردیم
model.eval()    # حالت ارزیابی (غیر آموزشی)

with torch.no_grad():
    outputs = model(images)          # خروجی شبکه
    _, predicted = torch.max(outputs, 1)  # گرفتن کلاس پیش‌بینی‌شده

print(f"شبکه پیش‌بینی کرد: {predicted.item()}  |  برچسب واقعی: {labels.item()}")

<p dir="rtl">
<b>import matplotlib.pyplot as plt</b><br>
برای نمایش تصاویر استفاده می‌شود. ما از <b>plt.imshow</b> برای نشان دادن تصویر و از <b>plt.title</b> برای گذاشتن عنوان روی تصویر استفاده می‌کنیم.
</p>

<p dir="rtl">
<b>images, labels = next(iter(test_loader))</b><br>
گرفتن یک نمونه (batch) از دیتاست تست. <br>
- <b>iter(test_loader)</b> یک iterator روی دیتاست می‌سازد.<br>
- <b>next()</b> اولین batch را می‌گیرد.<br>
- چون <b>batch_size=1</b> است، <b>images</b> یک تصویر و <b>labels</b> برچسب آن را شامل می‌شود.
</p>

<p dir="rtl">
<b>plt.imshow(images[0][0], cmap="gray")</b><br>
نمایش تصویر MNIST. <br>
- <b>images[0][0]</b>: تصویر اول و کانال اول (MNIST سیاه و سفید است).<br>
- <b>cmap="gray"</b>: تصویر سیاه و سفید نمایش داده می‌شود.
</p>

<p dir="rtl">
<b>plt.title(f"Label: {labels.item()}")</b><br>
عنوان تصویر که برچسب واقعی آن را نمایش می‌دهد. <br>
- <b>labels.item()</b> مقدار عددی برچسب را از تنسور استخراج می‌کند.
</p>

<p dir="rtl">
<b>plt.show()</b><br>
تصویر را روی صفحه نمایش می‌دهد.
</p>

<p dir="rtl">
<b>model = Net()</b><br>
ایجاد نمونه‌ای از شبکه عصبی که قبلاً تعریف شده است.
</p>

<p dir="rtl">
<b>model.eval()</b><br>
مدل را در حالت ارزیابی قرار می‌دهد: <br>
- Dropout و BatchNorm غیر فعال می‌شوند.<br>
- دیگر گرادیان‌ها محاسبه نمی‌شوند.
</p>

<p dir="rtl">
<b>with torch.no_grad():</b><br>
تمام عملیات داخل این بلاک بدون محاسبه گرادیان انجام می‌شود.<br>
- صرفه‌جویی در حافظه و سرعت برای inferencing.
</p>

<p dir="rtl">
<b>outputs = model(images)</b><br>
تصویر از شبکه عبور می‌کند و خروجی logits ۱۰کلاسه تولید می‌شود.
</p>

<p dir="rtl">
<b>_, predicted = torch.max(outputs, 1)</b><br>
کلاس پیش‌بینی‌شده را می‌گیریم: <br>
- <b>_</b>: مقدار حداکثر (ما نیاز نداریم).<br>
- <b>predicted</b>: اندیس بیشترین مقدار = کلاس پیش‌بینی شده.
</p>

<p dir="rtl">
<b>print(f"شبکه پیش‌بینی کرد: {predicted.item()}  |  برچسب واقعی: {labels.item()}")</b><br>
چاپ نتیجه:<br>
- <b>predicted.item()</b>: کلاس پیش‌بینی‌شده توسط شبکه.<br>
- <b>labels.item()</b>: برچسب واقعی تصویر.
</p>


In [None]:
correct = 0
total = 0

# 2. بدون محاسبه گرادیان
with torch.no_grad():
    for images, labels in test_loader:
        outputs = model(images)                  # عبور تصویر از شبکه
        _, predicted = torch.max(outputs, 1)    # گرفتن کلاس پیش‌بینی شده
        total += labels.size(0)                 # جمع تعداد نمونه‌ها
        correct += (predicted == labels).sum().item()  # جمع تعداد پیش‌بینی درست

# 3. محاسبه دقت
accuracy = 100 * correct / total
print(f"دقت شبکه روی دیتاست تست: {accuracy:.2f}%")

<p dir="rtl">
<b>model = Net()</b><br>
نمونه‌ای از شبکه عصبی ایجاد می‌کنیم.
</p>

<p dir="rtl">
<b>model.eval()</b><br>
مدل را در حالت ارزیابی قرار می‌دهیم تا Dropout و BatchNorm غیرفعال شوند.
</p>

<p dir="rtl">
<b>correct = 0  |  total = 0</b><br>
متغیرهایی برای شمارش تعداد پیش‌بینی‌های درست و کل نمونه‌ها.
</p>

<p dir="rtl">
<b>with torch.no_grad():</b><br>
تمام محاسبات داخل این بلاک بدون محاسبه گرادیان انجام می‌شوند.
</p>

<p dir="rtl">
<b>for images, labels in test_loader:</b><br>
یک حلقه روی دیتاست تست می‌زنیم تا همه تصاویر عبور داده شوند.
</p>

<p dir="rtl">
<b>outputs = model(images)</b><br>
تصویر از شبکه عبور می‌کند و logits کلاس‌ها تولید می‌شوند.
</p>

<p dir="rtl">
<b>_, predicted = torch.max(outputs, 1)</b><br>
کلاس پیش‌بینی شده را با بیشترین مقدار logits انتخاب می‌کنیم.
</p>

<p dir="rtl">
<b>total += labels.size(0)</b><br>
تعداد نمونه‌ها را جمع می‌کنیم تا برای محاسبه دقت استفاده شود.
</p>

<p dir="rtl">
<b>correct += (predicted == labels).sum().item()</b><br>
مقایسه پیش‌بینی با برچسب واقعی و جمع تعداد درست‌ها.
</p>

<p dir="rtl">
<b>accuracy = 100 * correct / total</b><br>
محاسبه درصد دقت شبکه روی کل دیتاست تست.
</p>

<p dir="rtl">
<b>print(f"دقت شبکه روی دیتاست تست: {accuracy:.2f}%")</b><br>
نمایش دقت نهایی روی صفحه.
</p>


In [None]:
model.eval()
correct = 0
total = 0
with torch.no_grad():
    for images, labels in test_loader:
        images, labels = images.to(device), labels.to(device)
        outputs = model(images)
        _, predicted = torch.max(outputs, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()
accuracy = 100 * correct / total
print(f"دقت شبکه روی دیتاست تست: {accuracy:.2f}%")
