##**Instal/Import Modul**


In [1]:
pip install d2l



##**Library**

In [3]:
import torch
from torch import nn
from d2l import torch as d2l

##**Kontrol Kapasitas dan Pemrosesan Awal**

In [4]:
class AlexNet(d2l.Classifier):
    def __init__(self, lr=0.1, num_classes=10):
        super().__init__()
        self.save_hyperparameters()
        self.net = nn.Sequential(
            nn.LazyConv2d(96, kernel_size=11, stride=4, padding=1),
            nn.ReLU(), nn.MaxPool2d(kernel_size=3, stride=2),
            nn.LazyConv2d(256, kernel_size=5, padding=2), nn.ReLU(),
            nn.MaxPool2d(kernel_size=3, stride=2),
            nn.LazyConv2d(384, kernel_size=3, padding=1), nn.ReLU(),
            nn.LazyConv2d(384, kernel_size=3, padding=1), nn.ReLU(),
            nn.LazyConv2d(256, kernel_size=3, padding=1), nn.ReLU(),
            nn.MaxPool2d(kernel_size=3, stride=2), nn.Flatten(),
            nn.LazyLinear(4096), nn.ReLU(), nn.Dropout(p=0.5),
            nn.LazyLinear(4096), nn.ReLU(),nn.Dropout(p=0.5),
            nn.LazyLinear(num_classes))

        self.net.apply(d2l.init_cnn)

In [5]:
AlexNet().layer_summary((1, 1, 224, 224))



Conv2d output shape:	 torch.Size([1, 96, 54, 54])
ReLU output shape:	 torch.Size([1, 96, 54, 54])
MaxPool2d output shape:	 torch.Size([1, 96, 26, 26])
Conv2d output shape:	 torch.Size([1, 256, 26, 26])
ReLU output shape:	 torch.Size([1, 256, 26, 26])
MaxPool2d output shape:	 torch.Size([1, 256, 12, 12])
Conv2d output shape:	 torch.Size([1, 384, 12, 12])
ReLU output shape:	 torch.Size([1, 384, 12, 12])
Conv2d output shape:	 torch.Size([1, 384, 12, 12])
ReLU output shape:	 torch.Size([1, 384, 12, 12])
Conv2d output shape:	 torch.Size([1, 256, 12, 12])
ReLU output shape:	 torch.Size([1, 256, 12, 12])
MaxPool2d output shape:	 torch.Size([1, 256, 5, 5])
Flatten output shape:	 torch.Size([1, 6400])
Linear output shape:	 torch.Size([1, 4096])
ReLU output shape:	 torch.Size([1, 4096])
Dropout output shape:	 torch.Size([1, 4096])
Linear output shape:	 torch.Size([1, 4096])
ReLU output shape:	 torch.Size([1, 4096])
Dropout output shape:	 torch.Size([1, 4096])
Linear output shape:	 torch.Size([1,

##**Training**

In [None]:
model = AlexNet(lr=0.01)
data = d2l.FashionMNIST(batch_size=128, resize=(224, 224))
trainer = d2l.Trainer(max_epochs=10, num_gpus=1)
trainer.fit(model, data)

Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-images-idx3-ubyte.gz
Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-images-idx3-ubyte.gz to ../data/FashionMNIST/raw/train-images-idx3-ubyte.gz


100%|██████████| 26421880/26421880 [00:02<00:00, 11165555.33it/s]


Extracting ../data/FashionMNIST/raw/train-images-idx3-ubyte.gz to ../data/FashionMNIST/raw

Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-labels-idx1-ubyte.gz
Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-labels-idx1-ubyte.gz to ../data/FashionMNIST/raw/train-labels-idx1-ubyte.gz


100%|██████████| 29515/29515 [00:00<00:00, 200532.43it/s]


Extracting ../data/FashionMNIST/raw/train-labels-idx1-ubyte.gz to ../data/FashionMNIST/raw

Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/t10k-images-idx3-ubyte.gz
Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/t10k-images-idx3-ubyte.gz to ../data/FashionMNIST/raw/t10k-images-idx3-ubyte.gz


100%|██████████| 4422102/4422102 [00:01<00:00, 3737204.26it/s]


Extracting ../data/FashionMNIST/raw/t10k-images-idx3-ubyte.gz to ../data/FashionMNIST/raw

Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/t10k-labels-idx1-ubyte.gz
Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/t10k-labels-idx1-ubyte.gz to ../data/FashionMNIST/raw/t10k-labels-idx1-ubyte.gz


100%|██████████| 5148/5148 [00:00<00:00, 5371213.18it/s]

Extracting ../data/FashionMNIST/raw/t10k-labels-idx1-ubyte.gz to ../data/FashionMNIST/raw






##**Penjelasan**

1. AlexNet Model:
* AlexNet adalah salah satu arsitektur deep neural network yang terkenal, pertama kali diperkenalkan untuk mengikuti kompetisi ImageNet pada tahun 2012.
* Arsitektur AlexNet terdiri dari beberapa layer konvolusi dan layer fully-connected yang mendalam, diinterkoneksi dengan fungsi aktivasi ReLU untuk mempelajari fitur-fitur gambar yang kompleks.
* Pada implementasi ini, model AlexNet dibangun menggunakan modul nn.Sequential dari PyTorch, yang berisi layer-layer konvolusi (nn.Conv2d), fungsi aktivasi ReLU (nn.ReLU), max pooling (nn.MaxPool2d), dropout (nn.Dropout), dan fully-connected layers (nn.Linear).
2. Layer Konvolusi:
*  Setiap layer konvolusi menggunakan filter untuk mengekstrak fitur dari gambar input.
* Filter pada setiap layer dapat disesuaikan dengan kernel size, stride, dan padding untuk mengatur bagaimana filter bergerak melintasi input.
3. Fungsi Aktivasi ReLU:
* Fungsi aktivasi ReLU (Rectified Linear Unit) digunakan setelah setiap layer konvolusi untuk memperkenalkan non-linearitas ke dalam model.
* ReLU memungkinkan model untuk mempelajari representasi yang lebih kompleks dan meningkatkan kemampuan pembelajaran.
4. Max Pooling:
* Max pooling digunakan untuk mengurangi dimensi spasial dari setiap layer, dengan tujuan untuk mengurangi ukuran gambar input, dan menghasilkan invariansi terhadap translasi kecil objek dalam gambar.
5. Dropout:
* Dropout diterapkan untuk mengurangi overfitting. Ini secara acak mematikan beberapa unit (dalam kasus ini, neuron) pada setiap iterasi pelatihan, sehingga memaksa model untuk belajar fitur yang lebih umum dan lebih berguna.
6. Fully-Connected Layers:
* Fully-connected layers (atau linear layers) terletak di akhir arsitektur untuk menghubungkan hasil dari layer-layer sebelumnya ke output yang sesuai dengan jumlah kelas dalam dataset (dalam kasus ini, 10 kelas untuk FashionMNIST).
7. Pelatihan dan Evaluasi:
* Setelah model dibangun, langkah selanjutnya adalah mempersiapkan data, mengatur parameter seperti learning rate dan jumlah epoch, dan memulai proses pelatihan menggunakan algoritma optimizer seperti Stochastic Gradient Descent (SGD).
* Evaluasi dilakukan menggunakan metrik-metrik seperti akurasi untuk mengukur kinerja model dalam memprediksi kelas-kelas dari dataset FashionMNIST.

Implementasi ini memanfaatkan pustaka PyTorch untuk membangun model dan melakukan pelatihan, serta memanfaatkan pustaka D2L untuk memfasilitasi proses pembuatan dan pelatihan model dengan lebih mudah.