<a href="https://colab.research.google.com/github/Dannyhamtar/MachineLearning/blob/main/Task%20week%2012/AlexNet.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

**Nama: Danny Hamtar Pangestu**

**NIM: 1103210037**

**Lecture : 12**

**Model: AlexNet**

**Dokumentasi GPT : [link](https://chatgpt.com/share/10aeea4d-c294-47ce-8ef4-f6ad5f0c5ce3)**

**Referensi: [link](https://d2l.ai/chapter_convolutional-modern/alexnet.html#alexnet)**



AlexNet adalah salah satu arsitektur jaringan saraf konvolusi (CNN) yang revolusioner dalam pengembangan deep learning. Dirancang oleh Alex Krizhevsky, Ilya Sutskever, dan Geoffrey Hinton, AlexNet memenangkan kompetisi ImageNet 2012 dengan margin yang besar, menandai titik balik dalam penggunaan CNN untuk klasifikasi gambar.

Berikut adalah beberapa fitur kunci dari AlexNet:

1. Arsitektur Paralel: AlexNet terdiri dari 5 lapisan konvolusi yang diikuti oleh 3 lapisan terhubung penuh (fully connected layers). Konvolusi tersebut mencakup penggunaan filter 11x11, 5x5, dan 3x3, dengan stride yang besar dan zero padding yang cukup. Ini menghasilkan lebih dari 60 juta parameter yang dilatih.

2. ReLU Activation: ReLU (Rectified Linear Unit) digunakan sebagai fungsi aktivasi di hampir setiap lapisan. Ini membantu dalam pencegahan masalah pelatihan yang dikenal sebagai "vanishing gradients" dan mempercepat konvergensi pelatihan.

3. Dropout: Untuk mencegah overfitting, AlexNet menggunakan dropout pada lapisan terhubung penuh. Dropout secara acak mematikan sebagian node pada setiap iterasi pelatihan, memaksa jaringan untuk belajar fitur yang lebih tangguh dan generalisasi yang lebih baik.

4. Local Response Normalization (LRN): AlexNet menggunakan normalisasi lokal respons untuk setiap lapisan konvolusi. Ini membantu meningkatkan kontras gambar dan mengurangi overfitting.

5. Data Augmentation: AlexNet menggunakan data augmentation yang ekstensif, termasuk cropping, flipping, dan distorsi warna, untuk meningkatkan keberlanjutan model terhadap variasi gambar.

6. Komputasi Paralel: AlexNet menggunakan GPU (Graphics Processing Unit) untuk mengakselerasi pelatihan, yang merupakan salah satu alasan utama untuk kecepatan dan keberhasilan besar dalam kompetisi ImageNet.

Kemenangan AlexNet dalam ImageNet menandai awal dari dominasi CNN dalam tugas-tugas penglihatan komputer, membuka jalan bagi banyak arsitektur yang lebih kompleks dan berkinerja tinggi yang dikenal saat ini.

#Menginpor Modul

In [9]:
!pip install -U d2l




In [None]:
import torch
from torch import nn
from d2l import torch as d2l

##Kontrol Kapasitas dan Pemrosesan Awal

In [16]:
class AlexNet(d2l.Classifier):
    def __init__(self, lr=0.1, num_classes=10):
        super().__init__()
        self.save_hyperparameters()
        self.net = nn.Sequential(
            nn.LazyConv2d(96, kernel_size=11, stride=4, padding=1),
            nn.ReLU(), nn.MaxPool2d(kernel_size=3, stride=2),
            nn.LazyConv2d(256, kernel_size=5, padding=2), nn.ReLU(),
            nn.MaxPool2d(kernel_size=3, stride=2),
            nn.LazyConv2d(384, kernel_size=3, padding=1), nn.ReLU(),
            nn.LazyConv2d(384, kernel_size=3, padding=1), nn.ReLU(),
            nn.LazyConv2d(256, kernel_size=3, padding=1), nn.ReLU(),
            nn.MaxPool2d(kernel_size=3, stride=2), nn.Flatten(),
            nn.LazyLinear(4096), nn.ReLU(), nn.Dropout(p=0.5),
            nn.LazyLinear(4096), nn.ReLU(),nn.Dropout(p=0.5),
            nn.LazyLinear(num_classes))
        self.net.apply(d2l.init_cnn)

In [17]:
AlexNet().layer_summary((1, 1, 224, 224))

Conv2d output shape:	 torch.Size([1, 96, 54, 54])
ReLU output shape:	 torch.Size([1, 96, 54, 54])
MaxPool2d output shape:	 torch.Size([1, 96, 26, 26])
Conv2d output shape:	 torch.Size([1, 256, 26, 26])
ReLU output shape:	 torch.Size([1, 256, 26, 26])
MaxPool2d output shape:	 torch.Size([1, 256, 12, 12])
Conv2d output shape:	 torch.Size([1, 384, 12, 12])
ReLU output shape:	 torch.Size([1, 384, 12, 12])
Conv2d output shape:	 torch.Size([1, 384, 12, 12])
ReLU output shape:	 torch.Size([1, 384, 12, 12])
Conv2d output shape:	 torch.Size([1, 256, 12, 12])
ReLU output shape:	 torch.Size([1, 256, 12, 12])
MaxPool2d output shape:	 torch.Size([1, 256, 5, 5])
Flatten output shape:	 torch.Size([1, 6400])
Linear output shape:	 torch.Size([1, 4096])
ReLU output shape:	 torch.Size([1, 4096])
Dropout output shape:	 torch.Size([1, 4096])
Linear output shape:	 torch.Size([1, 4096])
ReLU output shape:	 torch.Size([1, 4096])
Dropout output shape:	 torch.Size([1, 4096])
Linear output shape:	 torch.Size([1,

##Training

In [None]:
model = AlexNet(lr=0.01)
data = d2l.FashionMNIST(batch_size=128, resize=(224, 224))
trainer = d2l.Trainer(max_epochs=10, num_gpus=1)
trainer.fit(model, data)