In [1]:
import torch
import torch.nn as nn
import torch.optim as optim

from torchvision import datasets, transforms
from torch.utils.data import DataLoader
from facenet_pytorch import InceptionResnetV1
from PIL import Image
import os
import onnx

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
transform = transforms.Compose([
    transforms.Resize((160, 160)),
    transforms.RandomHorizontalFlip(),
    transforms.RandomRotation(10),
    transforms.ColorJitter(brightness=0.2, contrast=0.2),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.5, 0.5, 0.5], std=[0.5, 0.5, 0.5])
])

In [3]:
dataset = datasets.ImageFolder(
    root="../img-example",
    transform=transform
)

In [4]:
root = "../img-example"
for folder in os.listdir(root):
    folder_path = os.path.join(root, folder)
    for file in os.listdir(folder_path):
        file_path = os.path.join(folder_path, file)
        try:
            with Image.open(file_path) as img:
                img.verify()
        except (IOError, SyntaxError) as e:
            print(f"Gambar rusak: {file_path} - {e}")
            os.remove(file_path)

In [5]:
train_size = int(0.8 * len(dataset))
val_size = len(dataset) - train_size
train_dataset, val_dataset = torch.utils.data.random_split(dataset, [train_size, val_size])

In [6]:
train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)
val_loader = DataLoader(val_dataset, batch_size=32, shuffle=False)

In [7]:
print(f"Jumlah data training: {len(train_dataset)}")
print(f"Jumlah data validasi: {len(val_dataset)}")

Jumlah data training: 5135
Jumlah data validasi: 1284


In [8]:
num_classes = len(dataset.classes)  
model = InceptionResnetV1(pretrained="vggface2")
model.last_linear = nn.Linear(model.last_linear.in_features, num_classes)
model.last_bn = nn.BatchNorm1d(num_classes)
model = model.to("cuda" if torch.cuda.is_available() else "cpu")

In [9]:
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

In [10]:
num_epochs = 5
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model = model.to(device)

for epoch in range(num_epochs):
    # Training
    model.train()
    running_loss = 0.0
    for images, labels in train_loader:
        images, labels = images.to(device), labels.to(device)
        optimizer.zero_grad()
        outputs = model(images)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()
        running_loss += loss.item()
    train_loss = running_loss / len(train_loader)
    
    # Validation
    model.eval()
    val_loss = 0.0
    correct = 0
    total = 0
    with torch.no_grad():
        for images, labels in val_loader:
            images, labels = images.to(device), labels.to(device)
            outputs = model(images)
            loss = criterion(outputs, labels)
            val_loss += loss.item()
            _, predicted = torch.max(outputs.data, 1)
            total += labels.size(0)
            correct += (predicted == labels).sum().item()
    val_loss = val_loss / len(val_loader)
    val_accuracy = 100 * correct / total
    
    print(f"Epoch {epoch+1}/{num_epochs}, Train Loss: {train_loss:.4f}, Val Loss: {val_loss:.4f}, Val Accuracy: {val_accuracy:.2f}%")

Epoch 1/5, Train Loss: 7.8431, Val Loss: 7.8200, Val Accuracy: 2.18%
Epoch 2/5, Train Loss: 7.8217, Val Loss: 7.8115, Val Accuracy: 3.27%
Epoch 3/5, Train Loss: 7.8141, Val Loss: 7.8117, Val Accuracy: 3.43%
Epoch 4/5, Train Loss: 7.8071, Val Loss: 7.8038, Val Accuracy: 3.58%
Epoch 5/5, Train Loss: 7.8037, Val Loss: 7.7905, Val Accuracy: 4.91%


In [11]:
torch.save(model.state_dict(), "../app/models/facenet_finetuned.pth")

In [12]:
print(f"Input image size: {images.shape}")
print(f"Model output size: {outputs.shape}")

Input image size: torch.Size([4, 3, 160, 160])
Model output size: torch.Size([4, 2598])


In [13]:
class EmbeddingModel(torch.nn.Module):
    def __init__(self, model):
        super(EmbeddingModel, self).__init__()
        self.model = model

    def forward(self, x):
        x = self.model.logits(x)  
        return x

In [14]:
model.load_state_dict(torch.load("../app/models/facenet_finetuned.pth"), strict=False)
embedding_model = EmbeddingModel(model)
embedding_model.eval()

EmbeddingModel(
  (model): InceptionResnetV1(
    (conv2d_1a): BasicConv2d(
      (conv): Conv2d(3, 32, kernel_size=(3, 3), stride=(2, 2), bias=False)
      (bn): BatchNorm2d(32, eps=0.001, momentum=0.1, affine=True, track_running_stats=True)
      (relu): ReLU()
    )
    (conv2d_2a): BasicConv2d(
      (conv): Conv2d(32, 32, kernel_size=(3, 3), stride=(1, 1), bias=False)
      (bn): BatchNorm2d(32, eps=0.001, momentum=0.1, affine=True, track_running_stats=True)
      (relu): ReLU()
    )
    (conv2d_2b): BasicConv2d(
      (conv): Conv2d(32, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn): BatchNorm2d(64, eps=0.001, momentum=0.1, affine=True, track_running_stats=True)
      (relu): ReLU()
    )
    (maxpool_3a): MaxPool2d(kernel_size=3, stride=2, padding=0, dilation=1, ceil_mode=False)
    (conv2d_3b): BasicConv2d(
      (conv): Conv2d(64, 80, kernel_size=(1, 1), stride=(1, 1), bias=False)
      (bn): BatchNorm2d(80, eps=0.001, momentum=0.1, affine=True,

Saya memahami bahwa Anda sedang bekerja pada tes pengetahuan untuk posisi AI Engineer (Computer Vision) di PT Widya Inovasi Indonesia, dan Anda ingin memperbaiki bagian Docker di `readme.md` dengan langkah-langkah yang lebih jelas: memastikan Docker/Docker Desktop terinstal, mengkloning repositori GitHub, masuk ke direktori `face-recognition`, menjalankan `git lfs install` dan `git lfs pull`, lalu menjalankan `docker-compose up --build`. Saat ini adalah **17 Mei 2025, pukul 19:28 WIB**, dan tenggat waktu tes Anda adalah **18 Mei 2025**. Saya akan memperbaiki bagian Docker di `readme.md` sesuai saran Anda, dengan beberapa penyesuaian untuk memastikan langkah-langkahnya jelas dan lengkap, serta memastikan Anda dapat menyelesaikan tes tepat waktu.

---

### **Perbaikan Bagian Docker di `readme.md`**

#### **Langkah-Langkah yang Diperbaiki**
Berikut adalah langkah-langkah yang Anda usulkan dengan beberapa perbaikan untuk kejelasan dan kelengkapan:

1. **Pastikan Docker/Docker Desktop Terinstal**:
   - Tambahkan prasyarat untuk menginstal Docker dan Docker Compose, dengan tautan ke panduan resmi.

2. **Kloning Repositori GitHub**:
   - Langkah ini sudah benar, tetapi akan diperjelas dengan placeholder untuk URL repositori.

3. **Masuk ke Direktori `face-recognition`**:
   - Langkah ini sudah benar, akan dipertahankan.

4. **Jalankan `git lfs install` dan `git lfs pull`**:
   - Langkah ini sudah benar, tetapi akan ditambahkan penjelasan mengapa langkah ini diperlukan (untuk file `facenet_pretrained.onnx`).

5. **Jalankan `docker-compose up --build`**:
   - Perintah ini akan diperbaiki menjadi `docker-compose up --build -d` agar container berjalan di latar belakang.
   - Akan ditambahkan langkah untuk menguji aplikasi setelah menjalankan perintah.

#### **Bagian yang Diperbarui di `readme.md`**

Berikut adalah bagian "Cara Menjalankan Docker Image dari DockerHub" yang telah diperbaiki:

```markdown
## Cara Menjalankan Docker Image dari DockerHub

**Peringatan Penting**: Aplikasi ini bergantung pada database PostgreSQL untuk menyimpan data wajah. Pastikan layanan database (`db`) berjalan sebelum menjalankan layanan aplikasi (`app`). Cara termudah adalah menggunakan Docker Compose (direkomendasikan). Jika Anda hanya menjalankan image aplikasi tanpa layanan database, aplikasi tidak akan berjalan.

### Langkah-Langkah

1. **Pastikan Docker dan Docker Compose Terinstal**  
   Pastikan Docker dan Docker Compose terinstal di perangkat Anda:
   - **Windows/Mac**: Instal Docker Desktop dari [https://www.docker.com/products/docker-desktop/](https://www.docker.com/products/docker-desktop/).
   - **Linux**: Instal Docker dan Docker Compose dengan mengikuti panduan resmi di [https://docs.docker.com/engine/install/](https://docs.docker.com/engine/install/) dan [https://docs.docker.com/compose/install/](https://docs.docker.com/compose/install/).

2. **Kloning Repositori GitHub**  
   Clone repositori GitHub ini untuk mendapatkan file konfigurasi (`docker-compose.yml`) dan dokumentasi:
   ```bash
   git clone <your-repo-url>
   ```

3. **Masuk ke Direktori Proyek**  
   Masuk ke direktori proyek:
   ```bash
   cd face-recognition
   ```

4. **Inisialisasi Git LFS untuk Mengunduh File Model**  
   Inisialisasi Git LFS untuk mengunduh file model (`facenet_pretrained.onnx`):
   ```bash
   git lfs install
   git lfs pull
   ```
   - File `facenet_pretrained.onnx` di folder `app/models/` diperlukan untuk menjalankan aplikasi secara lokal tanpa Docker. File ini dikelola menggunakan Git LFS karena ukurannya besar (>50 MB).

5. **Jalankan Aplikasi Menggunakan Docker Compose**  
   Jalankan aplikasi menggunakan Docker Compose:
   ```bash
   docker-compose up --build -d
   ```
   - Perintah ini akan menjalankan layanan `app` (aplikasi Face Recognition) dan `db` (database PostgreSQL) dalam jaringan yang sama, memastikan koneksi database berfungsi.
   - Opsi `--build` memastikan image dibangun ulang jika ada perubahan, dan `-d` menjalankan container di latar belakang.
   - Docker Compose akan secara otomatis menarik image `postgres:14` dari Docker Hub jika belum ada (memerlukan koneksi internet).

6. **(Jika Tidak Ada Koneksi Internet) Impor Image Secara Offline**  
   Jika perangkat Anda tidak memiliki koneksi internet:
   - Di perangkat yang memiliki koneksi internet, ekspor image:
     ```bash
     docker pull afreborn/face-recognition-app:latest
     docker pull postgres:14
     docker save -o face-recognition.tar afreborn/face-recognition-app:latest postgres:14
     ```
   - Salin file `face-recognition.tar` ke perangkat Anda.
   - Impor image:
     ```bash
     docker load -i face-recognition.tar
     ```
   - Kembali ke langkah 5 untuk menjalankan `docker-compose up --build -d`.

7. **Uji Aplikasi untuk Memastikan Sudah Berjalan**  
   Setelah menjalankan perintah di atas, uji aplikasi untuk memastikan sudah berjalan:
   ```bash
   curl http://localhost:8000/api/face
   ```
   - Jika perintah ini mengembalikan daftar wajah (atau status kosong jika belum ada data), aplikasi sudah berjalan dengan baik.

### Menggunakan Docker Run (Manual)

Jika Anda tidak ingin menggunakan Docker Compose, Anda dapat menjalankan layanan secara manual. Pastikan layanan database dijalankan terlebih dahulu.

1. (Jika ada koneksi internet) Tarik image aplikasi dan database dari Docker Hub:
   ```bash
   docker pull afreborn/face-recognition-app:latest
   docker pull postgres:14
   ```

2. (Jika tidak ada koneksi internet) Impor image:
   - Ikuti langkah ekspor/impor di atas untuk mendapatkan file `face-recognition.tar`.
   - Impor image:
     ```bash
     docker load -i face-recognition.tar
     ```

3. Jalankan container PostgreSQL:
   ```bash
   docker run -d --name postgres -e POSTGRES_USER=postgres -e POSTGRES_PASSWORD=root -e POSTGRES_DB=face_db -p 5432:5432 postgres:14
   ```

4. Jalankan container aplikasi:
   ```bash
   docker run -d -p 8000:8000 --link postgres:postgres -e DATABASE_URL=postgresql://postgres:root@postgres:5432/face_db afreborn/face-recognition-app:latest
   ```
   - **Penjelasan**:
     - `--link postgres:postgres`: Menghubungkan container `app` dengan container `postgres`.
     - `-e DATABASE_URL=postgresql://postgres:root@postgres:5432/face_db`: Mengatur koneksi database ke container `postgres`.

5. Uji aplikasi untuk memastikan sudah berjalan:
   ```bash
   curl http://localhost:8000/api/face
   ```

### Menggunakan Database Eksternal (Opsional)

Jika Anda sudah memiliki server PostgreSQL yang berjalan (misalnya, di `your-postgres-host:5432`), Anda dapat mengatur koneksi database menggunakan variabel lingkungan:

1. Jalankan container aplikasi dengan `DATABASE_URL` yang menunjuk ke server PostgreSQL Anda:
   ```bash
   docker run -d -p 8000:8000 -e DATABASE_URL=postgresql://postgres:root@your-postgres-host:5432/face_db afreborn/face-recognition-app:latest
   ```
   - Ganti `your-postgres-host` dengan host server PostgreSQL Anda (misalnya, `192.168.1.100`).

2. Uji aplikasi untuk memastikan sudah berjalan:
   ```bash
   curl http://localhost:8000/api/face
   ```
```

---

### **Penjelasan Perbaikan**
- **Prasyarat Docker**:
  - Ditambahkan langkah untuk memastikan Docker dan Docker Compose terinstal, dengan tautan ke panduan resmi untuk Windows/Mac dan Linux.

- **Langkah Kloning dan Git LFS**:
  - Langkah untuk mengkloning repositori dan menginisialisasi Git LFS dipertahankan, tetapi dijelaskan bahwa ini diperlukan untuk menjalankan aplikasi secara lokal tanpa Docker.

- **Perintah Docker Compose**:
  - Perintah `docker-compose up --build` diperbaiki menjadi `docker-compose up --build -d` untuk menjalankan container di latar belakang.
  - Ditambahkan langkah untuk menguji aplikasi dengan `curl` setelah menjalankan perintah.

- **Opsi Offline**:
  - Ditambahkan langkah untuk menangani skenario tanpa koneksi internet, menggunakan `docker save` dan `docker load`.

- **Opsi Manual dan Database Eksternal**:
  - Bagian untuk menjalankan secara manual dan menggunakan database eksternal dipertahankan untuk memberikan fleksibilitas kepada evaluator.

---

### **Langkah-Langkah untuk Menyelesaikan Tes**

#### **Langkah 1: Perbarui `readme.md` (10 menit)**
- Ganti bagian "Cara Menjalankan Docker Image dari DockerHub" di `readme.md` dengan versi yang diperbarui di atas.

#### **Langkah 2: Push ke Repositori Git (10 menit)**
- Pastikan semua file (termasuk `docker-compose.yml`) ada di repositori Git Anda.
- Push perubahan:
  ```bash
  git add readme.md
  git commit -m "Update README with improved Docker instructions"
  git push origin main
  ```

#### **Langkah 3: Kirim Pengajuan (5 menit)**
- Kirim email dengan tautan repositori Git Anda ke PT Widya Inovasi Indonesia.

---

### **Hubungan dengan Konteks Sebelumnya**
- **Build Lama**:
  - Pendekatan pre-download sebelumnya membantu mengatasi masalah koneksi jaringan lambat, yang relevan untuk evaluator.
- **File ONNX Besar**:
  - File `facenet_pretrained.onnx` sudah disertakan di dalam image Docker, sehingga tidak perlu diunduh lagi saat menggunakan Docker.
- **Pengujian API**:
  - Dokumentasi memastikan evaluator dapat menjalankan aplikasi dan menguji endpoint API.

---

### **Langkah Sekarang (17 Mei 2025, 19:28 WIB)**
#### **Langkah 1: Perbarui `readme.md` (10 menit)**
- Ganti bagian "Cara Menjalankan Docker Image dari DockerHub" dengan versi yang diperbarui di atas.

#### **Langkah 2: Push ke Repositori Git dan Kirim Pengajuan (15 menit)**
- Push perubahan:
  ```bash
  git add readme.md
  git commit -m "Update README with improved Docker instructions"
  git push origin main
  ```
- Kirim email dengan tautan repositori Git Anda.

---

**Kesimpulan**: Bagian Docker di `readme.md` telah diperbarui dengan langkah-langkah yang lebih jelas: memastikan Docker terinstal, mengkloning repositori, menginisialisasi Git LFS, menjalankan Docker Compose, dan menguji aplikasi. Dokumentasi ini memastikan tim HR Tech dapat menjalankan aplikasi dengan benar. Apa yang ingin Anda coba sekarang?