<a href="https://colab.research.google.com/github/covryzne/tbc-detection-skripsi/blob/main/tbc_detection_skripsi_netebook.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Deteksi Otomatis Tuberkulosis pada Citra X-Ray Dada Menggunakan Densenet121**

## **Latar Belakang**
**`Tuberkulosis (TB)`** adalah penyakit menular yang disebabkan oleh bakteri **`Mycobacterium tuberculosis`**, yang terutama menyerang paru-paru dan dapat menyebar melalui udara. **`Menurut Global Tuberculosis Report 2024`**, estimasi jumlah orang yang terdiagnosis TB secara global mencapai `10,8` juta kasus di tahun `2023`. Ini mencerminkan peningkatan yang kecil dari 10,7 juta kasus di tahun 2022, meskipun tetap lebih tinggi daripada 10,4 juta kasus pada tahun 2021 dan 10,1 juta pada tahun 2020 [![WHO TB Report](https://img.shields.io/badge/WHO-TB%20Report-blue?logo=world-health-organization)](https://iris.who.int/bitstream/handle/10665/379339/9789240101531-eng.pdf?sequence=1)

Dari total kasus TB global, delapan negara menyumbang lebih dari dua pertiga kasus, dengan **`Indonesia`** berada di **`peringkat kedua`** setelah India, menyumbang 10% dari total kasus global. [![WHO TB Report](https://img.shields.io/badge/WHO-TB%20Report-blue?logo=world-health-organization)](https://www.who.int/teams/global-tuberculosis-programme/tb-reports/global-tuberculosis-report-2023/tb-disease-burden/1-1-tb-incidence?)

Di tingkat nasional, Kementerian Kesehatan Indonesia melaporkan bahwa pada tahun 2022, Indonesia memiliki 969.000 kasus TB yang dilaporkan, dengan cakupan pengobatan mencapai 71%. Dari jumlah tersebut, 55% pasien adalah laki-laki, 33% perempuan, dan 12% anak-anak (usia 0–14 tahun). [![Indonesia TB Report](https://img.shields.io/badge/KemenkesRI-TB%20Report-green)](https://tbindonesia.or.id/wp-content/uploads/2023/09/Laporan-Tahunan-Program-TBC-2022.pdf)

Peningkatan kasus TB ini menunjukkan perlunya inovasi dalam metode deteksi dan diagnosis untuk mengendalikan penyebaran penyakit. Deteksi dini yang akurat sangat penting untuk memastikan pengobatan yang efektif dan mencegah penularan lebih lanjut.

## **Permasalahan dan Solusi**
Tuberkulosis (TB) masih menjadi masalah kesehatan global, termasuk di Indonesia, yang menempati peringkat kedua dengan jumlah kasus TB tertinggi di dunia setelah India. Metode konvensional dalam mendeteksi TB, seperti pemeriksaan dahak dan tes tuberkulin, memiliki keterbatasan dalam hal kecepatan dan akurasi. Sementara itu, deteksi menggunakan X-ray dada menjadi alternatif yang lebih cepat, tetapi interpretasinya masih bergantung pada keahlian dokter radiologi, yang dapat menyebabkan subjektivitas dalam diagnosis.

Untuk mengatasi tantangan ini, penelitian ini mengadopsi pendekatan Deep Learning berbasis Convolutional Neural Network (CNN) sebagai solusi untuk mendeteksi TB secara otomatis melalui gambar X-ray. CNN telah banyak digunakan dalam bidang medis karena kemampuannya dalam mengenali pola kompleks pada citra medis dengan akurasi tinggi.

### **Mengapa Menggunakan DenseNet121?**
Dalam penelitian ini, dipilih DenseNet121 sebagai model utama karena memiliki efisiensi parameter yang lebih baik, aliran informasi yang lebih optimal, dan akurasi tinggi dalam klasifikasi gambar medis. Tidak seperti CNN konvensional, DenseNet121 menggunakan Densely Connected Layers, di mana setiap layer menerima input dari semua layer sebelumnya. Arsitektur ini mengurangi **`vanishing gradient`**, memungkinkan pemanfaatan ulang fitur, dan meningkatkan ekstraksi fitur tanpa redundansi.

Selain itu, DenseNet121 memiliki jumlah parameter yang lebih sedikit dibandingkan arsitektur lain seperti ResNet atau VGG, sehingga lebih ringan, mempercepat proses training, dan mengurangi risiko overfitting. Model ini juga telah terbukti efektif dalam klasifikasi penyakit paru-paru, termasuk TB, menjadikannya pilihan yang tepat untuk mendukung sistem deteksi otomatis TB dalam penelitian ini.

Dengan adanya sistem berbasis DenseNet121, diharapkan proses skrining TB dapat dilakukan lebih cepat dan akurat, sehingga dapat membantu tenaga medis dalam mendeteksi TB sejak dini. Namun, sistem ini tetap digunakan **`sebagai alat bantu dan bukan pengganti diagnosis dari dokter spesialis.`**

## **Dataset yang Digunakan**
Dalam penelitian ini, digunakan dataset Tuberculosis (TB) Chest X-ray dari Kaggle yang bisa diakses pada link dibawah ini:

[![Indonesia TB Report](https://img.shields.io/badge/Kaggle-20BEFF?style=for-the-badge&logo=Kaggle&logoColor=white)](https://www.kaggle.com/datasets/tawsifurrahman/tuberculosis-tb-chest-xray-dataset)

dataset terdiri dari:
  - 700 gambar X-ray positif TB
  - 3.500 gambar X-ray normal <br>

Dataset ini akan digunakan untuk melatih model DenseNet121, sebuah arsitektur CNN yang telah terbukti memiliki performa tinggi dalam klasifikasi gambar medis.

## **Tujuan Penelitian**
Penelitian ini bertujuan untuk membangun sistem TB Detector menggunakan DenseNet121 yang mampu mendeteksi indikasi TB pada X-ray dada secara otomatis. Sistem ini diharapkan dapat membantu dalam proses skrining awal TB. Namun, hasil deteksi tetap harus dikonfirmasi oleh dokter spesialis untuk diagnosis yang lebih akurat.

Dengan adanya teknologi ini, diharapkan dapat meningkatkan efektivitas deteksi dini TB, terutama di daerah dengan keterbatasan akses terhadap tenaga medis.

## **Setup GPU**

In [2]:
!pip uninstall torch torchvision torchaudio -y
!pip install torch==2.0.1+cu118 torchvision==0.15.2+cu118 torchaudio==2.0.2+cu118 -f https://download.pytorch.org/whl/torch_stable.html

Found existing installation: torch 2.5.1+cu124
Uninstalling torch-2.5.1+cu124:
  Successfully uninstalled torch-2.5.1+cu124
Found existing installation: torchvision 0.20.1+cu124
Uninstalling torchvision-0.20.1+cu124:
  Successfully uninstalled torchvision-0.20.1+cu124
Found existing installation: torchaudio 2.5.1+cu124
Uninstalling torchaudio-2.5.1+cu124:
  Successfully uninstalled torchaudio-2.5.1+cu124
Looking in links: https://download.pytorch.org/whl/torch_stable.html
Collecting torch==2.0.1+cu118
  Downloading https://download.pytorch.org/whl/cu118/torch-2.0.1%2Bcu118-cp311-cp311-linux_x86_64.whl (2267.3 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m2.3/2.3 GB[0m [31m572.1 kB/s[0m eta [36m0:00:00[0m
[0mCollecting torchvision==0.15.2+cu118
  Downloading https://download.pytorch.org/whl/cu118/torchvision-0.15.2%2Bcu118-cp311-cp311-linux_x86_64.whl (6.1 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m6.1/6.1 MB[0m [31m57.1 MB/s[0m et

## **Import Libraries**

In [9]:
import os
import random
import numpy as np
import pandas as pd
from PIL import Image
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
import glob
import shutil
import time

import torch
import torchvision
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F
from torch.utils.data import Dataset
from torchvision.io import read_image
from torch.utils.data import DataLoader
from torchvision import datasets, models, transforms
from torchvision.models import densenet121,DenseNet121_Weights, DenseNet

In [2]:
print(torch.cuda.is_available())  # Harusnya True
print(torch.cuda.device_count())  # Harusnya > 0
print(torch.cuda.get_device_name(0))  # Cek nama GPU

True
1
Tesla T4


In [3]:
print(torch.version.cuda)
print(torch.backends.cudnn.version())

11.8
8700


In [4]:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(device)  # Harusnya output: "cuda"

# Coba buat tensor di GPU
x = torch.randn(3, 3).to(device)
print(x.device)  # Harusnya output: "cuda:0"

cuda
cuda:0


In [5]:
print(torch.__version__)  # Pastikan versinya 2.0.1+cu118
print(torch.cuda.is_available())  # Harusnya True
print(torch.cuda.get_device_name(0))  # Pastikan tetap Tesla T4

2.0.1+cu118
True
Tesla T4


## **Konfigurasi Awal Menggunakan Teknik Seed Reproducibility**
Menggunakan **`seed reproducibilty`** dikarenakan agar hasil eksperimen tidak berubah tiap kali dijalankan (misalnya inisialisasi bobot model, shuffling data, dll.).

In [6]:
SEED = 1234

def set_seeds(seed=1234):
    """Set seeds for reproducibility."""
    np.random.seed(seed)
    random.seed(seed)
    torch.manual_seed(seed)
    torch.cuda.manual_seed(seed)
    torch.cuda.manual_seed_all(seed)

set_seeds(seed=SEED)

cuda = True
device = torch.device("cuda" if (
    torch.cuda.is_available() and cuda) else "cpu")

print(device)

cuda


dipake nanti ketika menentukan metrics yang akan dipake yaitu `accuracy`, `F1 Score` dan `AUROC`

In [7]:
!pip install torchmetrics --no-deps

Collecting torchmetrics
  Downloading torchmetrics-1.6.2-py3-none-any.whl.metadata (20 kB)
Downloading torchmetrics-1.6.2-py3-none-any.whl (931 kB)
[?25l   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/931.6 kB[0m [31m?[0m eta [36m-:--:--[0m[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m931.6/931.6 kB[0m [31m46.4 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: torchmetrics
Successfully installed torchmetrics-1.6.2


In [8]:
print(torch.version.cuda)  # Harusnya 12.4
print(torch.cuda.is_available())  # Harusnya True
print(torch.cuda.get_device_name(0))  # Harusnya Tesla T4

11.8
True
Tesla T4


In [10]:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

# Buat tensor besar
x = torch.randn(10000, 10000, device=device)

# Coba operasi di GPU
start = time.time()
y = torch.matmul(x, x)
torch.cuda.synchronize()  # Sinkronisasi untuk timing yang akurat
end = time.time()

print(f"GPU computation time: {end - start:.4f} seconds")

GPU computation time: 0.6312 seconds
