# Business Understanding: Prediksi Kadar NO₂ di Kota Pematang Siantar
## Latar Belakang
Kualitas udara merupakan salah satu indikator penting dalam menilai kesehatan lingkungan perkotaan. Salah satu parameter utama dalam menilai kualitas udara adalah kadar Nitrogen Dioksida (NO₂), gas pencemar yang dihasilkan terutama dari aktivitas transportasi, pembakaran bahan bakar fosil, dan proses industri. Konsentrasi NO₂ yang tinggi dapat menimbulkan dampak negatif terhadap kesehatan manusia seperti gangguan pernapasan, serta berkontribusi terhadap pembentukan ozon troposferik dan hujan asam.

Kota Pematang Siantar merupakan salah satu wilayah perkotaan di Sumatera Utara dengan tingkat aktivitas transportasi dan kepadatan penduduk yang relatif tinggi. Namun, sistem pemantauan kualitas udara di daerah ini masih terbatas. Dengan kemajuan teknologi penginderaan jauh, data satelit seperti Sentinel-5P (Sentinel-5 Precursor) yang dikembangkan oleh European Space Agency (ESA) dan tersedia melalui Copernicus Dataspace Ecosystem, memungkinkan analisis spasial dan temporal terhadap konsentrasi NO₂ secara lebih sistematis dan berkelanjutan.

Penelitian ini memanfaatkan data pengamatan Sentinel-5P untuk membangun model prediksi kadar NO₂ harian (jangka pendek) di wilayah Pematang Siantar. Dengan pendekatan ini, diharapkan dapat dihasilkan sistem prediksi yang mampu memberikan gambaran awal mengenai potensi peningkatan polusi udara dalam waktu dekat (besok hingga lusa).

## Permasalahan
Permasalahan utama yang ingin diselesaikan dalam penelitian ini adalah bagaimana memprediksi kadar NO₂ harian pada periode waktu jangka pendek dengan memanfaatkan data historis dari satelit Sentinel-5P.

Tantangan utama meliputi:
- Keterbatasan resolusi spasial dan temporal data satelit terhadap fenomena lokal.

- Penentuan metode pemodelan regresi yang tepat untuk menghasilkan prediksi yang akurat dan reliabel.
- Pemanfaatkan data historis konsentrasi NO₂ untuk memprediksi kadar NO₂ pada hari berikutnya

## Tujuan
Proyek ini bertujuan untuk membangun sistem prediksi konsentrasi NO₂ harian menggunakan pendekatan machine learning, khususnya algoritma K-Nearest Neighbors Regression (KNN Regression).

Tujuan utamanya adalah:
- Mengolah dan mengekstraksi data kadar NO₂ dari citra Sentinel-5P untuk wilayah Pematang Siantar dalam periode tiga bulan terakhir.

- Melakukan preprocessing data untuk menghasilkan dataset time-series yang bersih dan siap dianalisis.

- Membangun model prediksi jangka pendek kadar NO₂ menggunakan algoritma KNN regresion berbasis data historis.

- Mengevaluasi performa model berdasarkan metrik error seperti MAE, MSE dan R-Squared.

- Menilai potensi penerapan hasil prediksi sebagai sistem peringatan dini terhadap peningkatan polusi udara.

## Manfaat
Hasil analisis ini diharapkan memberikan manfaat strategis bagi berbagai pihak, antara lain:

- Pemerintah Daerah/Dinas Lingkungan Hidup (DLH): Mendukung proses pemantauan kualitas udara dengan sistem prediksi sederhana dan hemat sumber daya.

- Masyarakat: Mendapatkan informasi dini tentang potensi peningkatan polusi udara untuk mencegah dampak kesehatan.

- Peneliti/Akademisi : Menjadi contoh penerapan model regresi non-parametrik (KNN Regression) dalam bidang prediksi lingkungan berbasis data terbuka.


## Ruang Lingkup
Proyek ini difokuskan pada prediksi konsentrasi NO₂ harian di wilayah tertentu berdasarkan data yang diperoleh dari Copernicus Data Space Ecosystem (melalui API openEO).

Ciri utama dataset:

- Data diambil dari citra satelit Copernicus Sentinel.

- Variabel utama: konsentrasi NO₂ per hari.

- Periode data: 3 bulan terakhir (historical daily data).

- Data digunakan untuk membangun model prediksi kadar NO₂ pada hari berikutnya (t+1).

Pendekatan model yang digunakan adalah K-Nearest Neighbors Regression (KNN Regression), yang memprediksi nilai berdasarkan kesamaan data historis (jarak antara titik data).

Model ini dipilih karena:

- Sederhana dan mudah diterapkan.

- Tidak mengasumsikan bentuk hubungan linear antar data.

- Cocok untuk data lingkungan yang sering bersifat non-linear dan fluktuatif.


## Indikator Keberhasilan
Indikator keberhasilan penelitian ini dibagi menjadi dua aspek:

1. Indikator Teknis:
    - Nilai Root Mean Square Error (RMSE), Mean Absolute Error (MAE), dan Mean Absolute Percentage Error (MAPE) berada pada tingkat yang menunjukkan akurasi model prediksi yang baik.
    - Model mampu mengikuti pola perubahan kadar NO₂ aktual berdasarkan tren historis.

2. Indikator Bisnis (Konteks Lingkungan):
    - Prediksi yang dihasilkan dapat berfungsi sebagai peringatan dini terhadap peningkatan kadar NO₂ pada hari berikutnya.

    - Sistem dapat membantu meningkatkan kesadaran masyarakat dan kebijakan mitigasi terhadap polusi udara.