# **BUSINESS UNDERSTANDING**

## 1. Latar Belakang Masalah

Kebutuhan energi listrik terus meningkat seiring dengan pertumbuhan populasi dan aktivitas industri. Di sisi lain, penggunaan energi fosil menimbulkan berbagai permasalahan lingkungan seperti emisi karbon dan perubahan iklim. Oleh karena itu, energi terbarukan, khususnya energi surya, menjadi salah satu solusi utama dalam transisi menuju sistem energi yang lebih berkelanjutan.

Pembangkit Listrik Tenaga Surya (PLTS) memanfaatkan radiasi matahari untuk menghasilkan energi listrik. Namun, produksi energi listrik dari panel surya tidak bersifat konstan dan sangat dipengaruhi oleh berbagai faktor lingkungan, seperti intensitas radiasi matahari, durasi penyinaran, suhu udara, kelembaban, kecepatan angin, dan kondisi atmosfer lainnya. Variabilitas ini menyebabkan kesulitan dalam melakukan perencanaan dan pengelolaan energi secara optimal.

Ketidakmampuan dalam memprediksi produksi energi listrik secara akurat dapat menimbulkan beberapa masalah, antara lain:
- Ketidakseimbangan antara pasokan dan kebutuhan energi
- Pemborosan energi listrik yang dihasilkan
- Kesulitan dalam pengambilan keputusan operasional pada sistem PLTS

Oleh karena itu, diperlukan suatu pendekatan yang mampu memprediksi produksi energi listrik panel surya secara akurat berdasarkan kondisi lingkungan, sehingga perencanaan dan pengelolaan energi dapat dilakukan dengan lebih baik.

## 2. Permasalahan Bisnis (Business Problem)
Berdasarkan latar belakang tersebut, permasalahan utama yang dihadapi dapat dirumuskan sebagai berikut:

> Bagaimana memprediksi jumlah energi listrik yang dihasilkan oleh sistem panel surya pada suatu waktu tertentu berdasarkan kondisi lingkungan yang tercatat secara historis?

Permasalahan ini bersifat:
- Prediktif, karena bertujuan memperkirakan nilai di masa mendatang
- Kuantitatif, karena output berupa nilai numerik (energi listrik)
- Real-world problem, karena terjadi pada sistem PLTS nyata

## 3. Tujuan Proyek (Business Objectives)
Tujuan dari proyek machine learning ini adalah:
1. Membangun model prediksi produksi energi listrik panel surya berdasarkan data lingkungan menggunakan algoritma Random Forest Regression.
2. Menghasilkan prediksi produksi energi listrik yang akurat dan stabil untuk mendukung perencanaan operasional sistem PLTS.
3. Menyediakan sistem prediksi yang dapat digunakan secara interaktif melalui aplikasi berbasis web (Streamlit).

## 4. Pertanyaan Bisnis (Business Questions)
Untuk mencapai tujuan tersebut, proyek ini berusaha menjawab beberapa pertanyaan utama:
1. Faktor lingkungan apa saja yang paling berpengaruh terhadap produksi energi listrik panel surya?
2. Seberapa akurat algoritma Random Forest dalam memprediksi produksi energi listrik berdasarkan data historis?
3. Bagaimana performa model prediksi jika diterapkan pada data baru yang belum pernah dilihat sebelumnya?
4. Apakah model yang dibangun cukup andal untuk digunakan sebagai alat bantu pengambilan keputusan?

## 5. Pendekatan Solusi (Data Mining / ML Approach)
Untuk menyelesaikan permasalahan tersebut, digunakan pendekatan Machine Learning dengan karakteristik sebagai berikut:
- Jenis pembelajaran: Supervised Learning
- Tipe masalah: Regression
- Algoritma utama: Random Forest Regression

Alasan Pemilihan Random Forest:
- Mampu menangani hubungan non-linear antar variabel
- Tidak sensitif terhadap noise dan outlier
- Dapat menangani banyak fitur tanpa asumsi distribusi data
- Menyediakan informasi feature importance untuk analisis faktor berpengaruh

## 6. Ruang Lingkup Proyek (Project Scope)
Agar proyek terfokus dan terukur, ruang lingkup ditetapkan sebagai berikut:

Termasuk dalam proyek:
- Pengolahan data historis produksi energi dan kondisi lingkungan
- Penerapan algoritma Random Forest untuk prediksi energi
- Evaluasi performa model menggunakan metrik regresi
- Deployment model dalam aplikasi Streamlit

Tidak termasuk dalam proyek:
- Optimasi perangkat keras panel surya
- Integrasi dengan sistem PLTS secara real-time
- Penggunaan algoritma deep learning

## 7. Kriteria Keberhasilan (Success Criteria)
Proyek ini dinyatakan berhasil apabila:
- Model Random Forest mampu memprediksi produksi energi listrik dengan tingkat kesalahan yang rendah (nilai MAE dan RMSE kecil).
- Nilai koefisien determinasi (RÂ²) menunjukkan bahwa model mampu menjelaskan sebagian besar variasi data.
- Aplikasi Streamlit dapat menerima input data lingkungan dan menampilkan hasil prediksi dengan baik.
- Hasil prediksi dan analisis dapat dipahami serta dijelaskan secara logis dan ilmiah.

## 8. Rencana Proyek Awal (Initial Project Plan)
Secara garis besar, proyek ini akan dilakukan melalui tahapan berikut:
1. Business Understanding: `Mendefinisikan permasalahan, tujuan, dan ruang lingkup proyek.`
2. Data Understanding: `Menganalisis struktur dataset, karakteristik data, serta pola awal.`
3. Data Preparation: `Membersihkan data, menangani missing value, dan menyiapkan data untuk modeling.`
4. Modeling: `Melatih model Random Forest Regression dan melakukan tuning parameter.`
5. Evaluation: `Mengevaluasi performa model menggunakan metrik regresi.`
6. Deployment: `Mengimplementasikan model ke dalam aplikasi web menggunakan Streamlit.`