# Selamat Datang di Kursus Prediksi Berdasarkan Urutan Waktu

Selamat datang di kursus ini mengenai urutan waktu dan prediksi, yang merupakan bagian dari spesialisasi **TensorFlow in Practice**. Dalam kursus ini, kita akan berfokus pada **time series** atau **deret waktu**, di mana Anda akan mempelajari berbagai jenis deret waktu sebelum kita membahas lebih dalam penggunaannya dalam data analisis.

---

## Minggu 1: Mengenal Deret Waktu dan Dasar-dasar Peramalan
Pada minggu ini, kita akan memahami deret waktu itu sendiri. Kita akan melihat beberapa contoh dari berbagai jenis deret waktu, serta mempelajari dasar-dasar peramalan. Anda juga akan mulai menyiapkan data deret waktu untuk algoritma pembelajaran mesin. Contohnya, bagaimana cara membagi data deret waktu ke dalam set **pelatihan**, **validasi**, dan **pengujian**?

Kita akan mengeksplorasi beberapa praktik terbaik dan alat yang dapat membantu mempersiapkan Anda untuk **minggu ke-2**, di mana kita akan mulai menggunakan model kepadatan sederhana untuk peramalan dan membandingkannya dengan prediksi naif berbasis analisis numerik sederhana.

---

## Minggu 2: Membuat Model Padat untuk Prediksi Deret Waktu
Pada minggu ke-2, kita akan menggunakan **model padat (dense model)** untuk membuat prediksi deret waktu. Anda akan belajar perbedaan antara model ini dengan prediksi sederhana berbasis angka saja.

---

## Minggu 3: Menggunakan Jaringan Saraf Rekurens untuk Peramalan
Minggu ke-3 akan fokus pada **jaringan saraf rekurens (RNN)** untuk peramalan deret waktu. Kita akan belajar tentang pendekatan **stateless** dan **stateful**, melatih model pada **windows** atau potongan data, dan Anda akan melakukan peramalan secara mandiri.

---

## Minggu 4: Menambahkan Konvolusi untuk Peramalan yang Lebih Akurat
Pada minggu terakhir, kita akan menambahkan **konvolusi** pada model dan menggabungkan semua teknik yang telah Anda pelajari. Kita akan melakukan peramalan data nyata, seperti **aktivitas bintik matahari selama 250 tahun terakhir**.

---

### Apa Itu Deret Waktu?
Deret waktu ada di mana-mana, seperti pada harga saham, ramalan cuaca, atau tren sejarah (misalnya, Hukum Moore). Dalam contoh berikut, kita bisa melihat grafik jumlah transistor per milimeter persegi dari tahun ke tahun, yang menunjukkan korelasi dengan **Hukum Moore**.

**Contoh menarik** lainnya adalah korelasi antara pendapatan dari arcade video game dengan jumlah gelar doktor yang diberikan di bidang ilmu komputer di AS, meskipun korelasi ini bersifat **kebetulan**.

### Definisi dan Jenis Deret Waktu
Umumnya, deret waktu didefinisikan sebagai **urutan nilai yang teratur dan berjarak sama dalam waktu**. Misalnya, data tahunan pada grafik Hukum Moore atau data harian pada ramalan cuaca.

- **Univariate Time Series**: Deret waktu dengan satu nilai di setiap langkah waktu. Contohnya, harga saham harian.
- **Multivariate Time Series**: Deret waktu dengan beberapa nilai pada setiap langkah waktu. Contohnya adalah data **kelahiran dan kematian** di Jepang dari 1950 hingga 2008, yang menunjukkan penurunan populasi ketika kematian mulai melampaui kelahiran.

### Contoh Multivariate Lainnya
Contoh lain yang berguna adalah membandingkan **suhu global** terhadap **konsentrasi CO2**. Sebagai univariate, keduanya akan menunjukkan tren masing-masing, namun ketika digabungkan, korelasinya menjadi lebih jelas.

---

### Pergerakan Kendaraan sebagai Deret Waktu
Pergerakan kendaraan juga bisa diplot sebagai deret univariate atau multivariate. Misalnya, perjalanan mobil dapat diukur berdasarkan **latitude** dan **longitude** di setiap langkah waktu. Seiring berjalannya waktu, pergerakan mobil dapat ditampilkan sebagai grafik longitude yang menurun dan latitude yang meningkat berdasarkan arah.

---

Mari kita mulai menjelajahi **deret waktu** ini, mengenal apa saja jenis-jenisnya, dan bagaimana kita dapat menggunakannya dalam pembelajaran mesin untuk memprediksi kejadian di masa depan.

|

# Memahami Time Series: Pola dan Karakteristik Umum

Time series datang dalam berbagai bentuk dan ukuran, tetapi ada sejumlah pola umum yang penting untuk dikenali ketika Anda menjumpainya. Berikut adalah beberapa pola utama yang sering ditemui dalam time series.

## 1. **Tren (Trend)**
   Tren terjadi ketika suatu time series memiliki arah spesifik yang terus bergerak ke atas atau ke bawah. Contohnya, dalam contoh hukum Moore yang menunjukkan peningkatan kemampuan komputer secara bertahap, kita melihat tren yang mengarah ke atas.

![image.png](attachment:image.png)

## 2. **Musiman (Seasonality)**
   Musiman adalah pola yang berulang pada interval waktu yang dapat diprediksi. Sebagai contoh, lihat grafik yang menunjukkan pengguna aktif di situs web untuk pengembang perangkat lunak. Polanya menunjukkan penurunan reguler, yang bisa diasumsikan terjadi di akhir pekan saat aktivitas pengguna berkurang. Contoh lain dari musiman adalah situs belanja yang ramai di akhir pekan atau situs olahraga yang memuncak pada momen-momen tertentu seperti hari pembukaan, pertandingan all-star, playoff, atau final.

![image-3.png](attachment:image-3.png)

## 3. **Gabungan Tren dan Musiman**
   Beberapa time series dapat menunjukkan kombinasi antara tren dan musiman. Grafik seperti ini menunjukkan tren naik secara keseluruhan, tetapi memiliki puncak dan palung pada interval tertentu.

![image-4.png](attachment:image-4.png)

## 4. **White Noise**
   Beberapa time series mungkin tidak memiliki pola yang jelas dan hanya berupa nilai acak, yang biasanya disebut sebagai *white noise*. Data jenis ini tidak memiliki banyak informasi yang bisa digunakan.

![image-2.png](attachment:image-2.png)

## 5. **Autokorelasi (Auto-Correlated Time Series)**
   Autokorelasi terjadi ketika time series berkorelasi dengan salinan tertunda dari dirinya sendiri (disebut *lag*). Sebagai contoh, pada lag 1, ada autokorelasi yang kuat. Hal ini menunjukkan bahwa nilai pada langkah waktu tertentu berkaitan dengan nilai sebelumnya. Terkadang, time series dengan autokorelasi disebut memiliki "memori" karena langkah saat ini tergantung pada nilai sebelumnya. Dalam kasus ini, lonjakan yang terjadi secara acak disebut sebagai *innovations* yang tidak dapat diprediksi berdasarkan nilai sebelumnya.

![image-5.png](attachment:image-5.png)
![image-6.png](attachment:image-6.png)
![image-7.png](attachment:image-7.png)

## 6. **Multi-Autokorelasi**
   Pada contoh lain, terdapat autokorelasi pada beberapa lag, misalnya pada lag 1 dan 50. Autokorelasi pada lag 1 memberikan penundaan eksponensial jangka pendek, sedangkan lag 50 memberikan "pantulan kecil" setelah setiap lonjakan.

![image-8.png](attachment:image-8.png)

## 7. **Time Series Non-Stasioner (Non-Stationary Time Series)**
   Dalam beberapa kasus, time series mungkin memiliki tren positif dan musiman yang jelas hingga suatu titik waktu, setelah itu perilakunya berubah drastis. Misalnya, jika ini adalah harga saham, mungkin terjadi krisis finansial atau skandal besar yang mengubah trennya menjadi turun tanpa musiman yang jelas. Time series seperti ini disebut *non-stationary*. Untuk memprediksi time series seperti ini, kita mungkin perlu membatasi data pelatihan pada periode tertentu saja.

![image-9.png](attachment:image-9.png)

## 8. **Time Series Stasioner (Stationary Time Series)**
   Time series dikatakan stasioner jika perilakunya tidak berubah seiring waktu. Dalam kasus ini, semakin banyak data yang dimiliki, semakin baik kinerja model prediksi. Namun, jika time series non-stasioner, maka jendela waktu optimal untuk pelatihan akan bervariasi.

## Kesimpulan
Time series yang Anda temui dalam kehidupan nyata kemungkinan memiliki sedikit dari setiap karakteristik ini: tren, musiman, autokorelasi, dan noise. Model machine learning dirancang untuk mendeteksi pola, sehingga kita bisa membuat prediksi. Namun, kita harus mengakui bahwa ini mengasumsikan pola di masa lalu akan berlanjut ke masa depan.

Pada akhirnya, kita akan memulai kursus ini dengan menggunakan workbook untuk menghasilkan deret seperti yang Anda lihat di atas. Setelah itu, kita akan mencoba memprediksi beberapa deret sintetis ini sebagai latihan, sebelum nanti beralih ke data nyata.



# Peramalan (_Forecasting_) pada _Time Series_ dengan Teknik Partisi

Dalam video-video sebelumnya minggu ini, Anda telah mempelajari berbagai faktor yang membentuk perilaku _time series_. Sekarang, kita akan mulai melihat teknik-teknik yang dapat digunakan untuk meramalkan _time series_ tersebut.

## Dasar-Dasar Peramalan: Naive Forecasting

Mari kita mulai dengan contoh _time series_ yang mengandung tren, musiman (_seasonality_), dan kebisingan (_noise_), yang cukup realistis untuk saat ini. Sebagai contoh, kita bisa mengambil nilai terakhir dan mengasumsikan bahwa nilai berikutnya akan sama dengan nilai tersebut. Teknik ini disebut **naive forecasting**.

> Misalnya, kita bisa memperbesar bagian dari dataset untuk menunjukkan cara kerja naive forecasting. Teknik ini bisa kita gunakan untuk mendapatkan baseline (patokan awal) yang cukup baik sebagai langkah awal. Percaya atau tidak, baseline ini bisa sangat membantu dalam mengukur performa dasar.

## Mengukur Kinerja Model Peramalan

Untuk mengukur performa dari model peramalan, biasanya kita membagi _time series_ menjadi tiga periode:

1. **Periode Pelatihan (Training Period)**: digunakan untuk melatih model.
2. **Periode Validasi (Validation Period)**: digunakan untuk menguji dan menyetel model.
3. **Periode Pengujian (Test Period)**: digunakan untuk mengukur performa akhir model.

### Partisi Tetap (_Fixed Partitioning_)

Teknik pembagian ini dikenal dengan nama **partisi tetap (_fixed partitioning_)**. Jika _time series_ memiliki komponen musiman, setiap periode sebaiknya mencakup satu atau lebih musim penuh (misalnya, satu atau dua tahun). Hal ini dilakukan agar semua bulan atau musim terwakili secara proporsional dalam data pelatihan, validasi, dan pengujian.

![image.png](attachment:image.png)

> **Catatan:** Meskipun partisi ini terlihat berbeda dari pembagian data pada _dataset_ non-_time series_ (di mana biasanya kita memilih nilai secara acak untuk pelatihan, validasi, dan pengujian), dampaknya pada kinerja model tetap sama.

## Latihan dan Validasi Model

Selanjutnya, Anda akan melatih model pada periode pelatihan dan mengevaluasinya pada periode validasi. Pada tahap ini, Anda dapat bereksperimen untuk menemukan arsitektur model yang tepat serta menyetel hyperparameter hingga Anda mendapatkan performa yang diinginkan, yang diukur menggunakan _validation set_.

Setelah model divalidasi, biasanya Anda dapat melatih ulang model menggunakan gabungan data dari periode pelatihan dan validasi, kemudian mengujinya pada periode pengujian (_test period_) untuk melihat apakah performanya tetap stabil. Jika hasilnya memuaskan, Anda bisa memilih untuk melatih ulang menggunakan data dari periode pengujian juga, karena:

> **Alasan:** Data dari periode pengujian adalah data yang paling dekat dengan titik waktu saat ini, dan biasanya memberikan sinyal yang lebih kuat untuk memprediksi nilai di masa depan.

Karena alasan ini, dalam beberapa kasus umum, pengujian pada periode pengujian bahkan bisa dilewati, dan hanya menggunakan periode pelatihan dan validasi saja. Set pengujian tersebut nantinya akan menggunakan data di masa depan.

## Partisi Maju (_Roll Forward Partitioning_)

Teknik partisi lainnya adalah **partisi maju (_roll forward partitioning_)**. Teknik ini dimulai dengan periode pelatihan yang pendek, lalu meningkatkannya secara bertahap (misalnya, per hari atau per minggu).

![image-2.png](attachment:image-2.png)

Pada setiap iterasi:
1. Model dilatih pada periode pelatihan,
2. Hasilnya digunakan untuk memprediksi nilai pada periode validasi berikutnya.

> Teknik ini pada dasarnya adalah melakukan partisi tetap secara bertahap, memungkinkan model terus diperbarui untuk meningkatkan akurasi prediksi.

Di kursus ini, kita akan fokus pada metode partisi tetap (_fixed partitioning_), dan Anda juga akan belajar cara menggunakan kode dasar untuk melakukan prediksi _time series_.



# Evaluasi Model dan Metrik Performa

Setelah kita memiliki model dan periode evaluasi, kita dapat mengevaluasi performa model tersebut menggunakan suatu metrik.

## Menghitung Error
Langkah pertama adalah menghitung *errors*, yaitu selisih antara nilai yang diprediksi oleh model dengan nilai aktual selama periode evaluasi.

**Metric** yang paling umum untuk mengevaluasi performa *forecasting* adalah **Mean Squared Error** atau **MSE**. Dalam MSE, error dikuadratkan terlebih dahulu sebelum dihitung rata-ratanya. 

### Mengapa Error Dikuadratkan?
Tujuan dari mengkuadratkan error adalah untuk menghilangkan nilai negatif. Misalnya:
- Jika error adalah 2 di atas nilai sebenarnya, maka error adalah +2.
- Jika error adalah 2 di bawah nilai sebenarnya, maka error adalah -2.
  
Tanpa dikuadratkan, kedua error ini akan saling menghapus saat dihitung rata-ratanya, yang salah karena sebenarnya ada dua error, bukan nol. Dengan mengkuadratkan, kedua error ini menghasilkan 4, sehingga tidak saling membatalkan.

## Root Mean Squared Error (RMSE)
Jika kita ingin hasil rata-rata error memiliki skala yang sama dengan error asli, kita bisa menghitung akar kuadratnya, yang disebut **Root Mean Squared Error** atau **RMSE**.

## Mean Absolute Error (MAE)
Metrik lain yang juga populer adalah **Mean Absolute Error** (MAE), juga dikenal sebagai **Mean Absolute Deviation** (MAD). Alih-alih mengkuadratkan, MAE hanya menggunakan nilai absolut dari error, sehingga tidak menghapus nilai negatif. 

MAE tidak menghukum error besar sekeras MSE. Oleh karena itu, **pilihan metrik tergantung pada tugas** yang sedang Anda kerjakan:
- Jika error besar berbahaya dan menimbulkan kerugian besar, maka MSE mungkin lebih cocok.
- Jika kerugian sebanding dengan besarnya error, MAE mungkin lebih cocok.

## Mean Absolute Percentage Error (MAPE)
Anda juga bisa mengukur **Mean Absolute Percentage Error** (MAPE), yaitu rata-rata rasio antara error absolut dan nilai absolutnya. MAPE memberikan gambaran tentang seberapa besar error relatif terhadap nilai-nilai sebenarnya.

## Contoh Kode Menghitung MAE
Untuk menghitung MAE pada data, Anda bisa menggunakan *library* Keras, seperti contoh berikut:


In [2]:
import tensorflow as tf

# Menggunakan MAE dari Keras
mae_metric = tf.keras.metrics.MeanAbsoluteError()
actual_values = [10, 20, 30, 40]  # contoh nilai aktual
predicted_values = [12, 22, 27, 35]  # contoh nilai prediksi
mae_metric.update_state(actual_values, predicted_values)
mae_result = mae_metric.result().numpy()
print(f"Mean Absolute Error: {mae_result}")

Mean Absolute Error: 3.0


# Metode Peramalan yang Sederhana: Moving Average

Salah satu metode peramalan yang umum dan sangat sederhana adalah dengan menghitung **moving average**. Ide dasarnya adalah garis kuning yang merupakan plot dari rata-rata nilai biru selama periode tetap yang disebut **averaging window**, misalnya, 30 hari. Metode ini menghilangkan banyak **noise** dan memberikan kita kurva yang kira-kira menyerupai deret asli, tetapi tidak dapat memperkirakan **trend** atau **seasonality**.

## Keterbatasan Moving Average

Bergantung pada waktu saat ini, yaitu periode setelah Anda ingin memperkirakan masa depan, metode ini bisa jadi lebih buruk daripada peramalan **naive**. Sebagai contoh, saya mendapatkan **mean absolute error** sekitar 7.14. Salah satu metode untuk menghindari ini adalah dengan menghapus tren dan musiman dari deret waktu menggunakan teknik yang disebut **differencing**. 

Alih-alih mempelajari deret waktu itu sendiri, kita mempelajari perbedaan antara nilai pada waktu T dan nilai pada periode sebelumnya. Tergantung pada waktu data Anda, periode tersebut bisa satu tahun, satu hari, satu bulan, atau yang lainnya. Mari kita lihat data setahun sebelumnya.

![image.png](attachment:image.png)

## Menerapkan Differencing

Jadi, untuk data ini, pada waktu T minus 365, kita akan mendapatkan deret waktu perbedaan yang tidak memiliki tren dan musiman. Kita kemudian dapat menggunakan rata-rata bergerak untuk memperkirakan deret waktu ini, yang memberikan kita peramalan ini. Namun, ini hanyalah peramalan untuk deret waktu perbedaan, bukan deret waktu asli.

Untuk mendapatkan peramalan akhir untuk deret waktu asli, kita hanya perlu menambahkan kembali nilai pada waktu T minus 365, dan kita akan mendapatkan peramalan ini. Mereka terlihat jauh lebih baik, bukan? Jika kita mengukur mean absolute error pada periode validasi, kita mendapatkan sekitar 5.8. Ini sedikit lebih baik daripada peramalan naif, tetapi tidak jauh lebih baik.

![image-2.png](attachment:image-2.png)

![image-3.png](attachment:image-3.png)

## Mengatasi Noise

Anda mungkin telah memperhatikan bahwa moving average kita menghapus banyak noise, tetapi peramalan akhir kita masih cukup bising. Dari mana kebisingan ini berasal? Kebisingan tersebut berasal dari nilai masa lalu yang kita tambahkan kembali ke dalam peramalan kita. 

Kita dapat memperbaiki peramalan ini dengan juga menghapus kebisingan masa lalu menggunakan moving average. Jika kita melakukan itu, kita mendapatkan peramalan yang jauh lebih halus. Faktanya, ini memberikan kita **mean squared error** selama periode validasi sekitar 4.5. 

Sekarang, itu jauh lebih baik daripada semua metode sebelumnya. Faktanya, karena deret ini dihasilkan, kita dapat menghitung bahwa model sempurna akan memberikan mean absolute error sekitar empat akibat kebisingan. Ternyata, dengan pendekatan ini, kita tidak terlalu jauh dari yang optimal. 

![image-4.png](attachment:image-4.png)

![image-5.png](attachment:image-5.png)

## Kesimpulan

Ingatlah ini sebelum Anda terburu-buru masuk ke **deep learning**. Pendekatan sederhana kadang-kadang dapat bekerja dengan baik.
