# Prediksi Harga Tiket Pesawat dengan LSTM

## Pendahuluan
Pada notebook ini, kita akan membuat model prediksi harga tiket pesawat menggunakan metode Long Short-Term Memory (LSTM). Model ini dirancang untuk menganalisis data historis harga tiket dan memberikan prediksi harga di masa depan. Tujuan dari model ini adalah untuk membantu pengguna memahami tren harga tiket pesawat.

## Import Library yang Dibutuhkan
Kita akan menggunakan beberapa library Python untuk melakukan analisis dan membangun model LSTM.


In [None]:
# Import necessary libraries
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.preprocessing import MinMaxScaler
from keras.models import Sequential
from keras.layers import LSTM, Dense, Dropout
from sklearn.metrics import mean_squared_error


## Langkah 1: Memuat Dataset
Dataset yang digunakan adalah data harga tiket pesawat dengan berbagai fitur seperti tanggal, harga, dan maskapai. Pastikan dataset sudah dalam format Excel (.xlsx).

In [None]:
# Memuat dataset
df = pd.read_excel("1_prediksi_harga_tiket_pesawat.xlsx", parse_dates=["Date"])

# Menampilkan data awal
df.head()

## Langkah 2: Preprocessing Data
Dataset akan diolah agar sesuai untuk model LSTM. Di sini kita akan mengatur kolom 'Date' sebagai index dan memilih hanya kolom 'Flight Price' untuk diprediksi.

In [None]:
# Mengatur 'Date' sebagai index
df['Date'] = pd.to_datetime(df['Date'])
df.set_index('Date', inplace=True)

# Menggunakan hanya kolom 'Flight Price'
df = df[['Flight Price']]

# Visualisasi harga tiket pesawat
plt.figure(figsize=(10, 6))
plt.plot(df['Flight Price'])
plt.title('Harga Tiket Pesawat dari Waktu ke Waktu')
plt.xlabel('Tanggal')
plt.ylabel('Harga')
plt.show()

## Langkah 3: Normalisasi Data
Data harga tiket akan dinormalisasi menggunakan MinMaxScaler agar berada dalam rentang [0, 1]. Hal ini bertujuan untuk memperbaiki performa model LSTM.

In [None]:
# Normalisasi data harga tiket
scaler = MinMaxScaler(feature_range=(0, 1))
scaled_data = scaler.fit_transform(df[['Flight Price']])

## Langkah 4: Membagi Data Train dan Test
Data akan dibagi menjadi dua bagian: 80% untuk training dan 20% untuk testing.

In [None]:
# Membagi data menjadi train dan test
train_size = int(len(scaled_data) * 0.8)
train_data = scaled_data[:train_size]
test_data = scaled_data[train_size:]

## Langkah 5: Membuat Dataset untuk LSTM
Kita akan membuat dataset berdasarkan time-step tertentu. Dalam hal ini, kita menggunakan 30 hari terakhir sebagai input untuk memprediksi harga tiket berikutnya.

In [None]:
# Fungsi untuk membuat dataset dengan time-step tertentu
def create_dataset(data, time_step=1):
    X, y = [], []
    for i in range(len(data)-time_step-1):
        X.append(data[i:(i+time_step), 0])
        y.append(data[i+time_step, 0])
    return np.array(X), np.array(y)

# Membuat dataset train dan test
time_step = 30  # Menggunakan 30 hari terakhir
X_train, y_train = create_dataset(train_data, time_step)
X_test, y_test = create_dataset(test_data, time_step)

## Langkah 6: Membuat Model LSTM
Di langkah ini, kita akan membuat model LSTM dengan dua layer LSTM dan beberapa layer Dropout untuk mencegah overfitting.

In [None]:
# Membuat model LSTM
model = Sequential()

# Menambahkan LSTM layers
model.add(LSTM(units=50, return_sequences=True, input_shape=(X_train.shape[1], 1)))
model.add(Dropout(0.2))
model.add(LSTM(units=50, return_sequences=False))
model.add(Dropout(0.2))

# Menambahkan layer output
model.add(Dense(units=1))

# Kompilasi model
model.compile(optimizer='adam', loss='mean_squared_error')

# Melatih model
model.fit(X_train, y_train, epochs=20, batch_size=32, validation_data=(X_test, y_test))

## Langkah 7: Prediksi Harga Tiket
Setelah model dilatih, kita akan menggunakannya untuk memprediksi harga tiket pesawat pada data testing.

In [None]:
# Prediksi harga tiket dengan model yang telah dilatih
predictions = model.predict(X_test)

# Mengembalikan skala data ke bentuk asli
predictions = scaler.inverse_transform(predictions)
y_test_actual = scaler.inverse_transform(y_test.reshape(-1, 1))

## Langkah 8: Visualisasi Hasil Prediksi
Mari kita visualisasikan hasil prediksi harga tiket pesawat dibandingkan dengan harga aktual.

In [None]:
# Visualisasi hasil prediksi vs aktual
plt.figure(figsize=(10, 6))
plt.plot(df.index[len(train_data) + time_step:], y_test_actual, label='Harga Aktual')
plt.plot(df.index[len(train_data) + time_step:], predictions, label='Harga Prediksi')
plt.title('Prediksi Harga Tiket Pesawat')
plt.xlabel('Tanggal')
plt.ylabel('Harga')
plt.legend()
plt.show()

## Langkah 9: Evaluasi Model
Kita akan menggunakan Mean Squared Error (MSE) untuk mengevaluasi performa model dalam memprediksi harga tiket.

In [None]:
# Menghitung Mean Squared Error (MSE)
mse = mean_squared_error(y_test_actual, predictions)
print(f'Mean Squared Error: {mse}')

## Kesimpulan
Model LSTM ini mampu memprediksi harga tiket pesawat berdasarkan tren historis. Dengan model ini, pengguna dapat mengetahui waktu terbaik untuk membeli tiket pesawat, berdasarkan tren yang dianalisis oleh model.