##โหลดข้อมูลและการเตรียมข้อมูล

In [1]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
import joblib

In [12]:
df = pd.read_csv('bkk_tokyo_flight_prices.csv')

print("--- ตัวอย่างข้อมูล 5 แถวแรก ---")
print(df.head())
print("\n")

--- ตัวอย่างข้อมูล 5 แถวแรก ---
          Airline Flight_Type  Days_to_Flight  Day_of_Week  Price_THB Day_Name
0          Zipair      Direct             109            2       6940      Wed
1             JAL      Direct             116            4      23800      Fri
2    Thai Airways      Direct              94            1      18570      Tue
3    Thai Vietjet      Direct              47            6       6040      Sun
4  Thai AirAsia X      Direct              99            0       5540      Mon




In [13]:
df_prepared = pd.get_dummies(df, columns=['Airline', 'Flight_Type', 'Day_Name'], drop_first=True)

X = df_prepared.drop('Price_THB', axis=1) # ข้อมูลสำหรับทำนาย (ตัดราคาออก)
y = df_prepared['Price_THB']              # เฉลย (ราคาจริง)

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

##สร้างและเทรนโมเดล

In [8]:
print("--- กำลังเทรนโมเดล... ---")
model = LinearRegression() # เลือกใช้ Multiple Linear Regression ตามโจทย์
model.fit(X_train, y_train) # สั่งให้เรียนรู้จากข้อมูล Train
print("เทรนเสร็จเรียบร้อย! ✅")

--- กำลังเทรนโมเดล... ---
เทรนเสร็จเรียบร้อย! ✅


##วัดผล

In [9]:
# ลองให้โมเดลทำนายราคาของชุด Test
y_pred = model.predict(X_test)

# คำนวณความแม่นยำ
rmse = np.sqrt(mean_squared_error(y_test, y_pred)) # ค่าความคลาดเคลื่อนเฉลี่ย
r2 = r2_score(y_test, y_pred) # ค่าความแม่นยำเป็น % (เข้าใกล้ 1 ยิ่งดี)

print("\n--- ผลการทดสอบ ---")
print(f"RMSE (ความคลาดเคลื่อนเฉลี่ย): {rmse:.2f} บาท")
print(f"R2 Score (ความแม่นยำของโมเดล): {r2:.4f}")


--- ผลการทดสอบ ---
RMSE (ความคลาดเคลื่อนเฉลี่ย): 1508.56 บาท
R2 Score (ความแม่นยำของโมเดล): 0.9614


##บันทึกโมเดล

In [11]:
# เซฟโมเดลเก็บไว้เป็นไฟล์ .pkl
joblib.dump(model, 'flight_price_model.pkl')

# เซฟรายชื่อคอลัมน์เก็บไว้
joblib.dump(X.columns, 'model_columns.pkl')

print("\nบันทึกโมเดลเรียบร้อย: 'flight_price_model.pkl'")


บันทึกโมเดลเรียบร้อย: 'flight_price_model.pkl'
