<a href="https://colab.research.google.com/github/kankkw/229352-StatisticalLearning/blob/main/Lab07.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

ปฏิบัติการครั้งที่ 7 กระบวนวิชา 229351 Statistical Learning for Data Science

คำชี้แจง

ให้เริ่มทำปฏิบัติการจาก colab notebook หรือไฟล์ *.ipynb ที่กำหนดให้ จากนั้นบันทึกไว้เป็นไฟล์ *.pdf แล้วส่งใน Assignments

ดาวน์โหลดข้อมูลรถยนต์ชนิดต่างใน link ข้างล่างนี้  
https://donlapark.pages.dev/229351/data/elecequip.csv

In [None]:
# uploading the csv file to colab

!wget -O elecequip.csv https://donlapark.pages.dev/229351/data/elecequip.csv

In [None]:
# import module ที่ต้องใช้
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from datetime import datetime

In [None]:
# parse_dates ชื่อของคอลัมน์ที่จะเปลี่ยนให้เป็น datetime
# index_col ชื่อของคอลัมน์ที่จะให้เป็น index
# date_parser ฟังก์ชันที่เปลี่ยน string ให้เป็น datetime
data = pd.read_csv('elecequip.csv', parse_dates=['time'],
                                        index_col='time',
                                        date_format='%Y-%m')

data

In [None]:
plt.figure(figsize=(12,6))
plt.plot(data["value"]);

In [None]:
# subsetting data at specified date

data

In [None]:
# Add or change values

data.loc['2012-03-02','value'] = 86

data

# Moving average

In [None]:
data['MA'] = data['value'].rolling(window=5,center=True).mean()
#data['MA'] = data['value'].rolling(window=12,center=True).mean().rolling(window=2).mean().shift(-1)

data.head(12)

In [None]:
plt.figure(figsize=(12,6))
plt.plot(data['value'])
plt.plot(data['MA']);

# Classical decomposition

In [None]:
from statsmodels.tsa.seasonal import seasonal_decompose
import matplotlib as mpl

mpl.rc("figure", figsize=(12,6))
result_add = seasonal_decompose(data['value'], model='additive')

result_add.plot();

In [None]:
result_mul = seasonal_decompose(data['value'], model='multiplicative')

result_mul.plot();

### เรียกดูแต่ละส่วน

In [None]:
print(result_add.trend)
print(result_add.seasonal)
print(result_add.resid)
print(result_add.observed)

### ปฏิบัติการครั้งที่ 7
1. สร้างโมเดลเพื่อการทำนายดังนี้
1.1 แบ่งข้อมูลออกเป็น 2 ส่วน
   - training set: วันที่ 1996-01-01 ถึง 2009-12-01
   - test set: วันที่ 2010-01-01 ถึง 2012-03-01  
1.2 แยกส่วนประกอบ $y_t=S_t+T_t+R_t$ บน training set
1.3 สร้าง time series ชุดใหม่ที่แสดงถึงทำนายค่าบน test set โดยนำค่า $T_t+R_t$ ของวันล่าสุดใน training set ที่มีค่า $T_t$ มาบวกกับแต่ละค่าใน $S_t$ จากวันที่ วันที่ 2010-01-01 ถึง 2012-03-01  
3. คำนวณ RMSE โดยใช้ฟังก์ชัน `rmse` ข้างล่าง
4. แสดงแผนภาพข้อมูล elecequip และค่าทำนายที่ได้

In [None]:
def rmse(y_true, y_pred):
    import numpy as np
    y_true = np.asarray(y_true, dtype=float)
    y_pred = np.asarray(y_pred, dtype=float)
    return np.sqrt(np.nanmean((y_true - y_pred) ** 2))

In [None]:

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from statsmodels.tsa.seasonal import seasonal_decompose

train = data.loc["1996-01-01":"2009-12-01"].copy()
test  = data.loc["2010-01-01":"2012-03-01"].copy()

display(train.tail())
display(test.head())

decomp = seasonal_decompose(train['value'], model='additive', period=12)
trend, seasonal, resid = decomp.trend, decomp.seasonal, decomp.resid

fig = decomp.plot()
plt.show()

last_TR = (trend + resid).dropna().iloc[-1]

seasonal_mo = seasonal.groupby(seasonal.index.month).mean()

forecast = test.copy()
forecast['forecast'] = [last_TR + seasonal_mo[m] for m in test.index.month]

display(forecast.head())

In [None]:
error = rmse(test['value'], forecast['forecast'])
error

In [None]:
plt.figure(figsize=(12,6))
plt.plot(data.index, data['value'], label="Actual")
plt.plot(forecast.index, forecast['forecast'], label="Forecast", color="red")
plt.axvline(pd.Timestamp("2010-01-01"), color="black", linestyle="--")
plt.legend()
plt.title("Electric Equipment: Actual vs Forecast (Lab 7)")
plt.xlabel("Time")
plt.ylabel("Value")
plt.show()