In [1]:
import sys
sys.path.append('../external/tslib')

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import random
import csv
import os
import time

random.seed(42)
np.random.seed(42)

### Preprocessing

In [7]:
# 读入CSV
df = pd.read_csv('../data/request_timeseries_all.csv')

# 把 timestamp 转成 date
df['date'] = pd.to_datetime(df['timestamp'], unit='s')

# 删除原来的 timestamp
df = df.drop(columns=['timestamp'])

# 把 date 列放到最前面
df = df[['date', 'requests']]

# roll up evry 10 data points
group_size = 10
grouped = df.groupby(df.index // group_size)

# 构建结果 DataFrame：保留起始时间，计算归一化请求数
result = grouped.agg({
    "date": "first",
    "requests": lambda x: x.sum() / 120
})

result.to_csv('../data/request_timeseries_aggregated.csv', index=False)

### Experiment

In [None]:
# 内部用前70%作为训练集
from forecast.tslib_util import (
    parse_tslib_args,
    run_rslib_training,
)

args = parse_tslib_args(
    [
        '--root_path', '../data/',
        '--data_path', 'request_timeseries_aggregated.csv',
        '--model_id', 'ts_36_36',
        '--model', 'TimesNet',
        '--data', 'custom',
        '--features', 'S',
        '--target', 'requests',
        '--freq', 'h',
        '--seq_len', '36',
        '--label_len', '18',
        '--pred_len', '36',
        '--e_layers', '2',
        '--d_layers', '1',
        '--factor', '3',
        '--enc_in', '1',
        '--dec_in', '1',
        '--c_out', '1',
        '--d_model', '16',
        '--d_ff', '32',
        '--des', 'Exp',
        '--itr', '1',
        '--top_k', '5',
        '--train_epochs', '12'
        '--use_gpu', 'True'
    ]
)

run_rslib_training(args)


Using GPU
Use GPU: cuda:0
>>>>>>>start training : long_term_forecast_ts_36_36_TimesNet_custom_ftS_sl36_ll18_pl36_dm16_nh8_el2_dl1_df32_expand2_dc4_fc3_ebtimeF_dtTrue_Exp_0>>>>>>>>>>>>>>>>>>>>>>>>>>
train 5912
val 821
test 1674
	iters: 100, epoch: 1 | loss: 0.8006218
	speed: 0.1288s/iter; left time: 273.2552s
Epoch: 1 cost time: 23.77434515953064
Epoch: 1, Steps: 185 | Train Loss: 1.0592931 Vali Loss: 0.5712931 Test Loss: 1.1151127
Validation loss decreased (inf --> 0.571293).  Saving model ...
Updating learning rate to 0.0001
	iters: 100, epoch: 2 | loss: 0.3163972
	speed: 0.2978s/iter; left time: 576.4578s
Epoch: 2 cost time: 25.94798994064331
Epoch: 2, Steps: 185 | Train Loss: 0.4102752 Vali Loss: 0.3802178 Test Loss: 0.8637551
Validation loss decreased (0.571293 --> 0.380218).  Saving model ...
Updating learning rate to 5e-05
	iters: 100, epoch: 3 | loss: 0.2887527
	speed: 0.3616s/iter; left time: 633.2391s
Epoch: 3 cost time: 28.733076333999634
Epoch: 3, Steps: 185 | Train Loss: 0.

In [4]:
# 分割数据集，将数据集分为训练集和测试集，后30%作为测试集

df = pd.read_csv('../data/request_timeseries_all.csv')
train_size = int(len(df) * 0.7)
train_data = df[:train_size]
test_data = df[train_size:]
train_data.to_csv('../data/request_timeseries_train.csv', index=False)
test_data.to_csv('../data/request_timeseries_test.csv', index=False)

### Forecast

In [None]:
import numpy as np
from modelling.forecast.tslib_util import (
    TimeseriesTransformer,
    TimeseriesForecaster,
)

forecaster = TimeseriesForecaster()
forecaster.setTransformer(    
    transformer=TimeseriesTransformer(
        date_start=1734872400, date_scale=120, scale=True,
        scale_mean=3.69210541, scale_std=2.06017052
    )
)


Using cpu or mps
Use CPU


In [2]:
forecaster.forecast(
        enc_stamp = np.arange(0, 360, 10),
        enc_data = np.array([
            5.283333333333333,
            5.033333333333333,
            5.158333333333333,
            5.15,
            5.791666666666667,
            6.341666666666667,
            5.583333333333333,
            4.858333333333333,
            5.083333333333333,
            4.641666666666667,
            3.375,
            3.15,
            2.1333333333333333,
            1.8833333333333333,
            1.6,
            1.8833333333333333,
            1.4166666666666667,
            1.1416666666666666,
            0.675,
            0.4166666666666667,
            0.6416666666666667,
            0.9666666666666667,
            1.2416666666666667,
            1.1916666666666667, 
            1.1083333333333334,
            1.0916666666666666,
            0.6833333333333333,
            0.8083333333333333,
            0.8083333333333333,
            0.6916666666666667,
            0.48333333333333334,
            0.6333333333333333,
            0.7833333333333333,
            0.6333333333333333,
            1.1583333333333334,
            2.05
        ])
    )

array([2.2116888, 2.3310254, 2.523052 , 2.9497333, 2.812151 , 3.1983502,
       3.392816 , 3.762971 , 3.9305124, 4.118539 , 4.009357 , 4.2593546,
       4.32912  , 4.482236 , 4.4582357, 4.4998403, 4.4542484, 4.6175976,
       4.311565 , 4.472253 , 4.666833 , 4.3761573, 4.564841 , 4.3212533,
       4.263093 , 4.519063 , 4.6639857, 5.0408907, 4.552373 , 4.7632866,
       5.0331054, 5.0945263, 5.279776 , 5.267578 , 5.5426326, 5.5754967],
      dtype=float32)