# 시계열 분석의 기본 개념

* 시계열 분석은 단일 또는 다변 수치 값으로 자기회귀하여 데이터의 트랜드와 반복패턴을 찾아 예측하는 분석 기법
* 자기회귀(Autoregression)는 이전 시간 단계의 관측값을 입력으로 사용하여 회귀 방정식을 구성하여 다음 시간 단계의 값을 예측하는   
  시계열 모델입니다.

# 데이터 로드

* 한국부동산원_전국주택가격동향조사_월별동향_아파트_매매가격(평균매매가격)_20240630(단위: 천원)

In [12]:
import pandas as pd

# Load the dataset from the CSV file using pandas
# df = pd.read_csv("https://github.com/ourownstory/neuralprophet-data/raw/main/kaggle-energy/datasets/tutorial01.csv")
df = pd.read_csv("20240630_DFdata.csv")

In [13]:
df.head()

Unnamed: 0.1,Unnamed: 0,ds,y
0,0,2012-01,264474.0
1,1,2012-02,264035.0
2,2,2012-03,263470.0
3,3,2012-04,262630.0
4,4,2012-05,261823.0


In [14]:
df= df[['ds','y']]

# 모델 생성

* 최적화를 위한 학습과 조기 종료는 모델 내부에서 자동으로 결정한다.

In [15]:
# NeuralProphet 클래스 불러오기
from neuralprophet import NeuralProphet, set_log_level

# 오류가 아닌 경우 로깅 메시지 비활성화
set_log_level("ERROR")

# 기본 매개변수로 NeuralProphet 모델 생성
m = NeuralProphet()

# 데이터셋에 모델 피팅하기 (이 과정은 시간이 걸릴 수 있습니다)
metrics = m.fit(df)

Training: |                                                                                      | 0/? [00:00<…

Finding best initial lr:   0%|          | 0/209 [00:00<?, ?it/s]

Training: |                                                                                      | 0/? [00:00<…

# 시계열 예측

In [16]:
# 예측용으로 미래로부터 12달까지의 새로운 데이터프레임 생성, 
# n_historic_predictions는 과거 데이터도 포함됨
df_future = m.make_future_dataframe(df, n_historic_predictions=True, periods=12)

# 미래 예측
forecast = m.predict(df_future)


The behavior of DataFrame concatenation with empty or all-NA entries is deprecated. In a future version, this will no longer exclude empty or all-NA columns when determining the result dtypes. To retain the old behavior, exclude the relevant entries before the concat operation.




Predicting: |                                                                                    | 0/? [00:00<…

In [17]:
# 예측 시각화
m.plot(forecast)


The behavior of DatetimeProperties.to_pydatetime is deprecated, in a future version this will return a Series containing python datetime objects instead of an ndarray. To retain the old behavior, call `np.array` on the result




FigureWidgetResampler({
    'data': [{'fill': 'none',
              'line': {'color': 'rgba(45, 146, 255, 1.0)', 'width': 2},
              'mode': 'lines',
              'name': 'yhat1',
              'type': 'scatter',
              'uid': '1b33ff90-9a55-4f84-9c5e-f35ddb663358',
              'x': array([datetime.datetime(2012, 1, 1, 0, 0),
                          datetime.datetime(2012, 2, 1, 0, 0),
                          datetime.datetime(2012, 3, 1, 0, 0),
                          datetime.datetime(2012, 4, 1, 0, 0),
                          datetime.datetime(2012, 5, 1, 0, 0),
                          datetime.datetime(2012, 6, 1, 0, 0),
                          datetime.datetime(2012, 7, 1, 0, 0),
                          datetime.datetime(2012, 8, 1, 0, 0),
                          datetime.datetime(2012, 9, 1, 0, 0),
                          datetime.datetime(2012, 10, 1, 0, 0),
                          datetime.datetime(2012, 11, 1, 0, 0),
                       

* 예측의 구성 요소로 이루어져 있습니다: 
    * 추세, 연간 및 주간 계절성. => 이들은 합쳐져 예측을 생

In [11]:
m.plot_parameters(components=["trend", "seasonality"])


The behavior of DatetimeProperties.to_pydatetime is deprecated, in a future version this will return a Series containing python datetime objects instead of an ndarray. To retain the old behavior, call `np.array` on the result



The behavior of DatetimeProperties.to_pydatetime is deprecated, in a future version this will return a Series containing python datetime objects instead of an ndarray. To retain the old behavior, call `np.array` on the result



The behavior of DatetimeProperties.to_pydatetime is deprecated, in a future version this will return a Series containing python datetime objects instead of an ndarray. To retain the old behavior, call `np.array` on the result



The behavior of DatetimeProperties.to_pydatetime is deprecated, in a future version this will return a Series containing python datetime objects instead of an ndarray. To retain the old behavior, call `np.array` on the result




FigureWidgetResampler({
    'data': [{'fill': 'none',
              'line': {'color': '#2d92ff', 'width': 2},
              'mode': 'lines',
              'name': 'Trend',
              'type': 'scatter',
              'uid': '06604f9a-9d7a-4d4b-a86f-8f76a45c74fc',
              'x': array([datetime.datetime(2012, 1, 1, 0, 0),
                          datetime.datetime(2012, 2, 1, 0, 0),
                          datetime.datetime(2012, 3, 1, 0, 0),
                          datetime.datetime(2012, 4, 1, 0, 0),
                          datetime.datetime(2012, 5, 1, 0, 0),
                          datetime.datetime(2012, 6, 1, 0, 0),
                          datetime.datetime(2012, 7, 1, 0, 0),
                          datetime.datetime(2012, 8, 1, 0, 0),
                          datetime.datetime(2012, 9, 1, 0, 0),
                          datetime.datetime(2012, 10, 1, 0, 0),
                          datetime.datetime(2012, 11, 1, 0, 0),
                          datetime.date