Prophet은 시계열 데이터를 분석하고 미래를 예측하기 위해 Facebook에서 개발한 오픈 소스 도구

In [None]:
 # Prophet은 데이터의 주기성, 추세, 불규칙성을 자동으로 학습해 시계열 모델링을 쉽게 할 수 있는 도구

In [None]:
pip install prophet

Note: you may need to restart the kernel to use updated packages.


    matplotlib-inline (<0.2.0appnope,>=0.1.0) ; platform_system == "Darwin"
                      ~~~~~~~~^

[notice] A new release of pip is available: 24.2 -> 24.3.1
[notice] To update, run: python.exe -m pip install --upgrade pip


# Prophet을 사용한 삼성전자 주가 예측 코드

In [None]:
pip install numpy==1.24.3


Collecting numpy==1.24.3Note: you may need to restart the kernel to use updated packages.
  Downloading numpy-1.24.3-cp39-cp39-win_amd64.whl.metadata (5.6 kB)
Downloading numpy-1.24.3-cp39-cp39-win_amd64.whl (14.9 MB)
   ---------------------------------------- 14.9/14.9 MB 8.3 MB/s eta 0:00:00
Installing collected packages: numpy
  Attempting uninstall: numpy
    Found existing installation: numpy 2.0.2
    Uninstalling numpy-2.0.2:
      Successfully uninstalled numpy-2.0.2
Successfully installed numpy-1.24.3



    matplotlib-inline (<0.2.0appnope,>=0.1.0) ; platform_system == "Darwin"
                      ~~~~~~~~^
  You can safely remove it manually.
  You can safely remove it manually.
ERROR: pip's dependency resolver does not currently take into account all the packages that are installed. This behaviour is the source of the following dependency conflicts.
pingouin 0.5.3 requires pandas-flavor>=0.2.0, which is not installed.
blis 1.0.1 requires numpy<3.0.0,>=2.0.0, but you have numpy 1.24.3 which is incompatible.
tensorflow-intel 2.18.0 requires numpy<2.1.0,>=1.26.0, but you have numpy 1.24.3 which is incompatible.
thinc 8.3.2 requires numpy<2.1.0,>=2.0.0; python_version >= "3.9", but you have numpy 1.24.3 which is incompatible.

[notice] A new release of pip is available: 24.2 -> 24.3.1
[notice] To update, run: python.exe -m pip install --upgrade pip


In [None]:
!pip uninstall numpy
!pip install numpy==1.24.3


Found existing installation: numpy 1.26.4
Uninstalling numpy-1.26.4:
  Would remove:
    /usr/local/bin/f2py
    /usr/local/lib/python3.10/dist-packages/numpy-1.26.4.dist-info/*
    /usr/local/lib/python3.10/dist-packages/numpy.libs/libgfortran-040039e1.so.5.0.0
    /usr/local/lib/python3.10/dist-packages/numpy.libs/libopenblas64_p-r0-0cf96a72.3.23.dev.so
    /usr/local/lib/python3.10/dist-packages/numpy.libs/libquadmath-96973f99.so.0.0.0
    /usr/local/lib/python3.10/dist-packages/numpy/*
Proceed (Y/n)? 

In [None]:
pip install --upgrade prophet


In [None]:
# Prophet이 요구하는 데이터 형식으로 주가 데이터를 준비하기 위한 단계입니다.
# Prophet은 날짜와 예측할 값이 각각 ds와 y라는 특정 컬럼명을 갖춰야 작동하기 때문에 데이터를 재구성하는 작업


# df = data.reset_index()[['Date', 'Close']]
# data.reset_index()는 기존 data DataFrame의 인덱스를 재설정하여 날짜 정보를 포함한 새로운 인덱스를 만듭니다. Date는 날짜 정보, Close는 삼성전자 주가의 종가(close price)입니다.
# [['Date', 'Close']]는 Date와 Close 열만 추출하여 Prophet에 필요한 데이터를 정리합니다.

# Prophet에 맞게 열 이름 변경:
# df.columns = ['ds', 'y']
# Prophet은 날짜를 ds, 예측할 값을 y라는 열 이름으로 인식합니다. Date를 ds로, Close를 y로 이름을 변경합니다.


# 데이터 타입 설정:
# df['y'] = df['y'].astype(np.float64)  # np.float_ 대신 np.float64 사용
# y 열(종가 데이터)을 np.float64 타입으로 변환하여 Prophet이 요구하는 형식에 맞춥니다.
# NumPy 2.0에서 np.float_가 제거되었기 때문에 np.float64로 명시적으로 변환하는 과정이 필요합니다.

In [None]:
# make_future_dataframe 함수를 사용해 365일 동안의 미래 데이터프레임을 생성하고, predict로 예측 값을 계산합니다.
# plot_components를 통해 추세와 계절성을 포함한 예측 구성 요소를 시각화할 수 있습니다.

In [None]:
import yfinance as yf
from prophet import Prophet
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# Step 1: 삼성전자 데이터 불러오기
# 삼성전자의 티커는 '005930.KS' 입니다.
data = yf.download('005930.KS', start='2022-01-01', end='2024-10-01')

# Step 2: Prophet을 위해 컬럼명 변환
# Prophet은 날짜가 'ds', 예측할 값이 'y'라는 컬럼명을 사용해야 합니다.
df = data.reset_index()[['Date', 'Close']]
df.columns = ['ds', 'y']
df['y'] = df['y'].astype(np.float64)  # np.float_ 대신 np.float64 사용

# Step 3: Prophet 모델 생성 및 학습
model = Prophet()
model.fit(df)

# Step 4: 미래 데이터프레임 생성 및 예측
future = model.make_future_dataframe(periods=365)  # 1년간 예측
forecast = model.predict(future)

# Step 5: 예측 결과 시각화
model.plot(forecast)
plt.title('삼성전자 주가 예측')
plt.xlabel('Date')
plt.ylabel('Price')
plt.show()

# Step 6: 계절성 시각화
model.plot_components(forecast)
plt.show()
