In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

### 데이터 불러오기

In [4]:
df = pd.read_parquet("./data/ohlcv_full_BTCKRW.parquet") # 데이터 불러오기

In [5]:
df

Unnamed: 0,ts,open,high,low,close,volume,time
0,1577836800000,8308000.0,8310000.0,8299000.0,8310000.0,2.466505,2020-01-01 09:00:00+09:00
1,1577836860000,8300000.0,8300000.0,8300000.0,8300000.0,2.589775,2020-01-01 09:01:00+09:00
2,1577836920000,8299000.0,8300000.0,8299000.0,8300000.0,1.397383,2020-01-01 09:02:00+09:00
3,1577836980000,8300000.0,8300000.0,8299000.0,8300000.0,1.373265,2020-01-01 09:03:00+09:00
4,1577837040000,8299000.0,8299000.0,8296000.0,8296000.0,2.319195,2020-01-01 09:04:00+09:00
...,...,...,...,...,...,...,...
3052384,1761886740000,165147000.0,165149000.0,165068000.0,165125000.0,0.353609,2025-10-31 13:59:00+09:00
3052385,1761886800000,165072000.0,165125000.0,164910000.0,165001000.0,1.075655,2025-10-31 14:00:00+09:00
3052386,1761886860000,165004000.0,165004000.0,164812000.0,164814000.0,1.402556,2025-10-31 14:01:00+09:00
3052387,1761886920000,164814000.0,164873000.0,164769000.0,164843000.0,1.615205,2025-10-31 14:02:00+09:00


### 트레이딩 전략의 종류

아래의 내용보다 더 다양하게 있겠지만, 내가 관심이 있고 써볼만한 전략들은 아래 3가지가 있을 듯 하다.

- "추세" 추종 전략 : 캔들의 고점, 저점, 이동평균 등을 이용하여 방향성을 따라 매매하는 전략. (시장에 맞서지 말라!)
- "평균회귀" 전략(역추세 반전 전략) : 일정 기간 과매수/과매도 상태나 급등락 후 반전 시그널을 이용하는 전략. 추세추종전략과 상관관계가 (-)일 것으로 예상.
- 변동성 "돌파" 전략 : 박스권을 유지하던 가격이 좁은 캔들구간을 벗어나서 크게 상승하는 경우.

### 트레이딩 전략의 기본 구성

트레이딩 전략은 기본적으로 아래 세가지로 구성된다고 보면 될듯하다.

1. 시그널 탐지 (Signal Detection) : 진입을 고려할 수 있는 조건을 찾는 단계
2. 진입 로직 (Entry Logic) : 실제로 포지션을 진입할지 결정
3. 청산 로직 (Exit Logic) : 언제 포지션을 그만둘지

### 트레이딩 전략의 python 소스코드 실제 구현

1. 데이터 전처리
2. 전략 구현[시그널탐지 - 진입가격 - 청산가격(익절가, 손절가,최대기간)]
3. 전략별 데이터타입을 어떻게해서 관리하지? (전략의 추가/제거를 쉽게 할 수 있도록)
- 가격 : 시간(row) x OHLCV(columns)
- 시그널 : 시간(row) x 전략들(columns). 시그널 탐지시 True
- 진입가격 : 시간(row) x 전략들(columns). 시그널 탐지 안됬으면 False, 됬으면 가격
- 보유포지션 : 시간(row) x 전략들(columns). 진입 안했으면 0, 진입 했으면 규모
- 익절가격 : 시간(row) x 전략들(columns). 시그널 탐지 안됬으면 False, 됬으면 가격
- 손절가격 : 시간(row) x 전략들(columns). 시그널 탐지 안됬으면 False, 됬으면 가격
- 보유기간(일정수준 이상 넘기면 청산하기 위함) : 시간(row) x 전략들(columns). 시그널 탐지 안됬으면 False, 됬으면 가격

결국 핵심은 시그널(조건), 진입가격, 보유포지션, 익절가격, 손절가격, 보유기간을 산출하는 "전략"을 수립하는 함수를 짜는 것.

##### 1. 데이터 전처리

In [14]:
def preprocess_ohlcv(
    df: pd.DataFrame,
    tz: str = "Asia/Seoul",
    freq: str = "1D",
    fill_method: str = "ffill"
) -> pd.DataFrame:
    """
    OHLCV 데이터 전처리 함수 (백테스팅 전용)

    Parameters
    ----------
    df : pd.DataFrame
        최소한 ['open', 'high', 'low', 'close'] 열을 포함해야 함.
        DatetimeIndex 또는 'timestamp' 컬럼 필요.
    tz : str
        타임존 지정 (기본: Asia/Seoul)
    freq : str
        리샘플 주기 (예: '1D', '1H', '5T')
    fill_method : str
        결측치 보정 방식 ('ffill', 'bfill', None)

    Returns
    -------
    pd.DataFrame
        전처리된 OHLCV 데이터프레임
    """

    # ---- 1. 인덱스 설정 ----
    df = df.set_index("time")

    # ---- 2. 중복 제거 및 정렬 ----
    df = df[~df.index.duplicated(keep="last")].sort_index()

    # ---- 4. 리샘플링 ----
    df = df.resample(freq).agg({
        "open": "first",
        "high": "max",
        "low": "min",
        "close": "last",
        "volume": "sum" if "volume" in df.columns else "first"
    })

    # ---- 5. 결측치 처리 ----
    if fill_method == "ffill":
        df = df.ffill()
    elif fill_method == "bfill":
        df = df.bfill()

    # ---- 6. 이상치 제거 ----
    for col in ["open", "high", "low", "close"]:
        df[col] = df[col].replace([np.inf, -np.inf], np.nan)
    df = df.dropna(subset=["open", "high", "low", "close"])

    # ---- 7. 보조 컬럼 추가 ----
    df["returns"] = df["close"].pct_change()
    df["log_ret"] = np.log(df["close"] / df["close"].shift(1))

    return df

In [19]:
df = pd.read_parquet("./data/ohlcv_full_BTCKRW.parquet") # 데이터 불러오기
df = preprocess_ohlcv(df, tz="Asia/Seoul", freq="5T")

  df = df.resample(freq).agg({


In [20]:
df

Unnamed: 0_level_0,open,high,low,close,volume,returns,log_ret
time,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
2020-01-01 09:00:00+09:00,8308000.0,8310000.0,8296000.0,8296000.0,10.146124,,
2020-01-01 09:05:00+09:00,8296000.0,8308000.0,8295000.0,8298000.0,5.809038,0.000241,0.000241
2020-01-01 09:10:00+09:00,8299000.0,8315000.0,8299000.0,8302000.0,2.225071,0.000482,0.000482
2020-01-01 09:15:00+09:00,8301000.0,8301000.0,8292000.0,8292000.0,2.740246,-0.001205,-0.001205
2020-01-01 09:20:00+09:00,8292000.0,8292000.0,8287000.0,8291000.0,4.069234,-0.000121,-0.000121
...,...,...,...,...,...,...,...
2025-10-31 13:40:00+09:00,164800000.0,165300000.0,164769000.0,165060000.0,10.322307,0.001578,0.001576
2025-10-31 13:45:00+09:00,165139000.0,165273000.0,164901000.0,165108000.0,5.049188,0.000291,0.000291
2025-10-31 13:50:00+09:00,164998000.0,165107000.0,164856000.0,164910000.0,2.665613,-0.001199,-0.001200
2025-10-31 13:55:00+09:00,164910000.0,165197000.0,164910000.0,165125000.0,3.850786,0.001304,0.001303


##### 2. 전략 구현