# **제2장 정량적 거래의 기초**

정량적 거래는 예술과 과학의 결합입니다. 이 장에서는 이후 장의 예제를 편안히 이해하기 위해 몇 가지 핵심 개념을 소개하고자 합니다. 이 개념들은 전혀 포괄적인 것은 아니며, 정량적 거래의 예술적 특성으로 인해 많은 부분이 다소 주관적일 수 있지만, 균형 잡힌 시각을 제시하기 위해 노력할 것입니다. 이미 전문 퀀트이거나 QuantConnect에 익숙하다면, 이 장을 건너뛰셔도 좋습니다.

---

## 리서치 프로세스

전통적인 퀀트 리서치 프로세스는 리서치, 백테스팅, 파라미터 최적화, 페이퍼 트레이딩(샘플 외), 그리고 라이브 트레이딩으로 이어집니다. 이 경로를 따르는 연구자들은 수익성 신호로 이어지지 않을 아이디어에 대한 시간을 줄이기 위해, 리서치 단계에서 아이디어를 빠르게 제거한 뒤, 거래 비용 현실을 반영한 고정확도 백테스팅 환경에서 아이디어의 가치를 테스트합니다.

**리서치**

Jupyter 노트북(gnt.co/book-cloud-research)은 아이디어를 반복적으로 빠르게 탐색할 수 있는 공간을 제공합니다. 대규모 데이터셋을 메모리에 로드하고 쉽게 플로팅하여 신호를 시각화하고 유효성을 테스트할 수 있습니다. 이를 통해 연구자들은 몇 줄의 pandas 코드만으로 아이디어를 빠르게 탐색할 수 있습니다. 일반적으로 이 리서치는 메모리 내 데이터셋에 벡터 연산을 적용하므로, 선행자 편향(look-ahead bias)을 피하기 위해 주의해야 합니다.

**백테스팅**

백테스팅(gnt.co/book-cloud-backtesting)은 거래 수수료, 스프레드, 슬리피지, 이자 페널티 등 시장의 여러 세부 요소를 모델링하여 전략 성능을 정확하게 보여줍니다. 라이브 트레이딩과 마찬가지로, 특정 시점의 데이터를 바(bar) 단위로 전략 코드에 주입하여, 알고리즘 상태 설정 방식과 스플릿이나 배당 같은 기업 이벤트 처리 방식을 정의할 수 있습니다. 코드를 신중하게 추상화하면, 리서치 및 백테스팅 코드를 거의 변경 없이 라이브 트레이딩에 바로 적용할 수 있습니다.

**파라미터 최적화**

파라미터(gnt.co/book-cloud-optimization)는 백테스팅 결과를 제어하는 전략 내 변수입니다. 과적합 가능성을 줄이기 위해 가능한 한 파라미터 수를 최소화하도록 노력하십시오. 파라미터가 510개라면 어떤 전략도 인-샘플(in-sample)에서 잘 동작하도록 만들기 쉽습니다. 날짜 범위나 초기 자본 같은 암묵적 파라미터부터, 지표나 신호 정의와 같은 명시적 파라미터까지 모든 전략에는 파라미터가 있습니다. 이 단계의 목표는 전략이 파라미터에 얼마나 민감한지 테스트하는 것입니다. 이 견고성 테스트를 통해 전략이 다양한 환경에서도 성능을 유지하며, 특정 변수 집합을 선택적으로 고른 것이 아님을 확신할 수 있습니다.

**페이퍼 및 라이브 트레이딩**

전략을 라이브 트레이딩(gnt.co/book-cloud-live-trading)에 배포하면 알고리즘 신호가 샘플 외(out of sample)에서도 작동하는지 확인할 수 있으며, 처리 시간, 주문 체결 지연, 데이터 지연 등 알고리즘의 기계적 측면에서 잠재적 문제를 드러낼 수 있습니다. 이러한 문제들은 첫 거래가 실행된 후에야 드러나는 경우가 많아, 일부 실무자는 아이디어 단계에서 소량의 자본으로 바로 라이브 트레이딩에 뛰어들기를 권장하기도 합니다.

---

## 테스트 및 디버깅 도구

견고한 알고리즘 트레이딩 전략을 구축하는 일은 도전적인 과제이며, 경험 많은 실무자조차도 첫 시도에 완벽하게 구현하는 일은 드뭅니다. 올바른 도구를 사용하면 문제를 빠르게 디버그하고 전략을 배포할 수 있습니다. 또한 반복적인 빌드-테스트 접근 방식을 채택하면 마주치는 오류의 복잡성을 극적으로 줄일 수 있습니다. 이 섹션에서는 전략을 신속하게 구축하기 위한 도구와 코딩 프로세스를 살펴보겠습니다.

디자인 및 디버깅을 위한 네 가지 핵심 도구가 있습니다.

**디버거(Debuggers)**

디버깅(qnt.co/book-cloud-debugging)은 백테스팅 코드 실행 오류를 이해하기 위한 첫 번째 단계여야 합니다. 디버거는 프로그램 실행을 일시 중지하여 변수 상태를 검사하거나 코드 조각을 실행해 보는 기능을 제공합니다. QuantConnect에서 디버깅을 트리거하려면, 일시 중지하고 싶은 코드 줄 옆 테두리를 클릭한 다음 작은 벌레 아이콘이 있는 백테스트 버튼을 누르세요(그림 2.1 참조).

<img src="./images/fig_02_01.png" width=800>

그림 2.1 디버깅 모드로 QuantConnect Cloud에서 백테스트 실행하기.

IDE 디버거 도구와는 별도로, QuantConnect는 백테스트나 라이브 트레이딩 중에 클라우드 콘솔 환경으로 메시지를 스트리밍할 수 있습니다. 이는 신호가 제대로 트리거되는지 확인하고 전략 실행 과정을 대략적으로 파악하는 원시적인 방법입니다.

```python
self.debug(f"Signal triggered, placing limit order: {limit}")
````

**로깅(Logging)**

로그(qnt.com/book-logging) 문장은 백테스트 도중 기록되는 문자열입니다. 백테스트는 수백만 개의 데이터 이벤트를 재생할 수 있으므로 중요한 의사결정 순간을 기록하는 것이 좋습니다. 잘못된 위치에 로그를 배치하면 수백만 줄의 텍스트가 생성되어 분석하기 어려울 수 있으므로 주의해야 합니다. 스트리밍된 디버그 메시지와 달리 로그 문장은 영구적이며, 필요할 때 나중에 참조할 수 있습니다.

```python
self.log(f"Signal triggered, placing limit order: {limit}")
```

**차트 생성(Charting)**

플롯은 모델을 시각화하고 디버깅을 위한 엣지 케이스를 이해하는 데 도움이 됩니다. 데이터의 이상치나 신호 값 분포를 빠르게 확인할 수 있습니다.

커스텀 플롯을 생성할 때는 먼저 그려야 할 결과에 대한 직관적인 예측을 세운 후에 플롯을 만들어 보세요. 이는 결과를 검증하거나 근본적인 문제를 디버깅하는 데 도움이 됩니다. 예를 들어 자산 가격 표준편차 플롯은 일반적으로 –4에서 +4 사이여야 하며, 이상치는 COVID-19 팬데믹의 2020년 3월 같은 극단적 시장 상황에서만 발생해야 합니다.

QuantConnect에는 강력한 커스텀 차트 API(qnt.com/book-charting)가 있습니다. 기본 플롯은 한 줄의 코드로 생성할 수 있고, 차트를 먼저 정의한 후에는 두세 줄로 커스터마이징된 플롯을 만들 수 있습니다.

```python
# 기본 옵션으로 라인 플롯 생성
self.plot("deviations", "AAPL", asset_deviation)

# 커스텀 색상 및 시리즈 타입으로 인스턴스화
chart = Chart("deviations")
chart.add_series( Series("AAPL", SeriesType.SCATTER, "$", Color.GREEN, ScatterMarkerSymbol.TRIANGLE))
self.plot("deviations", "AAPL", asset_deviation)
```

**오브젝트 스토어(Object Store)**

QuantConnect 오브젝트 스토어(qnt.co/book-object-store)는 정보의 저지연 저장 및 검색을 위한 키-값 데이터 스토어입니다. 연구, 백테스트, 최적화, 라이브 트레이딩 등 QuantConnect 기술의 모든 계층에서 프로그래밍 방식으로 오브젝트를 저장하고 조회할 수 있습니다.

백테스트 중에 분석할 대규모 오브젝트를 생성하여 나중에 분석을 위해 저장하는 데 유용합니다. 이 방법은 오브젝트가 너무 커서 플롯하기 어렵거나 여러 백테스트에 걸쳐 분석해야 할 때 특히 유용합니다.

```python
self.object_store.save("key", "value")        # 문자열을 저장
string_data = self.object_store.read("key")   # 오브젝트 조회

self.object_store.save_bytes("key", bytes)    # 직렬화된 오브젝트 저장
byte_data = self.object_store.read_bytes("key") # 바이트 배열 조회
```

알고리즘 종료 이벤트 핸들러 끝에 이 기능을 결합하면 백테스트 종료 시 오브젝트를 저장할 수 있습니다.

```python
# 알고리즘 종료 시 프로젝트 ID 폴더 아래에 데이터 저장
def on_end_of_algorithm(self):
    self.object_store.save(f"{self.project_id}/backtest", self._data)
```

**코딩 프로세스(Coding Process)**

초보자가 가장 흔히 저지르는 실수는 백테스트 한 번 실행하지 않고 수백 줄의 코드를 작성하는 것입니다. 백테스트를 사용하는 한, 구현 계획의 메커니즘을 검증하기 위해 매개변수를 조정하지 않는 이상, 백테스트는 전략 구축 및 디버깅을 위한 훌륭한 도구입니다. 백테스트를 매개변수 튜닝에 사용하는 것은 과적합 위험을 초래할 수 있으며, 이는 이 장 후반에서 다룹니다.

“빌드-테스트”라는 반복 빌드 프로세스를 사용하면 전략에 한 번에 한 계층씩 추가하고 짧은 기간 동안 백테스트하여, 디버그 문장을 통해 동작을 검증하거나 주문 시간 및 수량이 예상대로인지 확인할 수 있습니다. 각 계층마다 깨끗하고 주석이 달린 코드를 작성하고 필요한 추상화를 적용하는 데 시간을 투자하세요. 처음에는 번거롭고 느리게 느껴질 수 있지만, 복잡한 전략을 디버깅하는 데 소요되는 시간을 크게 절약할 수 있습니다.

---

## **시간 및 선행 정보 편향**

금융 데이터는 해당 기간에 따라 두 가지 "형태"로 나뉩니다: 시점 값(point values) 또는 기간 값(period values). 백테스트가 진행됨에 따라, 전략 코드가 미래 데이터를 미리 보지 않도록 정확한 순서로 데이터가 방출됩니다. 이는 알고리즘에서 미래 정보를 알고 있어 발생하는 퀀트 리서치 오류의 한 형태인 선행 정보 편향(look-ahead bias)을 방지하기 위해 수행됩니다.

시점 데이터(point data)는 단일 타임스탬프만 가집니다. 예시로는 거래 틱, 기상 관측, 고객 거래 등이 있습니다. 기간 값(period values)은 시작 시간과 종료 시간, 두 개의 타임스탬프를 가집니다. 예시로는 주식의 일봉이 있으며, 오전 9시 30분에 열리고 오후 4시에 닫힙니다(그림 2.2).

<img src="./images/fig_02_02.png" width=800>

그림 2.2 데이터 통합 기간이 끝날 때 데이터 이벤트가 발생합니다. 틱 데이터는 통합 기간이 없으므로 새로운 틱이 도착할 때 이벤트가 발생합니다.

QuantConnect에서 기간 값은 `time`과 `end_time` 데이터 속성으로 표현됩니다.

```python
tick.time         # 거래나 호가가 발생한 순간
tradebar.time     # 가격 바의 시작 시점
tradebar.end_time # 가격 바의 종료 시점
````

**선행 정보 편향 (Look-ahead Bias)**

선행 정보 편향은 미래 이벤트에 대한 지식을 알고리즘에 사용함으로써, 백테스팅 성능이 실제 샘플 외(out-of-sample) 성능보다 더 좋아 보이게 만드는 현상입니다. 이 편향에 빠지기 아주 쉽습니다. 몇 가지 예시는 다음과 같습니다:

* 최근 주요 시장 움직임을 미리 알고 전략을 설계하는 경우
* 데이터가 실제 사용 가능한 시점보다 기간 시작 시점을 타임스탬프로 사용하는 경우 (예: “2024-05”라는 정부 데이터는 실제로 다음 달 6월 10일쯤에야 공개될 수 있습니다)
* 시장이 닫힌 후에야 발생하는 일봉의 종가(close price)를 거래 체결 기준으로 사용하는 경우
* 2024년에 학습 및 공개된 대형 언어 모델(LLM)을 2018년부터 시작하는 백테스트에 사용하는 경우

**시장 시간 및 스케줄링 (Market Hours and Scheduling)**

각 자산 클래스는 거래가 가능한 시간을 설명하는 시장 시간표(gnt.co/book-market-hours)를 가집니다. 예를 들어 암호화폐는 하루 24시간 거래되지만, 선물 시장은 하루에 여러 차례 열리고 닫히기도 합니다. 대부분의 시장은 전체 휴장일 또는 크리스마스 등 특정 기간에 단축 거래 시간을 포함합니다. 거래가 가능한 일자와 시간을 모아 놓은 것을 시장 달력(market calendar)이라고 합니다.

강력한 시간 처리 기능을 통해 알고리즘 내에서 시장 달력을 모델링할 수 있습니다. QuantConnect는 지원되는 모든 자산 클래스에 대해 정확하게 시장 시간을 반영합니다. 스케줄링 API(gnt.co/book-scheduledevents)를 사용하면 시장 현황에 따라 코드를 실행하도록 예약할 수 있습니다:

```python
# 거래 주간이 끝날 때, 시장 휴일 및 거래 시간을 고려하여
# 시장 개장 후 30분에 리밸런스 함수를 실행합니다.
symbol = Symbol.create('SPY', SecurityType.EQUITY, Market.USA)
self.schedule.on( 
    self.date_rules.week_end(symbol),
    self.time_rules.after_market_open(symbol, 30),
    self._rebalance
)
```

AI 모델의 경우, 최신 시장 상황에 맞추어 자주 재학습하는 것이 필수적입니다. 내장된 `train` 메서드를 사용하여 프리마켓(pre-market)에 함수 콜백을 예약하고, 장시간 실행되는 학습 메서드를 시작하여 모델을 새로 고칠 수 있습니다.

```python
self.train(
    self.date_rules.every(DayOfWeek.SUNDAY),
    self.time_rules.at(8, 0),
    self._training_method
)
```

---

## 전략 스타일

대부분의 전략은 네 가지 핵심 아이디어의 변형입니다: 모멘텀, 되돌림(리버전), 스캘핑, 또는 차익거래입니다. 모멘텀 전략은 기술적 지표, 시장 심리, 뉴스와 같은 신호를 활용해 시장의 큰 상승·하락 흐름을 따라가며 투자하고, 그 추세가 약해지기 전에 빠져나오는 것을 목표로 합니다. 되돌림 전략은 자산 가격이 급격히 오를 때 전환점을 찾아, 가격이 역사적인 평균이나 산업 벤치마크 수준으로 되돌아갈 것에 베팅합니다. 스캘핑 전략은 자산 가격의 아주 작은 변동을 포착해 빠르게 진입하고 빠르게 이탈하여 소규모 수익을 추구합니다. 차익거래 전략은 동일하거나 유사한 자산을 서로 다른 장소에서 동시에 매매하여 가격 차이로 인한 작은 이익을 얻는 방식입니다.

**트레이딩 신호**

전략은 일반적으로 두 가지 유형의 신호로 구분됩니다: 이진 플래그(binary flag) 또는 연속 신호(continuous signal). 이 신호는 전략의 알파(alpha) 또는 팩터 생성의 일부입니다.

연속 신호는 숫자 값으로, 아이디어의 강도나 순위를 나타냅니다. 예를 들어, 여러 자산의 주가수익비율(PE)을 기반으로 팩터 점수를 계산할 수 있습니다. 각 자산에 점수를 부여하고, 이 점수의 강도에 따라 자본을 배분합니다.

이진 신호는 불연속적이며, 일반적으로 롱(long), 중립(flat), 숏(short) 방향을 나타냅니다. 같은 데이터를 사용하더라도 특정 조건을 만족할 때만 거래 신호를 발생시킬 수 있습니다. 예를 들어, 자산의 PE 비율이 5 미만일 때만 신호를 발생시키는 방식입니다. 불연속 신호는 새로운 약품 승인을 받은 제약회사와 같은 이벤트 기반 거래에서 자연스럽게 활용됩니다.

이들 범주에는 고정된 규칙이 없으며, 혼합형 하이브리드 신호도 만들 수 있습니다. 예를 들어, FDA의 약물 승인 뉴스 이벤트라는 이진 정보를 프리마켓 실험 결과 및 공개 정보로부터 약물 승인 확률을 계산하는 연속 신호로 변환할 수 있습니다. 최종 발표가 나면 이 확률은 100%로 수렴하며, 전략은 그 전에 포지션을 취할 수 있게 됩니다.

**자본 배분**

이러한 신호를 기반으로 트레이더는 자본을 어떻게 배분할지를 결정하여 최적의 성과를 추구합니다.  
자본 배분에는 세 가지 기본 스타일이 있습니다: 불연속 거래/베팅(discrete trade/bet), 연속적 포트폴리오 배분(continuous portfolio allocation), 전술적 자산 배분(tactical allocation). 이 배분은 일반적으로 포트폴리오 구성 시스템의 책임입니다.

전통적인 정량 금융은 "시장 타이밍보다 시장에 머무는 시간이 더 중요하다"는 오래된 격언에 따라 항상 자본이 투자되어 있도록 하는 것을 중요시합니다.  
연속 신호를 기반으로 자산을 순위화하고, 최고의 자산들로 분산 포트폴리오를 구성합니다. 이 분야는 포트폴리오 배분 과학이라는 하나의 분야로 발전했으며, 그 중 대표적인 이론이 현대 포트폴리오 이론(Modern Portfolio Theory)입니다.  
예시로, S&P500 기업들을 펀더멘털 기준으로 순위를 매기고 상위 20개 기업에 할당하며, 각 기업의 과거 변동성에 반비례하여 자금을 배분할 수 있습니다. 이러한 전략은 일반적으로 알파(alpha), 베타(beta), 샤프 비율(Sharpe ratio)로 측정되며, 주요 지수와 비교하여 벤치마킹됩니다.

```python
# 비중에 따라 포트폴리오 리밸런싱
targets = [PortfolioTarget("AAPL", 0.5), PortfolioTarget("MSFT", 0.5)]
self.set_holdings(targets)
````

불연속 거래 전략은 시장을 스캔하여 특정 조건을 만족하는 거래를 찾아내고, 기존 보유 자산과 무관하게 거래 규모와 리스크를 설정합니다.
진입 및 청산 신호는 일반적으로 -1(숏), 0(중립), 1(롱)의 이산 값입니다. 이는 인간이 거래하는 방식과 유사하기 때문에, 프로 트레이더들이 자동화 전략을 설계할 때 자주 사용하는 방식입니다.
이 전략들의 성과는 시장 전체와 상관관계가 낮으며, 일반적으로 절대 수익률(연간 목표 수익률) 기준으로 평가됩니다.
리스크 제어를 위해, 고급 전략에서는 수정된 켈리 기준(modified Kelly criterion)을 사용하여 개별 자산 거래를 베팅으로 간주하고 각각에 맞는 리스크와 수익 기대값을 계산합니다. 이 전략들은 승률(win-rate), 기대수익(expectancy), 샤프 비율 등으로 측정됩니다.

정량적 사고를 하는 불연속 트레이더들은 전체 성과를 부드럽게 만들기 위해 광범위한 자산군에 걸쳐 많은 베팅을 실행합니다.

```python
# 개별 주식 또는 전략에 대해 주문 수동 생성 및 라우팅
long_straddle = OptionStrategies.straddle(symbol, strike, expiry)
self.buy(long_straddle, 50)

# 변동성에 따라 조절된 주문 규모와 스톱 설정
trading_range = self.atr("SPY", 30)
quantity = risk_capital / trading_range.current.value
self.market_order("SPY", quantity)
self.stop_market_order("SPY", -quantity, data["SPY"].close - trading_range)
```

전술적 자산 배분(Tactical Asset Allocation)은 전통적인 포트폴리오 배분처럼 항상 자산을 투자하는 것을 목표로 하면서도, 전략 신호에 따라 그 배분을 조정합니다.
이는 기존 자산에 대한 비중 조정이거나 포트폴리오 자체를 완전히 교체하는 방식일 수 있습니다. 예를 들어, 강세장에서는 주요 지수에 집중 투자하고, 시장 변동성이 높아지면 주식 비중을 줄이고 채권으로 전환하는 전략이 이에 해당됩니다.
이 전략들도 주요 지수에 대해 벤치마킹되며, 알파, 지수에 대한 베타, 샤프 비율로 측정됩니다.

**시장 국면(Regimes)과 전략 포트폴리오**

모든 시장 국면에서 완벽함을 추구하는 것은 오히려 과적합(overfitting)으로 이어질 수 있습니다.
전략이 시장에 중립적이지 않다면—예를 들어 거래소 리베이트(rebate)나 라우팅 구조에서 수익을 창출하는 고빈도 트레이딩 전략이나, 차익거래 기회를 이용하는 시장중립 전략이 아니라면—전략에 따라 드로우다운이 발생할 가능성을 받아들여야 합니다.

세계적인 헤지펀드인 르네상스 테크놀로지(Renaissance Technologies)나 월드 퀀트(WorldQuant)와 같은 곳은 수많은 알파를 활용하고, 복잡한 포트폴리오 관리 시스템을 통해 수많은 신호의 가중치를 결정하는 "다중 알파(many alpha)" 접근법을 사용합니다.

강세장에서는 레버리지와 트렌드 추종 전략이 가장 적합하며, 선거 불확실성이나 금리 인상과 같은 시장 변동 시기에는 시장이 좁은 가격대에서 움직이며 방향성이 없는 "레인지장"이 나타납니다. 이 시기에는 평균회귀 전략이 강세를 보이며, 지역적 저점에서 매수하고 고점에서 매도합니다.
약세장에서는 방어적인 전략(채권, 숏 중심 주식)이나, 높은 변동성에 빠르게 반응하는 알고리즘을 사용하는 것이 유리합니다. 이러한 다양한 전략을 준비하고 운용하면 시장 국면이 변할 때에도 적절한 포트폴리오 포지션을 유지할 수 있습니다.

가격 예측은 매우 어렵지만, 변동성(volatility)은 모멘텀을 가지는 경향이 있습니다. 투자자들은 함께 공황에 빠지며 급격한 가격 변동을 유발하곤 합니다. 일부 퀀트들은 높은 혹은 낮은 변동성 환경에 초점을 맞춘 전략을 설계하며, 옵션이나 변동성 매도(short volatility)를 활용하기도 합니다.

---

## 파라미터 민감도 테스트 및 최적화

파라미터(qnt.co/book-cloud-optimization)는 모든 알고리즘 내에서 성능에 영향을 주는 변수입니다. 이러한 변수는 매우 미묘할 수 있으며, 전략 코드 전체를 신중히 검토해야만 모두 식별할 수 있는 경우가 많습니다. 심지어 시작 날짜나 초기 자본 같은 아주 사소한 속성도 상당한 영향을 미칠 수 있습니다.  
정량적 연구에서 가장 흔한 오류 중 하나는 전략을 과거 데이터에 과적합(overfitting)시키는 것입니다.  

과적합은 함수가 제한된 학습 데이터셋에 너무 밀접하게 맞춰질 때 발생합니다.  
트레이딩 알고리즘에서 너무 많은 파라미터를 사용하거나, 과거에 아주 잘 작동했지만 값이 조금만 바뀌어도 성과가 급감하는 파라미터 값을 선택할 경우 과적합이 발생할 수 있습니다. 이 경우 알고리즘은 과거 데이터의 세부사항과 잡음에 지나치게 맞춰져, 실제 라이브 성능에 부정적인 영향을 줄 수 있습니다.  
그림 2.3은 과소적합, 최적 적합, 과적합 함수의 예를 보여줍니다.

<img src="./images/fig_02_03.png" width=800>

그림 2.3 모델이 과적합 또는 과소적합되면 학습 데이터셋 외 샘플에서 예측력이 저하됩니다.

최적 적합된 전략이 항상 가장 매끄러운 수익 곡선을 가지는 것은 아닙니다.  
대신, 다양한 잠재적 값 범위에서 강력한 성능을 보이는 파라미터 선택을 포함해야 합니다. 과적합 가능성을 줄이기 위해 다음과 같은 단계를 따를 것을 권장합니다:

**1. 제거 (Remove)**

가능한 많은 파라미터를 전략에서 제거하십시오. 이상적인 경우에는 해당 파라미터를 완전히 없애는 것입니다.  
예를 들어, 전략 수익에 큰 기여를 하지 않는 신호를 제거할 수 있습니다.  
머신러닝의 경우, PCA(주성분 분석)를 사용하여 원본 데이터를 핵심 구성 요소로 변환함으로써 이 작업을 수행할 수 있습니다(추후 장에서 설명).

**2. 대체 (Replace)**

파라미터를 제거할 수 없는 경우, 그것을 확률, 실제 세계의 이유, 또는 데이터 소스로 대체해 보십시오.  
예를 들어, 전략이 매 시 정각(10:00 AM)에 뉴스 릴리스를 탐색하고 지난 1시간의 심리를 집계하여 포트폴리오를 리밸런싱한다고 가정해봅시다.  
정각에서 얼마나 지난 시점(예: 10:03, 10:06, 10:07)에 성능이 좋은지를 최적화하기보다는, 이 파라미터를 제거하고 롤링 윈도우 기반의 심리 분석을 구축하여 지속적으로 분석을 수행하는 것이 더 자연스럽습니다.  
또는 이 파라미터를 뉴스 피드의 데이터 소스로 대체하고, 자산에 대한 뉴스가 있을 때만 심리 분석을 실행하는 식의 실제 세계적 대체가 가능합니다.

새로운 심리 분석 기법을 구축한 뒤에는 "심리 점프가 ±10%일 때 리밸런싱"과 같은 또 다른 파라미터를 도입하고 싶어질 수 있습니다.  
하지만 이런 임의의 고정값 대신, 롤링 심리 표준편차 점수를 계산하여, 예를 들어 ‘표준편차/4’와 같은 신호 강도를 포트폴리오 구성 시스템이 자산 배분에 활용하게 만들 수 있습니다.  
이 방식은 표준편차의 회고 기간이라는 또 다른 미묘한 파라미터를 도입하긴 하지만, 고정된 임계값이 아니라 동적으로 변화하는 확률 기반 접근입니다.

**3. 축소 (Reduce)**

마지막이자 가장 어려운 단계는 성능을 향상시키기 위해 파라미터를 조정하면서 백테스트를 반복하는 유혹을 피하는 것입니다.  
가능한 한 전략을 짧은 시간 구간에 기반해 구축하고, 최근 데이터는 아껴두었다가 샘플 외 테스트(out-of-sample test)에 사용하세요.  
라이브 트레이딩 전에는 이 데이터를 2~3회 정도만 테스트에 사용한 뒤 해당 아이디어를 폐기하는 것이 이상적입니다.

**파라미터 민감도 테스트**

QuantConnect는 모든 가능한 파라미터 조합을 빠르게 탐색할 수 있는 강력한 그리드 서치 도구를 제공합니다.  
하지만 강력한 도구인 만큼 잘못 사용하면 위험할 수 있습니다.  
QuantConnect에서는 각 프로젝트의 사이드 패널에서 파라미터를 설정하고, 아래와 같이 코드에서 불러옵니다:

```python
# 저장된 파라미터 불러오기
parameter_value = self.get_parameter("parameterName")
````

이 도구는 파라미터 민감도 테스트—즉, 성능이 파라미터 값 범위에서 어떻게 변하는지를 확인하는 용도로 사용하는 것이 바람직합니다.
알고리즘이 다양한 파라미터 값에서도 비슷한 성능을 보인다면 견고한 전략일 가능성이 높습니다.
반대로 성과가 좁은 파라미터 범위에 집중되어 있다면, 이는 데이터 내 아티팩트이거나 소수의 거래가 성과를 왜곡시킨 것일 수 있습니다.

최근의 대표적 사례는 2020년 3월 COVID 폭락장에서 정확히 숏 포지션을 취해 얻은 과도한 수익입니다. 이는 6시그마(global extreme) 사건으로, 가까운 시일 내 다시 발생할 가능성이 매우 낮습니다. 만약 여러분의 파라미터 조합이 해당 시기를 숏 포지션으로 공략했다면, 이는 과적합일 가능성이 높습니다.

샤프 비율(Sharpe Ratio)은 이러한 숨겨진 이상치(outlier)를 감지하지 못합니다. 이는 수익의 평균과 분산만을 고려하며, 수익이 정규분포를 따른다는 가정에 의존합니다.
하지만 수익이 정규분포를 따르지 않는다는 강력한 실증 증거에 따라, Bailey와 De Prado(2012)는 수익 샘플로부터 계산되는 확률 측정치인 **확률적 샤프 비율(Probabilistic Sharpe Ratio, PSR)** 을 제안했습니다.

PSR은 추정된 샤프 비율이 특정 벤치마크(예: 1.0)보다 클 확률을 알려줍니다. 즉, 해당 추정치가 통계적으로 유의미한지를 판단합니다.

QuantConnect에서는 이 값이 백테스트 결과에 포함되며, 벤치마크 샤프 비율은 1.0으로 설정되어 있습니다.
생성된 PSR 점수는 실제 샤프 비율이 1.0을 초과할 확률(%)로 해석할 수 있습니다.
예를 들어 PSR 점수가 **77%** 라면, 해당 전략이 실제로 샤프 비율이 1.0을 초과할 가능성이 77%라는 뜻입니다.

---

## 마진 모델링

모든 전략은 자본 할당에서 시작하여 가능한 한 효율적으로 배포하는 것을 목표로 합니다. 이를 위해 알고리즘은 원하는 포지션을 열기 위해 매수 여력(buying power)을 잘 관리해야 합니다 (qnt.com/book-buying-power).

마진(margin)은 거래 계좌가 허용하는 최대 매수 여력을 계산한 값입니다. 이는 보유 자산(현금 포함), 계좌 유형, 증권사에 따라 결정됩니다. SEC와 FINRA에서 정의한 여러 마진 모델이 있지만, 궁극적으로 마진은 신용 한도(line of credit)입니다. 따라서 제공되는 레버리지 비율은 시장 리스크와 계좌 담보에 기반하여 증권사가 결정합니다.

QuantConnect 전략의 `portfolio` 객체 속성으로 언제든지 이용 가능한 마진과 사용 중인 전체 마진을 확인할 수 있습니다. 이 속성들은 모든 자산 유형에 걸친 포트폴리오 차원의 마진을 계산합니다.

```python
self.portfolio.margin_remaining # 할당 가능한 매수 여력
self.portfolio.total_margin_used # 보유 종목에 배정된 매수 여력
```

**주식(Equities)**

주식 투자자에게는 세 가지 주요 마진 형태가 있습니다:

**현금 계좌(Cash Accounts)** – 매수 여력이 현금 잔고로 제한됩니다. 거래 후 현금이 결제되고 주식 소유권이 이전되기까지 최대 3일이 소요될 수 있습니다. QuantConnect에서는 다음과 같이 브로커리지 모델로 지정할 수 있습니다.

```python
# 현금 계좌 및 모든 브로커 모델 설정
self.set_brokerage_model(BrokerageName.INTERACTIVE_BROKERS_BROKERAGE, AccountType.CASH)
```

**마진 계좌(Margin Accounts)** – 마진 계좌를 통해 증권사는 종가 기준 최대 2배, 일중 최대 4배 추가 매수 여력을 제공합니다. 주문 결제도 즉시 이루어져 자본의 빠른 재배포가 가능합니다. 이 책의 대부분 예제는 마진 계좌를 기반으로 진행됩니다.

```python
# 마진 계좌 및 모든 브로커 모델 설정
self.set_brokerage_model(BrokerageName.INTERACTIVE_BROKERS_BROKERAGE, AccountType.MARGIN)
```

**포트폴리오 마진(Portfolio Margin)** – 보유 자산의 변동성과 유동성에 기반한 동적 위험 기반 마진 추정치입니다. 안정적인 현금성 자산이 있다면 증권사의 담보로 활용되어 마진 여력이 높게 유지됩니다. 포트폴리오 마진 계좌는 즉시 결제되며 초기 현금의 최대 6.7배까지 매수 여력을 제공합니다. QuantConnect는 아직 포트폴리오 마진 모델을 지원하지 않지만, 레버리지를 7로 설정하여 대략적으로 모방할 수 있습니다.

```python
self.add_equity("SPY", leverage=7)
```

**주식 옵션(Equity Options)**

주식 옵션 계약은 기초 주식에 레버리지 노출을 제공합니다. 보험, 고변동성, 저변동성, 횡보, 추세 등 다양한 투자 전략에 활용될 수 있습니다. 옵션 계약의 명목 가치(notional value)는 계약 가격(list price)의 100배이며, 이는 100주 기초 자산을 나타냅니다.

옵션 전략(option strategies)은 여러 옵션 계약을 조합하여 총 노출을 줄이는 방식입니다. QuantConnect는 16개의 옵션 전략을 모델링하며, 다음 예시처럼 헬퍼(helper) 메서드를 통해 호출할 수 있습니다. 이 예시에서는 예상 변동성에 따라 만기가 가장 짧거나 긴 옵션을 선택합니다.

```python
if low_volatility:
    contracts = OptionStrategies.short_straddle(option_symbol, strike, min(expiries))
else:
    contracts = OptionStrategies.straddle(option_symbol, strike, max(expiries))
# OptionStrategies 헬퍼를 사용해 매수할 계약 가져오기
order_tickets = self.buy(contracts, 1)
```

일반적으로 옵션 매수 시 위험은 계약 구매 금액으로 제한됩니다. 옵션 매도 시에는 계약당 100주의 기초 자산을 정산해야 할 수 있어 마진 요구량이 증가합니다. 이때 헷지 전략은 총 위험 노출을 낮추어 줍니다.

QuantConnect에서는 헷지 마진 요구량을 자동으로 계산해 주므로, 전략의 알파(alpha)에 집중하고 가용 자본을 효과적으로 활용할 수 있습니다.

**선물(Futures)**

선물 계약은 계약당 초기 증거금(initial margin)을 부과하고, 계약을 유지하기 위해 일정 금액 이상의 잔고를 유지해야 합니다(유지 증거금, maintenance margin). 주식과 마찬가지로, 계좌 잔고가 최소 요건 이하로 떨어지면 거래소나 증권사가 포지션을 청산할 수 있습니다.

각 선물 계약은 계약 가격과 변동성 변동에 따라 거래소가 주기적으로 업데이트하는 초기 및 유지 증거금 요건을 가집니다. 선물 계약의 명목 가치(notional value)는 단위 자산 가격(unit price)에 계약 승수(contract multiplier)를 곱한 값입니다. 과거에 계약 승수는 원자재 판매 단위(예: 100배럴)였으나, 현재는 서로 유사한 노출을 가진 다양한 계약을 제공하기 위한 스케일링 팩터로 사용됩니다.

QuantConnect에서는 모든 가격, 계약 승수, 초기 및 유지 증거금 요건을 모델링하여 실시간 매수 여력을 정확히 제공합니다. 이 과정은 자동으로 이루어지지만, 고정 자본 할당으로 매수 또는 매도할 계약 수를 명시적으로 계산하려면 다음 메서드를 사용할 수 있습니다.

```python
# 20% 매수 여력에 대한 수수료 조정 계약 수량 계산
contract = canonical_future.mapped 
quantity = self.calculate_order_quantity(contract, 0.2)
```
---

## 다각화(Diversification) 및 자산 선택

다각화는 다양한 자산에 투자하여 전체 수익률을 높이는 것입니다. 자산을 적절히 조합하면 하나의 투자에서 발생한 손실이 다른 투자에서의 이익으로 상쇄되어 전체 포트폴리오 리스크를 줄일 수 있습니다.

> “다각화는 투자에서 유일한 무료 점심이다.”
> – 해리 마코위츠(Harry Markowitz)

QuantConnect에서는 여러 주식과 자산 유형을 포트폴리오에 추가하여 다각화의 이점을 탐구할 수 있습니다. 가장 간단한 다각화 형태는 산업, 고객 기반, 리스크-수익 프로필이 다른 자산을 선택하는 것입니다. 기초적으로 다양한 투자를 선택함으로써 시장 붕괴 시에도 포트폴리오가 살아남을 확률을 높일 수 있습니다. QuantConnect에서는 미국 주식 내에서도 산업별로 주식을 선택하거나, 지원하는 11개 자산 클래스 중 하나에 걸쳐 투자할 수 있습니다. 또한 ETF(상장지수펀드)를 통해 채권과 국제 시장 ETF를 거래할 수도 있습니다.

```python
# 타겟 포트폴리오를 지능적으로 주문 처리하면서 매수
self.set_holdings([
    PortfolioTarget("SPY", 0.6), PortfolioTarget("BND", 0.4)
])
```

포트폴리오 다각화를 개선하려면 자산 간 상관관계를 측정하고, 기존 보유 자산과 상대적으로 상관관계가 낮은 자산을 추가할 수 있습니다. 상관관계는 새로운 자산이 기존 포트폴리오 수익률과 얼마나 유사하게 움직이는지를 나타내는 지표입니다. 1.0은 완전히 동일하게 움직임을 의미하고, -1.0은 완전히 반대로 움직임을 의미합니다. 0은 독립적으로 움직임을 의미합니다.

```python
def beta(self, asset_returns, benchmark_returns):
    covariance = np.cov(asset_returns, benchmark_returns)[0, 1]
    variance = np.var(benchmark_returns)
    return covariance / variance
```

흔한 실수는 독립적으로 보이는 주식을 포트폴리오에 추가했지만, 시장 변동성이 발생하면 함께 움직이는 경우입니다. 겉보기에는 상관관계가 낮아 보이던 자산도 시장 조정 시 상관관계가 높아질 수 있으므로, 과거 상관관계를 꼼꼼히 검토하는 것이 향후 하락장에서 살아남는 데 필수적입니다.

**기초적(펀더멘털) 자산 선택**

QuantConnect에서 자산 선택은 유니버스 셀렉션(universe selection)이라고 합니다 (gnt.co/book-universe-selection). 유니버스 셀렉션은 코드화된 기준에 따라 전략에 사용할 자산을 선택하는 과정입니다. 기준을 코드화하면 자산 선택 과정에서 인간의 편향이 제거됩니다. 어떤 필터를 적용할지는 전략의 투자 목표에 따라 다르지만, 유니버스 셀렉션의 공통된 핵심은 시스템이나 알고리즘을 통해 자산 생존 편향(survivorship bias)과 선택 편향(selection bias)을 방지하는 것입니다.

선택 편향(selection bias)은 전략에 사용할 구성 요소를 불완전하거나 비과학적으로 선택하는 것입니다. 가장 흔한 형태는 브랜드나 회사에 대한 개인적 애착으로 자산을 선택하는 것입니다.

생존 편향(survivorship bias)은 투자 유니버스를 오늘날 여전히 상장된 자산으로만 한정하는 선택 편향입니다. 다년간 백테스트를 수행할 때 오늘날 성과가 좋은 자산만을 선택하면, 지난 10\~20년 동안 상장 폐지된 수많은 기업을 암묵적으로 배제하게 됩니다. 지나간 뒤에 Apple이나 NVIDIA가 성공을 거둘 것을 쉽게 알 수 있지만, 당시 수천 개 기술주 중에서 이를 골라내기는 훨씬 어려웠습니다.

유니버스 셀렉션 함수 정의 단계에서도 과적합(overfit)이 발생하기 쉽습니다. 수익이나 수익성 필터를 하드코딩했다면, 유리하게 자산을 걸러낼 수 있다는 점을 염두에 두고 새 파라미터의 민감도(sensitivity)를 테스트해야 합니다.

다음 QuantConnect 예제에서는 기업 펀더멘털 데이터를 기반으로 자산을 선택합니다. Fundamental 객체에는 회사당 약 900개의 속성이 있어 선택 기준으로 활용할 수 있습니다.

```python
def select(self, fundamental):
    filtered = [f for f in fundamental if not np.isnan(f.valuation_ratios.pe_ratio)]
    sorted_by_pe_ratio = sorted(filtered, key=lambda f: f.valuation_ratios.pe_ratio)
    return [f.symbol for f in sorted_by_pe_ratio[:10]]
```

스케줄된 유니버스 셀렉션은 시장 달력에 따라 고정된 주기로 유니버스 필터를 다시 적용합니다. 이를 통해 백테스트 속도를 높이고 자산 교체(churn)를 줄일 수 있습니다. 기본적으로 유니버스 셀렉션은 매일 실행되지만, 많은 전략에는 지나치게 잦은 빈도일 수 있습니다.

```python
# SPY의 매 거래달 시작 시에 셀렉션을 다시 실행
self.universe_settings.schedule.on(self.date_rules.month_start("SPY"))
# 셀렉션 시 선택된 자산의 일간 봉 데이터를 가져오기
self.universe_settings.resolution = Resolution.DAILY

# 유니버스 셀렉션 함수 추가
self.add_universe(lambda fundamental: [ ... ])
```

선택 결과 유니버스 변경이 필요 없을 때는 특별 플래그 `Universe.UNCHANGED`를 반환하여 이전에 선택된 유니버스를 유지할 수 있습니다. 이 동작은 자산 교체를 방지하고 백테스트 속도를 더욱 빠르게 합니다.

**ETF와 지수 추종**

ETF는 인기 지수, 예를 들면 S\&P500을 수동적으로 추종하여, 지수에 포함된 주식들에 투자하는 비용 효율적인 방법을 제공합니다. 이 방식은 주당 \$1/100\$ 가격으로 투자할 수 있어 경제적입니다. 또한, 지수와 그에 얹힌 ETF는 자산의 추가 및 삭제 방식이 명확하고 변경되지 않은 규칙을 따르기 때문에, 주식 선택을 위한 유용한 리스트가 될 수 있습니다.

**유니버스 셀렉션과 필터링**

QuantConnect에서는 ETF를 데이터 소스로 선택하여 유니버스 선택 과정을 구동하고 지수나 액티브 전략을 추적할 수 있습니다. 이를 통해 구성된 유니버스에서 필터링 함수로 각 자산의 펀더멘털 데이터를 요청하여 투자 범위를 좁히는 방법도 유용합니다. 코드에서는 주석을 그대로 두고, 코드 텍스트만 번역하며 유니버스를 필터링하는 방식도 제시됩니다.

**달러 거래량 자산 선택**

유니버스 셀렉션에서 가장 단순하고 빠른 방법은 가격과 달러 거래량(가격 × 거래량)을 기준으로 필터링하는 것입니다.

**ETF 구성 종목 자산 선택**

ETF는 시장 수익률을 상회하려는 여러 증권을 바구니로 묶은 상품입니다. 많은 ETF는 S\&P500과 같은 인기 지수를 수동으로 추종하며, 지수 구성 종목에 투자하는 비용 효율적인 방법을 제공합니다. 지수 비용의 $1/100$에 해당하는 주당 비용으로 투자가 가능합니다. 이러한 지수와 이를 기반으로 만든 ETF는 오랫동안 변경되지 않은 명확한 규칙에 따라 유니버스에 자산을 추가·제거하므로, 주식 선택을 위한 구성 종목 목록으로도 유용합니다.

QuantConnect에서는 ETF를 데이터 소스로 선택하여 유니버스 셀렉션을 구동하고, 지수나 기초 액티브 전략을 면밀히 추적할 수 있습니다. 이렇게 구성된 유니버스에서 필터링 함수를 사용하여 각 자산의 펀더멘털 데이터를 요청해 투자 범위를 더욱 좁힐 수 있습니다.

```python
# Add and filter ETF constituents
self.add_universe(self.universe.etf("QQQ",universe_filter_func=self.filter))
# Narrow universe with other data
def filter(self, constituents):
    return [ c.symbol for c in constituents if self.fundamentals(c.symbol).valuation_ratios.pe_ratio > 10]
```

**달러 거래량 자산 선택**

유니버스 셀렉션에서 가장 단순하고 빠른 방법은 가격과 달러 거래량(가격 × 거래량)을 기준으로 필터링하는 것입니다. 이 데이터셋에는 일별 가격 값과 거래량이 포함되어 있습니다. 가격 정보를 사용하여 필요한 기술적 지표를 구성하고, 가장 유동성이 높은 자산을 필터링·순위화할 수 있습니다.

QuantConnect에는 이를 한 줄의 코드로 자동 추가할 수 있는 단축 메서드가 있습니다. 다음 예제는 이전 거래일 기준으로 달러 거래량이 가장 높은 5개 자산을 자동으로 선택합니다:

```python
self.add_universe(self.universe.dollar_volume.top(5))
```

유니버스 데이터를 기반으로 보다 고급 유니버스 유형을 구축하려면, 데이터를 저장하고 각 종목별 속성을 초기화하는 클래스를 사용하여 알고리즘을 체계적으로 구성할 것을 권장합니다. `SymbolData` 클래스 패턴을 사용하면 자산 정보를 저장하기 위한 병렬 딕셔너리를 생성하는 흔한 실수를 피할 수 있습니다. 유니버스가 선택을 위해 데이터를 제공할 때, `SymbolData` 생성자는 복잡한 상태를 구축하고 자산 포함 여부를 추적할 수 있습니다.

```python
class SymbolData:
    # Construct initial state. Use algorithm to setup state
    def __init__(self, algorithm, symbol, period):
        self._symbol = symbol
        self._sma = SimpleMovingAverage(period)
    # Update internal state with required data, train models
    def update(self, time, price, volume):
        self._sma.update(time, volume)
```

**유니버스 설정**

유니버스는 원하는 동작을 설정하고 전략에 추가되는 자산의 속성을 제어하기 위해 다양한 설정(qnt.co/book-universe-selectionsettings)이 가능합니다. 이러한 설정은 알고리즘 초기화 단계에서 구성해야 합니다. 이후 장에서 사용하는 주요 속성은 다음과 같습니다:

**스케줄링(Scheduling)** — 유니버스 셀렉션을 트리거할 주기를 정의합니다. 이를 통해 알고리즘 성능이 향상되고 자산 교체(churn)가 줄어듭니다. 기본적으로 유니버스는 매일 선택됩니다.

```python
self.universe_settings.schedule.on(date_rule)
```

**연장 거래 시간(Extended Market Hours)** — 기본적으로 데이터 피드는 정상 거래 시간 데이터만 포함합니다. 이 값을 `True`로 설정하면 장전(pre-market) 및 장후(after-market) 데이터도 알고리즘에 전달됩니다.

```python
self.universe_settings.extended_market_hours = True
```

**데이터 해상도(Data Resolution)** — 유니버스 셀렉션으로 추가되는 자산 데이터의 해상도를 정의합니다.

```python
self.universe_settings.resolution = Resolution.HOUR
```

**데이터 정규화 모드(Data Normalization Mode)** — 셀렉션으로 추가된 자산 데이터에 사용할 데이터 조정 기법을 정의합니다. 기본적으로 주식 분할(split) 및 배당(dividend)을 모두 반영한 정규화가 적용됩니다.

```python
self.universe_settings.data_normalization_mode = DataNormalizationMode.RAW
```

---

## 지표 및 기타 데이터 변환

Quant 실무자들은 원시 시장 데이터를 분석하기 용이한 형태로 변환하기 위해 수천 가지 방법을 개발해왔습니다. 이러한 변환들이 점점 정교해짐에 따라, 기본 데이터와의 연결 고리는 점차 약해졌습니다. 이러한 변환/필터/지표의 대부분은 지연 신호(lagging signals)로서—훈련 평균이나 변동성을 요약하여 제공합니다.

분석을 목적으로 한 데이터 변환으로서 지표 자체에는 근본적인 문제가 없습니다. 하지만 기술적 분석이 기술 신호에 인과관계를 부여할 때 ‘주술(부두) 분석’으로 넘어가기 쉽습니다. 기술 지표는 유용한 데이터 변환 도구이지만, 시장이 반응하거나 움직이는 직접적 원인이 아닙니다. 전략에 지표를 적용할 때는 객관적이고 과학적인 시각을 유지하도록 노력하세요.

QuantConnect는 수백 가지 기술 지표(qnt.co/booksupported-indicators)를 구현하여, 대부분의 기술적·기본 금융 수학 분석을 지원하는 헬퍼로 제공합니다. 대부분의 기술 지표는 수학적 또는 금융 연산—평균과 분포—의 변형에 불과합니다.

**자동 지표(Automatic Indicators)**

QuantConnect에는 즉시 사용 가능하도록 생성되고(등록된 후 자동으로 데이터 업데이트를 받는) 수백 가지 헬퍼 함수가 있습니다(qnt.com/book-automatic-indicators). API에서는 지표 약어로 표현됩니다:

```python
# 자동 업데이트되며 워밍업된 지표 생성
auto_rsi = self.rsi("SPY", 10, MovingAverageType.SIMPLE)
```

**수동 지표(Manual Indicators)**

수동 지표는 API 동작을 구현하는 독립 클래스입니다. 수동 지표를 생성하려면 필요한 데이터를 직접 공급하거나, 데이터 피드에 객체를 등록해야 합니다(qnt.co/book-manual-indicators). 자동 지표보다 어렵지만, 입력 데이터를 완전하게 제어할 수 있다는 장점이 있습니다.

```python
# 수동 업데이트가 필요한 RSI 지표 생성
manual_rsi = RelativeStrengthIndex(10, MovingAverageType.SIMPLE)

# 3개의 TradeBar를 하나로 묶는 컨솔리데이터 생성
consolidator = TradeBarConsolidator(3)

# 기호에 컨솔리데이터를 등록하고, 해당 3TB 바를 지표에 연결
self.register_indicator(symbol, manual_rsi, consolidator)
```

**지표 워밍업(Indicator Warm Up)**

QuantConnect는 실시간 거래와 동일한 스트리밍 데이터 피드를 기반으로 모든 지표를 구축했습니다. 워밍업은 과거 데이터를 지표에 스트리밍하여 거래 준비를 마치는 과정입니다. 다음 플래그를 `True`로 설정하면 자동으로 워밍업이 수행됩니다:

```python
self.settings.automatic_indicator_warmup = True
```

**객체 저장(Storing Objects)**

Python의 덕타이핑(duck-typing)을 활용하여 지표 객체를 증권(Security) 객체에 편리하게 저장할 수 있습니다. 다음 예제는 Apple 증권 객체에 자동 업데이트되는 EMA 지표를 생성하는 방법을 보여줍니다. 이 새 속성은 알고리즘 어디서든 접근할 수 있습니다.

```python
aapl = self.add_equity("AAPL", Resolution.DAILY)  # Apple 증권 생성
aapl.ema = self.ema("AAPL", 200)                   # 지표를 duck ema 변수에 할당
```

**지표 이벤트(Indicator Events)**

지표가 업데이트되면 이벤트가 발생하여, 이후 계산을 갱신하는 데 활용할 수 있습니다. 이를 통해 전략이 생성하는 이벤트 순서를 제어할 수 있습니다. 다음 예제는 `indicator_updated` 이벤트 핸들러를 사용하여 차트에 지표 값을 그립니다:

```python
# 지표 생성 후 이벤트 핸들러 연결
auto_rsi.updated += self.indicator_updated

def update_event_handler(self, indicator, indicator_data_point):
    if indicator.is_ready:
        self.plot("Indicator", "Value", indicator_data_point.value)
```

---

## 아이디어 발굴

트레이딩 아이디어의 탐색 범위는 사실상 무한합니다. 시장은 수십억 개의 개별 요인이 기여하는 거대한, 무한히 복잡한 퍼즐과 같습니다! 수만 개의 자산이 각각 고유한 배경과 뉘앙스를 지니고 있습니다.

아이디어 생성에는 **데이터 기반 투자(data-driven investing)** 와 **가설 기반 투자(hypothesis-driven investing)** 두 가지 주요 진영이 있습니다. 두 방식 모두 일반 원칙을 따르는 대형 펀드들이 존재합니다. 다음으로 이 두 개념과 아이디어를 생성하기 위한 온라인 참고 자료를 살펴보겠습니다.

**가설 기반 테스트(Hypothesis-driven Testing)**

가설 기반 테스트는 수용하거나 기각할 수 있는 테스트를 만드는 데 집중합니다. 알고리즘 가설은 인과 관계(cause and effect) 패턴을 따르는 것이 좋습니다. 전략을 다음 문장으로 표현해 보세요:

> {원인(cause)}의 변화가 {결과(effect)}를 초래한다.

영감을 얻기 위해 경험, 직관 또는 미디어에서 원인을 찾으세요. 일반적으로 금융 시장 움직임의 원인은 다음 범주에 속합니다:

* 인간 심리 — 대중적 히스테리나 공포, 보통 모멘텀의 배후 ‘이유(why)’ (“느린 정보 전파” 이론)
* 세계 사건 — 핵심 글로벌(정치·기술) 또는 로컬(기업 거버넌스·제품 출시) 이벤트로 자산의 본질 가치를 변화
* 시장 또는 기업 활동

다음 그림 2.4의 예시를 참고하세요.

<img src="./images/fig_02_04.png" width=800>

연구를 시작할 때 가설을 세우고, 나머지 시간은 가설을 검증하는 방법을 탐구하는 데 사용하세요. 핵심 가설에서 벗어나거나 가설 기반이 아닌 코드를 도입하기 시작하면 과적합 위험이 있으므로 즉시 중단하고 다시 가설 개발로 돌아가야 합니다.

Alvarez et al. (2014)는 테스트 결과를 바탕으로 가설을 만드는 위험을 보여주었습니다. 이들은 기술 섹터의 이익 수익률(earnings yield) 팩터를 시간 경과에 따라 조사했습니다. 1998–1999년 기술 버블 붕괴 이전에는 해당 팩터가 수익을 내지 못했습니다. 만약 2000–2002년 동안 팩터에 역배팅하기로 결정했다면, 그 기간에 팩터가 매우 좋은 성과를 내어 큰 손실을 입었을 것입니다.

탐색할 수 있는 전략은 수백만 가지에 이르며, 오직 당신의 상상력과 시장 이해력만이 한계를 정합니다. 테스트할 전략을 선택했다면, 과적합 확률을 줄이기 위해 고정된 기간 동안만 탐구할 것을 권장합니다.

**데이터 기반 투자(Data Driven Investing)**

데이터 기반 투자는 통계적 이상 현상을 찾고, 그 이유를 설명하려 하지 않고 투자하는 방식입니다. 이 관점에 따르면 아이디어가 왜 발생하는지 설명하는 것은 시간 낭비이며, 대부분 틀릴 가능성이 높습니다. 인간은 합리적 사고를 하는 패턴 매칭 기계이기 때문에, 어떤 데이터에도 뒤돌아본 사건에 대해 이유를 부여할 수 있습니다.

가설 기반 투자의 강력한 이유 중 하나는 가설의 원인이 사라지면 전략 거래를 중단할 명확한 신호가 있다는 점입니다. 반면 데이터 기반 투자는 통계적 방법으로 알파가 성과를 멈출 때 포트폴리오에서 제거할 수 있습니다.

**Quantpedia**

영감의 원천으로 여러 온라인 자료를 검토할 수 있습니다. Quantpedia(qnt.co/book-quantpedia)는 트레이딩 전략에 관한 학술 연구를 종합적으로 수집·검토합니다. 학술 금융 연구와 실제 투자 관리 간 격차를 줄이는 것이 주목적입니다. 수천 편의 논문을 분석해 실용적인 트레이딩 전략을 추출하며, 주식, 원자재, 채권 등 다양한 자산 클래스를 다룹니다.

Quantpedia는 전략별 상세 설명, 성과 통계, 구현 가이드라인을 제공하여 투자자가 실제 시나리오에 적용할 수 있도록 돕습니다. 모멘텀, 가치, 변동성 등 다양한 팩터별로 전략을 분류해 체계적으로 탐색할 수 있습니다. 웹사이트는 [www.quantpedia.com입니다](http://www.quantpedia.com입니다).

**QuantConnect 리서치 및 전략 탐색기(Research and Strategy Explorer)**

QuantConnect 리서치 아티클에는 약 100편의 논문 구현 사례가 짧은 글로 정리되어 있습니다. 이를 통해 자신의 전략에 적용할 아이디어를 얻을 수 있습니다. 관련 자료는 gnt.co/book-research에서 확인할 수 있습니다.

QuantConnect Explorer에는 코어 팀이 작성한 50개의 실시간 전략이 공개 라이브 트레이딩 환경에서 실행됩니다. 각 전략은 인·아웃 오브 샘플 라이브 트레이딩을 견딜 수 있도록 설계되어 있으며, 기업 행동 이벤트를 완벽히 처리하고 재시작 시 알고리즘 상태를 복원합니다. 해당 컬렉션은 gnt.co/book-explore에서 볼 수 있습니다.

---