# Portfolio Analysis

포트폴리오 분석은 경험적 자산 가격 책정에서 가장 일반적으로 사용되는 통계적 방법론 중 하나입니다. 그 목적은 두 개 이상의 변수 간의 단면 관계를 검사하는 것입니다. 포트폴리오 분석의 가장 빈번한 응용 분야는 하나 이상의 변수가 미래 주식 수익률을 예측할 수 있는 능력을 조사하는 것입니다. 일반적인 접근법은 주식의 포트폴리오를 구성하는 것으로, 각 포트폴리오의 주식은 미래 수익률의 단면적 변동을 예측하고 이러한 포트폴리오의 수익률을 조사하기 위해 상정된 다양한 수준의 변수 또는 변수를 가지고 있습니다.

포트폴리오 분석의 가장 일반적인 응용 분야는 미래 수익 예측 가능성을 조사하는 것이지만 포트폴리오 방법론은 모든 변수 집합 간의 횡단면 관계를 이해하는 데에도 사용할 수 있습니다. 이는 서로 다른 포트폴리오에서 엔터티(주식)의 특성 변동을 이해하는 데 유용합니다. 따라서 매우 일반적인 의미에서 포트폴리오 분석은 한 변수와 다른 변수의 조합 간의 단면 관계를 이해하는 데 유용합니다.

아마도 포트폴리오 분석의 가장 중요한 이점은 비모수적 기법이라는 점일 것입니다. 이는 조사 중인 변수 간의 횡단면 관계의 특성에 대해 어떠한 가정도 하지 않음을 의미합니다. 다른 많은 방법론은 조사되는 변수 간의 관계의 기능적 형태에 관한 몇 가지 가정에 의존합니다. 예를 들어, 선형 회귀 분석에서는 종속 변수와 독립 변수 간의 관계가 선형이라고 가정합니다. 포트폴리오 분석에는 이러한 가정이 필요하지 않습니다. 사실, 포트폴리오 분석은 파라메트릭 기법을 사용하여 감지하기 매우 어려운 변수 간의 비선형 관계를 발견하는 데 도움이 될 수 있습니다. 아마도 이 기술의 주요 단점은 관심 있는 단면 관계를 검사할 때 많은 수의 변수를 제어하기 어렵다는 것입니다. 이는 분석에서 많은 수의 독립 변수를 쉽게 제어할 수 있는 회귀 분석과 비교됩니다.

이 장에서는 포트폴리오 분석을 구현하고 결과를 해석하는 세부 사항을 제시하고 예시합니다. 포트폴리오 분석에는 여러 가지 변형이 있습니다. 일부 연구자들은 이 장에서 다루지 않는 변형을 구현했지만, 경험적 자산 가격 책정 연구에서 대부분의 포트폴리오 분석은 여기에서 논의된 접근 방식 중 하나를 따릅니다. 이 장에서는 Y를 사용하여 포트폴리오 분석의 결과 변수를 나타냅니다. Y는 회귀 분석의 종속 변수와 유사한 관심 변수로 생각할 수 있습니다. X를 사용하여 정렬 변수를 나타냅니다. X는 독립 변수(들)에 있는 변수들 또는 회귀 분석의 변수들과 유사합니다. 우리는 각각 섹션 5.2와 5.3에서 논의된 독립 및 종속 정렬을 표현할 때 혼동을 피하기 위해 Y와 X를 각각 결과 및 정렬 변수를 참조합니다. 섹션 1.1에 설명된 방법론 샘플을 사용하여 포트폴리오 방법론을 시연합니다.

## 1. Univariate Portfolio Analysis

포트폴리오 분석의 가장 기본적인 유형인 일변량 포트폴리오 분석부터 시작합니다. 일변량 포트폴리오 분석에는 하나의 정렬 변수 X만 있습니다. 분석의 목적은 X와 결과 변수 Y 간의 횡단면 관계를 평가하는 것입니다. 일변량 포트폴리오 분석에서는 이 관계를 조사할 때 다른 효과를 제어할 수 없습니다. 일변량 포트폴리오 분석 절차는 4단계로 구성됩니다. 첫 번째 단계는 샘플을 포트폴리오로 나누는 데 사용할 중단점을 계산하는 것입니다. 두 번째 단계는 이러한 중단점을 사용하여 포트폴리오를 구성하는 것입니다. 세 번째 단계는 각 기간 t에 대해 각 포트폴리오 내에서 결과 변수 Y의 평균값을 계산하는 것입니다. 네 번째 단계는 서로 다른 포트폴리오에서 Y의 평균 값의 변동을 조사하는 것입니다.

일변량 포트폴리오 분석의 첫 번째 단계는 정렬 변수 X의 값을 기반으로 표본의 엔터티를 포트폴리오로 그룹화하는 데 사용할 주기적 중단점을 계산하는 것입니다. 첫 번째 중단점보다 작은 X 값을 가진 엔터티는 첫 번째 포트폴리오에 배치됩니다. 첫 번째와 두 번째 중단점 사이에 있는 X 값을 가진 엔터티는 두 번째 포트폴리오를 구성합니다. 마지막으로, X 값이 가장 높은 중단점보다 높은 엔터티는 마지막 포트폴리오에 배치됩니다. 각 기간마다 형성될 포트폴리오의 수를 nP로 표시합니다. 따라서 각 기간을 계산해야 하는 중단점의 수는 nP − 1입니다. 형성할 포트폴리오의 수와 따라서 계산할 중단점의 수는 모든 기간에 대해 동일합니다. 그러나 k번째 중단점의 값은 거의 확실하게 기간에 따라 달라집니다. 기간 t에 대한 k번째 중단점을 k ∈ {1, 2, ... , nP − 1}에 대해 Bk,t로 표시합니다.

기간 t에 대한 중단점은 정렬 변수 X의 시간 t 횡단면 분포의 백분위수에 의해 결정됩니다. 특히, pk를 k번째 중단점을 결정하는 백분위수로 지정하면, 기간 t에 대한 k번째 중단점은 기간 t에서 X를 사용할 수 있는 샘플의 모든 엔티티에서 X 값의 pk번째 백분위수로 계산됩니다. 따라서 중단점을 다음과 같이 정의합니다.

$$ B_{k,t} = Pctl_{p_k}(\{ X_t \})

여기서 Pctlp(Z)는 세트 Z의 p번째 백분위수이고 {Xt}는 기간 t의 샘플에 있는 모든 엔티티 i에서 정렬 변수 X의 유효한 값 세트를 나타냅니다. 백분위수와 그에 따른 중단점은 k가 증가함에 따라 증가하여 0 < p1 < p2 < 제공합니다. < pnP−1 및 B1,t ≤ B2,t ≤ ··· ≤ 모든 기간 t에 대해 BnP−1,t. 선택한 백분위수(p1, p2, ..., pnP−1)는 엄격하게 증가해야 하지만, 이는 X의 선택된 백분위수 값으로 계산된 실제 중단점이 엄격하게 증가한다는 의미는 아닙니다. 경우에 따라 X의 값이 동일한 엔터티가 많이 있을 수 있으며, 이로 인해 두 개 이상의 중단점이 동일해질 수 있습니다. 변수 X가 실제로 연속형인 경우 이러한 일이 발생할 확률은 0이어야 합니다. 그러나 자산 가격 조사에 사용되는 변수의 예는 언뜻 보기에는 연속적인 것처럼 보이지만 실제로는 변수 값이 동일한 엔터티가 많이 있습니다.

여기서 언급할 가치가 있는 것은 경우에 따라 중단점은 주어진 기간 t 동안 샘플에 있는 엔터티의 하위 집합만 사용하여 계산된다는 것입니다. 예를 들어, 엔터티가 주식인 연구에서 연구원은 뉴욕 증권 거래소에서 거래되는 주식만 사용하여 중단점을 형성한 다음 해당 중단점을 사용하여 표본의 모든 주식(다른 거래소에서 거래되는 주식 포함)을 포트폴리오로 정렬합니다. 따라서 이전 단락과 섹션 5.1.1의 나머지 부분에서 샘플을 참조할 때 실제로 의미하는 것은 중단점을 계산하는 데 사용되는 전체 샘플의 하위 집합입니다. 대부분의 경우 이 하위 집합은 전체 샘플이지만 엄격한 하위 집합이 사용되는 많은 예가 있습니다. 이러한 이유로 우리는 포트폴리오 분석 절차에서 두 가지 별도의 단계인 중단점 계산과 포트폴리오 형성을 고려합니다.

적절한 수의 포트폴리오를 선택하고 중단점에 적합한 백분위수를 선택하는 것은 포트폴리오 분석에서 중요한 결정입니다. 샘플의 엔터티는 결국 중단점에 따라 포트폴리오로 그룹화되므로 결정은 주로 각 포트폴리오의 엔터티 수를 포트폴리오 간 정렬 변수의 분산과 비교하는 것을 기반으로 합니다. 포트폴리오의 수가 증가하면 각 포트폴리오의 엔터티 수가 줄어들고 그 반대의 경우도 마찬가지입니다. 각 포트폴리오에 대한 결과 변수 Y의 평균값이 최종적으로 계산될 때(Y의 평균값은 포트폴리오 분석의 초점이며 섹션 5.1.3에서 설명됨) 각 포트폴리오의 엔터티 수가 적으면 Y의 표본 평균값을 실제 평균의 추정치로 사용할 때 노이즈가 증가합니다. 따라서 각 포트폴리오에 많은 수의 엔터티가 있으면 각 포트폴리오에 대한 실제 평균값 추정치의 정확도가 높아지므로 바람직합니다. 반면에, 각 포트폴리오로 그룹화하는 엔티티가 많을수록 포트폴리오 수가 줄어들고 포트폴리오 간 정렬 변수 X의 분산이 작아집니다. 포트폴리오 전반에 걸쳐 X의 분산이 감소하면 포트폴리오가 너무 적으면 포트폴리오에서 X의 값이 크게 다르지 않을 수 있으므로 X와 Y 간의 횡단면 관계를 감지하기가 더 어려워질 수 있습니다.

가장 일반적으로 포트폴리오는 정렬 변수의 횡단면 분포에 대한 균일한 간격의 백분위수를 나타내는 중단점을 사용하여 형성됩니다. 즉, nP − 1 중단점은 x의 k ×(1∕nP) 백분위수로 정의되며, 여기서 k ∈ {1, ... , nP − 1}입니다. 예를 들어, 샘플을 5개의 포트폴리오로 분할하려는 경우 정렬 변수의 20번째, 40번째, 60번째 및 80번째 백분위수를 포트폴리오 브레이크포인트로 사용할 수 있습니다. 중단점을 계산하기 위한 균등한 간격의 백분위수 접근 방식이 가장 일반적이지만 다른 접근 방식이 사용되었습니다. 예를 들어, 표본을 세 개의 포트폴리오로만 분할하는 경우 sort 변수의 30번째 및 70번째 백분위수를 중단점으로 사용하는 것이 일반적입니다.

포트폴리오의 수와 중단점 백분위수를 선택할 때 각 기간 t에 대해 새 포트폴리오가 형성된다는 점을 기억하는 것이 중요합니다. 따라서 각 포트폴리오에 속하는 엔티티의 수를 평가할 때는 서로 다른 기간 t 동안 표본에 있는 엔티티의 평균 수뿐만 아니라 모든 기간의 최소 엔티티 수를 살펴보는 것이 중요합니다. 각 포트폴리오에 넣을 엔터티의 수는 샘플의 엔터티 수와 중단점을 계산하는 데 사용되는 백분위수에 따라 쉽게 결정됩니다. 중단점이 동일한 간격의 백분위수에 의해 결정되는 경우 지정된 기간 t 동안 각 포트폴리오의 엔터티 수는 해당 기간 동안 샘플의 엔터티 수를 포트폴리오 수로 나눈 값이 됩니다. 일반적인 의미에서, 주어진 기간 t 동안 포트폴리오에 있는 최소 엔티티 수는 기간 t 동안 샘플에 있는 엔티티 수(nt라고 표시)에 가장 낮은 백분위수의 최소값, 연속 백분위수 간의 차이, 그리고 1에서 가장 높은 백분위수를 뺀 값이 됩니다. 이러한 경우의 예외는 중단점을 계산하는 데 사용되는 샘플이 포트폴리오에 배치될 엔터티 집합의 엄격한 하위 집합인 경우입니다. 이 경우 포트폴리오의 최소 엔터티 수는 더 많아집니다. 마지막으로, 거의 모든 연구가 3개에서 20개 사이의 포트폴리오를 사용하며, 대부분의 연구자들은 5개 또는 10개를 선택합니다.

일변량 포트폴리오 분석에서 중단점 계산을 예시하기 위해 섹션 1.1에서 설명한 방법론 샘플을 사용하고 β를 정렬 변수로 사용합니다. 이 분석은 7개의 포트폴리오(nP = 7)를 사용하므로 매년 6개의 중단점이 계산됩니다. 중단점은 β의 10번째, 20번째, 40번째, 60번째, 80번째 및 90번째 백분위수입니다. 우리는 단순히 포트폴리오 절차의 유연성을 보여주기 위해 고르지 않은 중단점을 선택합니다. 경우에 따라 연구원은 가장 낮은 포트폴리오와 가장 높은 포트폴리오에 대해 중단점을 결정하는 백분위수 사이의 거리를 더 작게 만들도록 선택하는데, 그렇게 하면 정렬 변수 X의 극단적인(낮거나 높은) 값을 가진 엔터티에 대해 조사 중인 관계가 더 강한지 여부를 이해하는 데 도움이 될 수 있기 때문입니다. 경험적 금융 문헌에서 단면 현상이 조사 중인 변수 중 하나의 극단적인 값을 가진 소수의 주식에 의해 주도되는 것은 드문 일이 아닙니다.

중단점 계산 결과는 표 5.1에 나와 있습니다. 예를 들어, 1988년의 브레이크포인트 1, 2, 3, 4, 5, 6은 각각 −0.05, 0.07, 0.29, 0.51, 0.86, 1.11임을 보여줍니다. 이것들은 1988년 말에 주식을 포트폴리오로 분류하는 데 사용될 브레이크포인트입니다. 계산에 필요한 대로 중단점은 각 연도 t에 대한 열에서 증가합니다.