# Portfolio Optimization (포트폴리오 최적화)

- 위험회피적 투자자가 시장 위험의 주어진 수준에 따라 기대수익을 최적화하거나 최대화하여 보상 수준을 선택  


- 방법 1 – Monte Carlo Simulation 에 의한 최적 포트폴리오 탐색
- 방법 2 – scipy 를 이용한 수학적 최적화 (Mathematical Optimization)

In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import datetime
import FinanceDataReader as fdr
from scipy.optimize import minimize
import random

#한글 폰트 사용
import platform
from matplotlib import font_manager
 
if platform.system() == "Darwin":  #Mac
    plt.rc('font', family='AppleGothic')
else:
    font_path = 'C:/Windows/Fonts/malgun.ttf' # For Windows 
    font_name = font_manager.FontProperties(fname=font_path).get_name()  
    plt.rc('font', family=font_name)                           

plt.rcParams['axes.unicode_minus'] = False  #한글사용시 마이너스 사인 깨짐 방지

np.random.seed(101)

start = datetime.datetime(2015, 1, 1)
end = datetime.datetime(2022, 1, 1)

In [2]:
def get_ret_vol_sr(weights, log_ret):
    """
    샤프비율 계산 함수 
    연간 기대 수익률, 연간 covariance, sharp ratio 반환 
    """
    weights = np.array(weights)
    cov = log_ret.cov() * 252
    ret = np.sum(log_ret.mean() * weights) * 252
    vol = np.sqrt(np.dot(weights.T, np.dot(cov, weights)))
    sr = ret / vol
    return np.array([ret, vol, sr])

In [4]:
def portfolio_optimize(stock_list, iteration = 50_000):
    code_names = [code[1] for code in stock_list]

    portfolio = pd.DataFrame([])
    for stock in stock_list:
        df = fdr.DataReader(stock[0], start, end)
        if len(df) == 0:
            print(stock)
        portfolio = pd.concat([portfolio, df['Close']], axis=1)

    portfolio.columns = code_names

    #포트폴리오 수익률 생성 (log return)
    log_ret = np.log(portfolio / portfolio.shift(1))

    # 연간 기대수익률
    expected_return = log_ret.mean() * 252
    # 연간 covariance
    cov = log_ret.cov() * 252

    # Method 1 - Monte Carlo Simulation
    # 각 자산의 비중을 무작위로 선택하여 특정 자산 비중에서의 연간 수익률, 변동성, 샤프비율 계산

    cols = len(log_ret.columns)

    all_weights = np.zeros((iteration, cols))
    ret_arr = np.zeros(iteration)
    vol_arr = np.zeros(iteration)
    sharpe_arr = np.zeros(iteration)

    for i in range(iteration):
        weights = np.random.random(cols) 
        weights = weights / np.sum(weights) #각 자산의 비중
        all_weights[i, :] = weights  # iteration 별 자산 비중 저장

        rvs = get_ret_vol_sr(weights, log_ret) #특정 자산비중에서의 ret,vol,sr
        ret_arr[i] = rvs[0]
        vol_arr[i] = rvs[1]
        sharpe_arr[i] = rvs[2]

    # MC method 에 의해 simulation 한 최적 sharpe ratio
    #print('최적 Sharpe Ratio = {}'.format(sharpe_arr.max()))

    max_idx = sharpe_arr.argmax()

    # 최적 Sharpe ratio 일 때의 daily return 과 volatility, 최적 portfolio 비율
    #print('return = {}'.format(ret_arr[max_idx]))
    #print('volatility = {}'.format(vol_arr[max_idx]))

    # Method 2 - Scipy 를 이용한 수학적 최적화 (Mathematical Optimization)

    # 목적 함수 - 샤프비율 최대화
    def neg_sharpe(weights):
        return get_ret_vol_sr(weights, log_ret)[2] * -1

    #constraint 함수 정의
    def check_sum(weights):
        # return 0 if sum of weights is 1.0
        return np.sum(weights) - 1

    cons = ({'type': 'eq', 'fun': check_sum})

    # 각 weight 에 대한 (min, max)
    bounds = tuple((0, 1) for _ in log_ret.columns)

    # 각 asset의 초기 비중을 동일하게 가져간다고 가정
    x0 = [1/len(log_ret.columns) for _ in log_ret.columns]

    opt_results = minimize(neg_sharpe, x0, method='SLSQP', bounds=bounds, constraints=cons)
    
    check_weights = [1 for w in opt_results.x if w < 0.01]
    if sum(check_weights) >= 2:
        print(f"skipped weights {log_ret.columns.values} :", opt_results.x)
        return
    
    with np.printoptions(precision=5, suppress=True):
        print("\n=======================================================================")
        print('scipy를 이용한 최적 자산 비중 = {} : {}'.format(log_ret.columns.values, opt_results.x))  
        print('MC를 이용한 최적 자산 비중    = {} : {}'.format(log_ret.columns.values, all_weights[max_idx]))
    print("---------------------------------------------------------------------------------------------------------------------")

    opt_rvs = get_ret_vol_sr(opt_results.x, log_ret)

    with np.printoptions(precision=3, suppress=True):
        print('최적 자산 비중 {}: {} 일 때'.format(log_ret.columns.values, opt_results.x))
        print('최적 Sharpe Ratio = {:.3f}'.format(opt_rvs[2]))
        print('최적 SR일 때의 수익률 = {:.3f}'.format(opt_rvs[0]))
        print('최적 SR일 때의 변동성 = {:.3f}'.format(opt_rvs[1]))
    print("=======================================================================\n")

In [6]:
df = pd.read_csv("code_gangnam.csv")
df.head()

FileNotFoundError: [Errno 2] No such file or directory: 'code_gangnam.csv'

In [5]:
%%time
candidate_stocks = [('005930', '삼성전자'), ('081660', '휠라홀딩스'), ('138930', 'BNK금융'), 
                    ('139480', '이마트'),  ('035720', '카카오'), ('000990', 'DB하이텍'), ('105560', 'KB금융'), ('035420', 'NAVER'), ('068270', '셀트리온')]
tmp = []
for i in range(10):
    tmp.append(random.sample(candidate_stocks, 5))

for stock_list in tmp:
    portfolio_optimize(stock_list, iteration = 50_000)

skipped weights ['삼성전자' 'KB금융' '이마트' 'BNK금융' '카카오'] : [5.92538013e-01 9.47525890e-03 0.00000000e+00 7.75204553e-17
 3.97986728e-01]
scipy를 이용한 최적 자산 비중 = ['DB하이텍' 'NAVER' 'KB금융' '카카오' '이마트'] : [0.50187 0.13061 0.05333 0.31419 0.     ]
MC를 이용한 최적 자산 비중    = ['DB하이텍' 'NAVER' 'KB금융' '카카오' '이마트'] : [0.55169 0.11225 0.07396 0.25979 0.0023 ]
---------------------------------------------------------------------------------------------------------------------
최적 자산 비중 ['DB하이텍' 'NAVER' 'KB금융' '카카오' '이마트']: [0.502 0.131 0.053 0.314 0.   ] 일 때
최적 annualized Sharpe Ratio = 0.913
최적 SR일 때의 수익률 = 0.288
최적 SR일 때의 변동성 = 0.316

skipped weights ['휠라홀딩스' '이마트' 'NAVER' 'DB하이텍' '셀트리온'] : [8.29127618e-18 2.06100216e-18 2.23243757e-01 5.10881312e-01
 2.65874931e-01]
skipped weights ['셀트리온' 'BNK금융' '이마트' 'KB금융' '삼성전자'] : [3.20217279e-01 0.00000000e+00 0.00000000e+00 3.29597460e-17
 6.79782721e-01]
skipped weights ['셀트리온' '휠라홀딩스' '이마트' 'KB금융' '삼성전자'] : [3.14976889e-01 1.81096296e-02 6.00165027e-17 5.22585447e-