# 0. 파일 불러오기

In [4]:
import pickle
with open('../stock_db.pkl', 'rb') as f:
    data = pickle.load(f)

ticker_list = data[0]   # 티커
sector_list = data[1]   # 섹터
price_list = data[2]    # 주가
fs_list = data[3]       # 재무제표
value_list = data[4]    # 밸류지표(TTM)

---

# 13.2 베타 계산하기

In [None]:
import yfinance as yf
import pandas as pd

tickers = ['^KS11', '039490.KS']        # 코스피 코드, 키움증권의 티커

all_data = {}

# all_data의 밸류값은 dataframe
for ticker in tickers:
    all_data[ticker] = yf.download(ticker,
                                   start='2016-01-01',
                                   end='2021-12-31')


all_data_dic = {tic: data['Close'] for tic, data in all_data.items()}

prices = all_data_dic['^KS11'].join(all_data_dic['039490.KS'])  # 두 데이터프레임을 하나로 합침
ret = prices.pct_change().dropna()  # prc_change로 수익률 계산, NA 데이터 삭제

# prices

In [38]:
import statsmodels.api as sm

ret['intercept'] = 1    # 알파 계산 위해 intercept(절편)에 해당하는 열에 1 입력
reg = sm.OLS(ret[['039490.KS']], ret[['^KS11', 'intercept']]).fit()     # OLS(종속변수, 독립변수): 선형회귀분석 실시 함수

In [None]:
# 베타를 나타내는 부분 : coef

# 계수 값(Coef.): 각 독립변수가 종속변수에 미치는 영향력
# 표준오차(str err): 회귀 계수 추정치의 불확실성을 나타냄. 작을수록 추정치 신뢰도 높음
# t-통계량: 회귀 계수의 통계적 유의성을 평가하는 지표 (2보다 크면 유의미)
# p-value: 0.05보다 작으면 통계적 유의미

reg.summary()

---

# 13.3 밸류 전략

## 13.3.1 DataReader() 함수를 이용한 팩터 데이터 다운로드

In [None]:
import pandas_datareader.data as web
from pandas_datareader.famafrench import get_available_datasets

datasets = get_available_datasets()
datasets[1:20]

In [None]:
import pandas_datareader.data as web

df_pbr = web.DataReader('Portfolios_Formed_on_BE-ME',
               'famafrench',
               start='1900-01-01')

# B/M에서 B는 장부가치(Book Value), M은 시장가치(Market Value) -> PBR의 역수
df_pbr[0].head()

## 13.3.2 가치 평가 방법 당 포트폴리오의 수익률 비교

In [None]:
# 누적 수익률 확인 ([Lo 20, Qnt2, Qnt3, Qnt4, Hi 20])

import matplotlib.pyplot as plt
from matplotlib import cm

plt.rc('font', family='NanumSquare')
plt.rc('axes', unicode_minus=False)

df_pbr_vw = df_pbr[0].loc[:, ['Lo 20', 'Qnt 2', 'Qnt 3', 'Qnt 4', 'Hi 20']]
df_pbr_cum = (1 + df_pbr_vw / 100).cumprod()    # 데이터의 1은 1%를 나타냄 - 100으로 나눈 후 cumprod() 메서드를 통해 누적 수익률 계산
df_pbr_cum.plot(figsize=(10, 6),
                colormap=cm.jet,
                legend='reverse',
                title='PBR별 포트폴리오의 누적 수익률')

plt.show()

In [None]:
# 로그 차트로 다시 표현

import numpy as np

df_pbr_cum = np.log(1+df_pbr_vw/100).cumsum()
df_pbr_cum.plot(figsize=(10, 6),
                colormap=cm.jet,
                legend='reverse',
                title='PBR별 포트폴리오의 누적 수익률')

plt.show()

In [15]:
# PBR별 포트폴리오의 간단한 성과 비교
# 연율화 수익률(기하), 연율화 수익률(산술), 연율화 변동성 및 샤프지수 구하기

import pandas as pd

def factor_stat(df):
    n = len(df)
    
    ret_ari = (df / 100).mean(axis=0) * 12
    ret_geo = (1 + df / 100).prod() ** (12/n) - 1
    vol = (df / 100).std(axis=0) * np.sqrt(12)
    sharp = ret_ari / vol
    
    stat = pd.DataFrame(
        [ret_ari, ret_geo, vol, sharp],
        index = ['연율화 수익률(기하)', '연율화 수익률(산술)', '연율화 변동성', '샤프지수']
    ).round(4)
    
    stat.iloc[0:3, ] = stat.iloc[0:3, ] * 100
    
    return stat

In [None]:
# Hi 20 (PBR이 가장 낮은 종목)로 구성된 포트폴리오: 수익률 가장 높음
# Lo 20 (PBR이 가장 높은 종목)로 구성된 포트폴리오: 수익률 가장 낮음

factor_stat(df_pbr_vw)

In [None]:
# E/P(PER 역수) 지표의 누적 수익률 - PER이 낮을수록 수익률 높음

df_per = web.DataReader('Portfolios_Formed_on_E-P',
                        'famafrench',
                        start='1900-01-01')
df_per_vw = df_per[0].loc[:, ['Lo 20', 'Qnt 2', 'Qnt 3', 'Qnt 4', 'Hi 20']]
df_per_cum = np.log(1 + df_per_vw / 100).cumsum()
df_per_cum.plot(figsize=(10, 6),
                colormap=cm.jet,
                legend='reverse',
                title='PER별 포트폴리오의 누적 수익률')

plt.show()

In [None]:
# CF/P(PCR 역수) 지표의 누적 수익률 - PCR이 낮을수록 수익률 높음

df_pcr = web.DataReader('Portfolios_Formed_on_CF-P',
                        'famafrench',
                        start='1900-01-01')
df_pcr_vw = df_pcr[0].loc[:, ['Lo 20', 'Qnt 2', 'Qnt 3', 'Qnt 4', 'Hi 20']]
df_pcr_cum = np.log(1 + df_pcr_vw / 100).cumsum()
df_pcr_cum.plot(figsize=(10, 6),
                colormap=cm.jet,
                legend='reverse',
                title='PCR별 포트폴리오의 누적 수익률')

plt.show()

## 13.3.3 밸류 포트폴리오 구하기

In [21]:
from sqlalchemy import create_engine
import pandas as pd
import numpy as np

engine = create_engine('mysql+pymysql://root:1234@127.0.0.1:3306/stock_db')

ticker_list = pd.read_sql(
    """
    select * from kor_ticker
    where 기준일 = (select max(기준일) from kor_ticker)
        and 종목구분 = '보통주';
    """, con=engine
)

value_list = pd.read_sql(
    """
    select * from kor_value
    where 기준일 = (select max(기준일) from kor_value);
    """, con=engine
)

engine.dispose()

In [None]:
value_list.loc[value_list['값'] <= 0, '값'] = np.nan
value_pivot = value_list.pivot(index='종목코드', columns='지표', values='값')   # 가치 지표 테이블을 가로로 긴 형태로 변경
data_bind = ticker_list[['종목코드', '종목명']].merge(value_pivot, how='left', on='종목코드')   # 티커 테이블과 가치지표 테이블 결합

data_bind.head()

In [None]:
value_rank = data_bind[['PER', 'PBR']].rank(axis=0) # PER, PBR 각각의 순위 구하기
value_sum = value_rank.sum(axis=1, skipna=False).rank() # 위에서 구한 순위를 행 방향으로 더하기, NA는 제외, 합을 기준으로 다시 순위 나누기
data_bind.loc[value_sum <= 20, ['종목코드', '종목명', 'PER', 'PBR']] # 순위가 낮은 20종목 선택

## 13.3.4 여러 지표 결합하기

In [None]:
# PER, PBR, PCR, PSR, DY를 고려한 밸류 포트폴리오 제작

import matplotlib.pyplot as plt
import seaborn as sns

value_list_copy = data_bind.copy()
value_list_copy['DY'] = 1 / value_list_copy['DY']
value_list_copy = value_list_copy[['PER', 'PBR', 'PCR', 'PSR', 'DY']]
value_rank_all = value_list_copy.rank(axis=0)
mask = np.triu(value_rank_all.corr())

fig, ax = plt.subplots(figsize=(10,6))
sns.heatmap(value_rank_all.corr(),
            annot=True,
            mask=mask,
            annot_kws={"size": 16},
            vmin=0,
            vmax=1,
            center=0.5,
            cmap='coolwarm',
            square=True)
ax.invert_yaxis()
plt.show()

In [None]:
# 위의 히트맵에서 볼 수 있듯이, 비슷한 가치지표임에도 불구하고 서로 간의 상관관계가 꽤 낮은 지표 존재 -> 지표를 통합적으로 고려하면 분산 효과 노려볼 수 있음
value_sum_all = value_rank_all.sum(axis=1, skipna=False).rank()
data_bind.loc[value_sum_all <= 20]

---

# 13.4 모멘텀 전략