# 자료구조 프로젝트 - 포트폴리오 백테스팅 저장 시스템
## 다음은 자료구조 프로젝트에서 투자 방식 별 수익률을 저장하는 시스템을 구축한 코드입니다
### 간단한 비중을 입력하였으며, 향후 더 세분화해서 저장할 수 있게 발전시킬 수 있다고 생각합니다.
### 현재 저장하는 방식은 주식,채권 비중을 키값으로 '0.1,0.3' 형태로 저장하게 하였으며 value는 지정한 end날짜까지 수익률을 구해 결과값을 불러옵니다.

## 1. 먼저 필요한 라이브러리를 불러옵니다.

In [1]:
#!pip install pandas_datareader 
import numpy as np
import pandas as pd
import re
import pandas_datareader as wb
import operator


### 사용한 자료구조는 딕셔너리입니다.
### 포트폴리오의 백테스팅 결과는 기간에 따라 다를 수 있기때문에 self.table_day 변수를 이용해 초기 날짜를 저장할 수 있게끔하였습니다.
### 또한, 입력 변수를 다음과 같이 포맷팅시켰습니다. (ex.0.1,0.3)
### 나눠주는 방식을 취하였기에 비중이 0인 경우는 제외해주었습니다. 실제 분산투자시에도 비중이 0인 경우는 별로 고려하지 않음을 생각하여 설정하였습니다.

### 추가적으로 sort 함수를 팀소트를 이용해 만들어보았으며, 기본적으로 파이썬 내장함수 sorted(팀소트)을 활용하였습니다.
### 정렬을 할 경우는 기본 자료구조에서 새 메모리를 할당하여 리스트안에 튜플들을 저장하게끔 해주었습니다.
### 추가적으로 ascending이라는 변수를 이용해 내림차순 오름차순을 설정하게끔 해주었습니다. 또한, 마지막 산출 값을 데이터프레임 형태로 만들어보았습니다.

In [158]:
class port_system:
    def __init__(self, table_day,name_list):
        self.name_list=name_list
        
        self.port_dict = dict()
        self.key_list=[]
        self.table_day=table_day
    
    
    def save(self, key, value):
        if len(value) != len(self.name_list):
            print(len(value),value,len(self.name_list))
            print("value개수와 초기 저장예정 변수 개수가 다릅니다.")
        
        if key in port_dict.keys():
            print('이미 키값으로 있습니다.')
        else:
            self.port_dict[key]=value
            self.key_list.append(key)
            
    def read(self, key,Frame='off'):
        if key not in self.key_list:
            print('키 값이 없습니다.')
            return
        
        value=self.port_dict[key]
        \
        if Frame=="on":
            print(pd.DataFrame(value,self.name_list))
            return self.hash_table[hash_address][a][1]
        
        return value
        
        
    def delete(self, key):
        if key not in self.key_list:
            print('키 값이 없습니다.')
        else:
            del self.port_dict[key]
            self.key_list.remove(key)
     
    
    def sort(self, value,ascending=False):
        print(value,'기준으로', 'ascending',ascending,'으로 정렬합니다.')
        value_index=self.name_list.index(value)
        print(value_index)
        length = len(self.key_list) - 1
        arr=self.key_list
        sort_list=[]
        item_list=list(self.port_dict.items())
        for i in range(length):
            value=item_list[i][1][value_index]
            sort_list.append((item_list[i][0],value))
            #print((item_list[i][0],value))
        
        
        sort_finish=sorted(sort_list, key=operator.itemgetter(1))
        
        sort_array=pd.DataFrame(sort_finish)
        sort_array.columns=["weight(stock,bond)"]+[self.name_list[value_index]]
        if ascending==False:
            sort_array=sort_array[::-1]
            return sort_array
        return sort_array
        

## 2. 이제 본격적으로 시뮬레이션 코드입니다. 밑의 코드는 코스피 지수와 TLT(미국채 ETF), DBC(원자재 ETF)를 불러오는 코드입니다.

### start_date= 시뮬레이션 시작 날짜입니다.
### end_date = 시뮬레이션 종료 날짜입니다.
### 저장할 데이터는 시작 날짜의 종가 대비 종료 날짜의 종가의 수익률입니다.

In [92]:


start_date = '2020-04-29'
end_date = '2022-04-29'

df_stock = wb.DataReader('^KS11', "yahoo",start_date, end_date).Close

df_bond = wb.DataReader('TLT', "yahoo",start_date, end_date).Close

df_mat = wb.DataReader('DBC', "yahoo",start_date, end_date).Close

In [93]:
((df_bond/df_bond.shift(1))).cumprod().dropna()
((df_mat/df_mat.shift(1))).cumprod().dropna()
((df_stock/df_stock.shift(1))).cumprod().dropna()

Date
2020-05-04    0.973202
2020-05-06    0.990347
2020-05-07    0.990270
2020-05-08    0.999107
2020-05-11    0.993756
                ...   
2022-04-25    1.364338
2022-04-26    1.370078
2022-04-27    1.355060
2022-04-28    1.369657
2022-04-29    1.383808
Name: Close, Length: 493, dtype: float64

In [157]:
#mdd,dd 구하는 함수
def dd_plot(data,window):
    
    max_in_window= data.rolling(window,min_periods=1).max()
    dd=(data/max_in_window -1.0) * 100
    mdd=dd.rolling(window,min_periods=1).min()
    return dd , mdd

## 직접 제작한 port_system 객체를 설정한뒤 주식 비중을 0.1~0.9까지 움직이는데, 이에 따라 채권비중을 조절해가며 백테스팅 결과를 save 함수로 저장해줍니다.

In [160]:
port_table = port_system(end_date,["수익률",'샤프','mdd','dd'])


for stock_ratio in np.arange(0.1, 1, 0.1):
    stock_ratio=round(stock_ratio,2)
    for bond_ratio in np.arange(1, 0, -0.1):
        bond_ratio=round(bond_ratio,2)
        mat_ratio=1-stock_ratio-bond_ratio
        if mat_ratio<=0:
            continue
        
        name = str(stock_ratio)+','+str(bond_ratio)
        bond_profit= ((df_bond/df_bond.shift(1))).fillna(1).cumprod().dropna()
        mat_profit=((df_mat/df_mat.shift(1))).fillna(1).cumprod().dropna()
        stock_profit= ((df_stock/df_stock.shift(1))).cumprod().dropna()
        profit_list = (stock_profit*stock_ratio + bond_profit*bond_ratio + mat_profit*mat_ratio).dropna()
        money_list=[1000*i for i in profit_list]
        last_profit=round(profit_list,2)[-1]
        std=np.std(profit_list)
        sharp_ratio=(last_profit-1)/std
        dd,mdd= dd_plot(pd.DataFrame(money_list),window=30)
        mdd=np.min(mdd)[0]
        
        dd=np.mean(dd)[0]
        #print(name,type([last_profit,sharp_ratio,dd,mdd]))
        print(str(name))
        port_table.save(str(name),[round(last_profit,2),round(sharp_ratio,2),round(dd,2),round(mdd,2)])
        

  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)
  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)
  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)


0.1,0.8
0.1,0.7
0.1,0.6


  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)
  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)
  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)


0.1,0.5
0.1,0.4
0.1,0.3
0.1,0.2


  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)
  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)
  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)


0.1,0.1
0.2,0.7
0.2,0.6


  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)
  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)
  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)


0.2,0.5
0.2,0.4
0.2,0.3


  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)
  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)
  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)


0.2,0.2
0.2,0.1
0.3,0.6
0.3,0.5


  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)
  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)
  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)
  return reduction(axis=axis, out=out, **passkwargs)


0.3,0.4
0.3,0.3
0.3,0.2


  return mean(axis=axis, dtype=dtype, out=out, **kwargs)
  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)
  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)
  return reduction(axis=axis, out=out, **passkwargs)


0.3,0.1
0.4,0.5
0.4,0.4


  return mean(axis=axis, dtype=dtype, out=out, **kwargs)
  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)
  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)
  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)


0.4,0.3
0.4,0.2
0.4,0.1


  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)
  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)
  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)


0.5,0.4
0.5,0.3
0.5,0.2


  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)
  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)
  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)


0.5,0.1
0.6,0.3
0.6,0.2
0.6,0.1


  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)
  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)
  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)


0.7,0.3
0.7,0.2
0.7,0.1
0.8,0.1


  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)
  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)
  return reduction(axis=axis, out=out, **passkwargs)
  return mean(axis=axis, dtype=dtype, out=out, **kwargs)


## 다음은 필요한 비중이 있는지 없는지 확인하는 코드입니다. 비중을 입력하면 해당 키에 맞게 value가 도출됩니다.

In [161]:
error=True
while error==True:
    key=input("주식채권비중을 입력하시오(ex. 0.1,0.3)" )
    
    p=re.compile('\d+[.]+\d+[,]+\d+[.]+\d')
    if p.match(key):
        error=False
    else:
        print("올바른 형식을 입력하세요!")
        
    
value=port_table.read(key)
print(value)

주식채권비중을 입력하시오(ex. 0.1,0.3)0.1,0.3
[1.92, 3.84, -1.46, -10.98]


## key_list는 data가 save 될때마다 저장을 해주게끔 하였습니다. 이유는 정렬을 할 때, 내부의 키값을 알아야지만 정렬이 가능하기에 변수로 저장해두었습니다.

In [163]:
port_table.key_list

['0.1,0.8',
 '0.1,0.7',
 '0.1,0.6',
 '0.1,0.5',
 '0.1,0.4',
 '0.1,0.3',
 '0.1,0.2',
 '0.1,0.1',
 '0.2,0.7',
 '0.2,0.6',
 '0.2,0.5',
 '0.2,0.4',
 '0.2,0.3',
 '0.2,0.2',
 '0.2,0.1',
 '0.3,0.6',
 '0.3,0.5',
 '0.3,0.4',
 '0.3,0.3',
 '0.3,0.2',
 '0.3,0.1',
 '0.4,0.5',
 '0.4,0.4',
 '0.4,0.3',
 '0.4,0.2',
 '0.4,0.1',
 '0.5,0.4',
 '0.5,0.3',
 '0.5,0.2',
 '0.5,0.1',
 '0.6,0.3',
 '0.6,0.2',
 '0.6,0.1',
 '0.7,0.3',
 '0.7,0.2',
 '0.7,0.1',
 '0.8,0.1']

## 다음은 필요없는 비중은 제거할 수 있는 코드입니다. key_list에서도 제거하는 코드를 class 안 함수에 추가해주었습니다.

In [164]:

error=True
while error==True:
    key=input("주식채권비중을 입력하시오(ex. 0.1,0.3)" )
    
    p=re.compile('\d+[.]+\d+[,]+\d+[.]+\d')
    if p.match(key):
        error=False
    else:
        print("올바른 형식을 입력하세요!")

print("value ", port_table.read(key))
        
port_table.delete(key)
print('데이터가 삭제되었습니다.')
print("port_table.read(key) : " ,end="")
port_table.read(key)


주식채권비중을 입력하시오(ex. 0.1,0.3)0.1,0.3
value  [1.92, 3.84, -1.46, -10.98]
데이터가 삭제되었습니다.
port_table.read(key) : 키 값이 없습니다.


## 다음은 정렬 코드입니다. ascending 변수를 이용해 오름차순 내림차순을 설정할 수 있습니다.

In [166]:
# 다음의 변수들을 기준으로 정렬을 시킬 수 있습니다.
port_table.name_list

['수익률', '샤프', 'mdd', 'dd']

In [167]:
arr=port_table.sort(value='수익률',ascending=False)


수익률 기준으로 ascending False 으로 정렬합니다.
0


In [168]:
arr

Unnamed: 0,"weight(stock,bond)",수익률
34,"0.1,0.1",2.3
33,"0.2,0.1",2.18
32,"0.1,0.2",2.11
31,"0.3,0.1",2.06
30,"0.2,0.2",1.99
29,"0.4,0.1",1.93
28,"0.3,0.2",1.87
27,"0.5,0.1",1.81
26,"0.2,0.3",1.8
25,"0.4,0.2",1.74
