## SRF Roll Over 정보 정리
- SRF 에서 다운 받은 상품별 월물 데이터를 연결하여 연결데이터를 만듬

In [1]:
import sys
sys.path.append('..')
from datetime import datetime
import csv
import h5py
import os
import numpy as np
import pandas as pd
import warnings

In [2]:
#del sys.modules['tools.instruments']
#del sys.modules['tools.constants']
from tools import monitor_memory
from tools.constants import SRF_CONTRACTS_DB_PATH, SRF_CONTINUOUS_BO_DB_PATH, SRF_ROLLOVER_BO_CSV_PATH
from tools.instruments import instruments
from tools.visualisation import view

### 1. 상품별 월물 DB를 하나의 DataFrame으로 만들기

In [3]:
file = h5py.File(SRF_CONTRACTS_DB_PATH, 'r')

In [4]:
 def get_quotes_by_symbol(symbol):
    #파일 불러오기 및 월물 리스트 불러오기
    file = h5py.File(SRF_CONTRACTS_DB_PATH, 'r')
    dset = file[symbol]
    
    instrument = instruments[symbol] 
    codes = [x[2] for x in instrument.contracts]
    
    #pandas multi index naming
    names = ['close','volume', 'oi']
    indexes = [
                sum([ [code]*3 for code in codes],[]),
                names*len(codes)
            ]

    quotes=[]
    for code in codes:
        df = pd.DataFrame(dset[code]['date','close','volume','open_interest'])
        df['date'] = df['date'].astype('M8[D]')
        df.set_index('date', inplace=True)
        quotes.append(df)

    quotes= pd.concat(quotes, axis=1)
    quotes.columns = indexes

    #첫번째 월물의 거래량이 적어서 오류가 날 가능성이 있음
    #첫번째 월물의 만기 두달전 부터 시작  
    first_contract = codes[0]
    m = instruments.month_code(first_contract[-5])
    if m==1 or m==2:
        y = str(int(first_contract[-4:])-1)
    else:
        y = first_contract[-4:]
    
    m = f'{[1,2,3,4,5,6,7,8,9,10,11,12][m-3]:02d}'
    startdate = y+'-'+m+'-'+'01'
    quotes = quotes[startdate:]
    
    file.close()
    
    return quotes

### 2. 연결 정보 만들기
* 연결방법: Backward Panama Ajusted
* 연결기준:
    1. Roll Over by open-interest (BO): 미결제약정이 역전된 다음 날 기준

In [9]:
def create_continuous_futures(symbol, method='bo'):
    """
    * 액티브 월물 선택 규칙
     1. 액티브월물이 현재보다 앞선 월물로 바뀌지 않는다. 
     2. 현재 액티브월물 포함 연속된 4개의 월물중 미결제약정(method) 이 가장 많은 월물로 변경한다.
     3. 연속된 4개의 월물이 모두 nan 이거나 가장 많은 미결제약정의 수가 0이면 스킵한다 
     4. 현재 액티브 월물이 nan이고 다음 3개월물 값이 있으면 그 중 미결제 약정이 가장 많은 월물로 변경한다.
     5. 오늘이 현재 액티브 월물의 마지막 거래일보다 나중이면 다음 3개월물 중 미결제 약정이 가장 많은 월물
        또는 가장 앞선 월물로 변경한다.
     6. 월물 변경일 직전 종가의 차를 계산하여 보정한다
    """
    if method == 'bv':
        raise ValueError("method 'bv' no more support")
    
    
    quotes = get_quotes_by_symbol(symbol) #상품별 월물 전체 데이터
    contracts = instruments[symbol].contracts #월물 정보 
    
    if method == 'bo':
        data = quotes.xs('oi' ,axis=1,level=1) #method column 만 슬라이스
    
    if method == 'bv':
        data = quotes.xs('volume' ,axis=1,level=1) #method column 만 슬라이스
    
    rolls = [] #롤오버 정보를 담을 리스트
    columns = data.columns #컬럼 리스트
    active = 0 #액티브 월물의 row 인덱스
    maxvol = 0 #최대 거래량 (전일의 거래량과 비교하여 계산을 스킵할때 사용)
    
    #액티브 월물, 시작날짜, 가격차  
    rolls.append((columns[active], data.index[0], 0)) 
    
    
    for date, row in data.iloc[1:].iterrows():
        #4개월물 
        flag = row[active:active+4]
  
        # 오늘이 현재 액티브 월물의 마지막 거래일보다 나중이면 다음 3개월물 중 미결제 약정이 가장 많은 월물
        # 또는 가장 앞선 월물로 변경한다.
        # 연속된 4개월물이 모두 nan 이면 스킵 
        # 가끔 nan + 0, 2,3 같은 값이 들어있어서 그것도 스킵
        # 직전 거래일의 최대 거래량의 0.1% 보다 작으면 스킵 
        
        expire_date = list(filter(lambda x: x[2]==columns[active], contracts))[0][4]
        expire_date = datetime.strptime(expire_date, '%Y-%m-%d')
        #return date, expire_date
        if date > expire_date:
            print(f"!!!액티브 월물 만기 지남 code:{columns[active]}, date:{date}, 만기일:{expire_date}")
            flag = row[active+1:active+4]
            maxvol = flag.max()
            if pd.isna(maxvol):
                maxcol = active+1
            else:
                maxcol = columns.get_loc(flag.idxmax())
            
        

        elif pd.isna(flag.max()) or flag.max() < maxvol*0.001 or flag.max() < 10:
            print("모두 nan value 혹은 최대값이 0, active: ", columns[active])
            print(flag)
            continue

        
        else:
            #미결제 약정이 최대인 월물의 컬럼 인덱스(숫자)
            maxvol = flag.max()
            maxcol = columns.get_loc(flag.idxmax())
        
        # 신규월물이 현재 월물이면 스킵
        if maxcol == active:
            continue
            
        # 신규월물이 액티브월물보다 앞선 월물이면 스킵
        if maxcol < active:
            print("%%% 앞선 월물로 변경중 %%%")
            print(flag)
            continue

        else:
            #print(f"월물변경: {columns[active]} -> {columns[idxmax]} ({date}) {instruments.month_code(flag.idxmax()[-3])}")
            rolldateidx = data.index.get_loc(date) #월물 변경날 인덱스
            
            before_price = quotes[columns[active]].iloc[rolldateidx-1]['close']
            after_price = quotes[columns[maxcol]].iloc[rolldateidx-1]['close'] 
            
            if pd.isna(before_price) or pd.isna(after_price):
                print(flag)
                warnings.warn('nan 값 발생 (type 1)')
                
                #직전일에 nan 값이 있으면 오늘 가격으로 가격차 계산
                before_price = quotes[columns[active]].iloc[rolldateidx]['close']
                after_price = quotes[columns[maxcol]].iloc[rolldateidx]['close']
                    
                if pd.isna(before_price) or pd.isna(after_price):
                    print(flag)
                    raise ValueError('nan 값 발생 (type 2)')

            
            diff = after_price - before_price
            #print(quotes[columns[active]].loc[date]['close'], idx, diff)
            #rolls.append((columns[active], idx, diff, date))
            rolls.append((columns[maxcol], date, diff))
            active = maxcol
    
    #월물별 거래 마지막 날짜 삽입하기
    rollinfo = []
    for i, roll in enumerate(rolls):
        if i + 1 == len(rolls):
            end = ''
            duration = ''
            rollinfo.append((symbol, roll[0], roll[1].strftime('%Y-%m-%d'), end, duration, roll[2] ))
        else:
            endidx = data.index.get_loc(rolls[i+1][1]) - 1
            end = data.index[endidx]
            duration = end-roll[1]
            rollinfo.append((symbol, roll[0], roll[1].strftime('%Y-%m-%d'), end.strftime('%Y-%m-%d'),duration.days, roll[2] ))
    
    return rollinfo

#### 파일로 저장: srf_rollover_bo.csv, srf_rollover_bv.csv 

In [15]:
method = 'bo'
lines = []
for instrument in instruments.values():
    if not instrument.contracts:
        continue
        
    rollinfo = create_continuous_futures(instrument.symbol, method=method)
    lines = lines + rollinfo

if method == 'bo':
    filepath = SRF_ROLLOVER_BO_CSV_PATH
#if method == 'bv':
#    filepath = SRF_ROLLOVER_BV_CSV_PATH

fields = ['symbol', 'active', 'from_date', 'to_date','period', 'price_diff']
with open(filepath, 'w', newline='') as file:
    wr = csv.writer(file)
    wr.writerow(fields)
    wr.writerows(lines)

ValueError: method 'bv' no more support