In [3]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from operator import itemgetter
from datetime import date, datetime

In [2]:
import plotly.express as px
from plotly.subplots import make_subplots
import plotly.graph_objects as go

## data load

In [3]:
# # minio client 생성
# from minio import Minio

# client = Minio(
#     "192.168.0.20:8801",  # URI
#     access_key="minioadmin",
#     secret_key="minioadmin",
#     secure=False)


In [4]:
# minio_uri = "http://192.168.0.20:8801"
# bucket_name = "stock-dataset"
# fname = "ETF/kodex.csv"
# url = f"{minio_uri}/{bucket_name}/{fname}"

In [5]:
# kodex = pd.read_csv(url)

In [6]:
# kodex

Unnamed: 0.1,Unnamed: 0,open,high,low,close,volume
0,20221011,28600,28605,28330,28580,7404580
1,20221007,28970,29320,28905,29175,10320186
2,20221006,29200,29435,29100,29285,12374324
3,20221005,29465,29465,28850,28965,10693954
4,20221004,28685,29030,28655,28960,4502303
...,...,...,...,...,...,...
4939,20021018,5782,5921,5747,5872,1896784
4940,20021017,5559,5698,5482,5629,3002838
4941,20021016,5601,5601,5510,5552,2927290
4942,20021015,5468,5559,5364,5531,3285629


## data EDA
- 데이터 : kodex200.csv
- 추출일자 : 2002.10.14 ~ 2022.08.25

In [2]:
def data_preprocessing(stock):

    stock.columns = ["date","open","high","low","close","volume","multiple_volume","total_volume"]
    stock = stock.sort_values("date").reset_index(drop=True)

#     #1 datetime
#     def int2date(argdate: int) -> date:
#         year = int(argdate / 10000)
#         month = int((argdate % 10000) / 100)
#         day = int(argdate % 100)
#         return date(year, month, day)

#     datetime_list = [int2date(i) for i in stock.date]
#     stock["datetime"] = datetime_list
    
    datetime_list = [datetime.strptime(i,"%Y-%m-%d").date() for i in stock.date]
    stock["datetime"] = datetime_list
    
    #2 per
    per_list = [0,]
    for i in range(1,len(stock)):
        plus_per = ((stock.close[i]/stock.close[i-1])-1) * 100
        per_list.append(plus_per)
    stock["per"] = per_list

    
    #3 multiple_volume
    stock["multiple_volume"] = stock["close"] * stock["volume"]
    
    return stock

## 변동성-거래량  score

### 변동성 점수
- per을 통한 변동성 점수 계산
- per의 지수가중이동편차

In [8]:
def calcul_volatility(stock):
    
    lam = 0.94
    mu = stock.per[0]
    sigma = 0

    sigma_list = []
    for i in range(len(stock.close)):
        sigma = (lam * (sigma)) + ((1-lam) * (stock.per[i]**2))
        sigma_list.append(sigma)

    sqrt_sigma = np.sqrt(sigma_list)
    log_sigma = np.log(sqrt_sigma)
    
    stock["log_sigma"] = log_sigma
    
    Volatility_list = []
    
    for i in range(len(stock.per)):

        # data setting
        tmp_data = stock[(i-365):i]

        # data condition
        if len(tmp_data) == 365 :

            sigma365 = tmp_data['log_sigma']
            sigma365[sigma365==-np.inf] = np.nan

            mu_setting = np.nanmean(sigma365)
            std_setting = np.nanstd(sigma365)

            set1 = np.max([-4, ((sigma365.values[364] -  mu_setting)/std_setting) ])
            set2 = np.min([set1,4])
            Volatility_list.append(set2)
            
    return Volatility_list
    

### 거래량 점수
- 원화환산 거래량 값을 사용해 거래량 점수를 계산한다
- 단기 거래량과 장기 거래량의 값을 사용한다
- lambda 를 통해서 지수가중이동평균의 가중치를 변경한다
    - 첫 N일의 정보포함률이 63.2%로 수렴하는 수치

In [9]:
def calcul_volume(stock):
    
    lambda_20 = 1-(1/20)
    lambda_60 = 1-(1/60)
    
    volume_sigma20_list = []
    volume_sigma60_list = []

    for i in range(len(stock.multiple_volume)):

        # list set
        list1 = []
        list2 = []

        # sumation
        for j in range(i+1):
            volume_sigma_20 = (1-lambda_20) * (lambda_20**j) * stock.multiple_volume[i-j]
            volume_sigma_60 = (1-lambda_60) * (lambda_60**j) * stock.multiple_volume[i-j]
            list1.append(volume_sigma_20)
            list2.append(volume_sigma_60)

        V20 = np.sum(list1)
        V60 = np.sum(list2)
        volume_sigma20_list.append(V20)
        volume_sigma60_list.append(V60)

    V_20 = np.log(stock.multiple_volume/volume_sigma20_list)
    V_60 = np.log(stock.multiple_volume/volume_sigma60_list)

    Volume_list = []
    for i in range(len(V_20)):
        set1 = np.max([-4, ((V_20[i]+V_60[i])/2)])
        set2 = np.min([set1, 4])
        Volume_list.append(set2)
    
    return Volume_list

### 변동성-거래량 점수

- 위 단계에서 계산한 (1)Voltaility 와 (2)Volume 스코어의 값을 평균내어 변동성 거래량 점수를 계산한다 
- 점수의 스케일은 0~1까지의 스케일이다.

In [10]:
def volatility_volume_score(Volatility_list, Volume_list):
    
    S1_list = []
    
    for i in range(len(Volatility_list)):
        set1 = np.max([-4,float(Volatility_list[i] + Volume_list[365:][i])])
        set2 = np.min([ 4, set1])
        set3 = set2/8 + 0.5
        S1_list.append(set3)
        
    return S1_list


## 모멘텀 score

- kodex 종가의 가중이동평균을 계산한후 실제가와 이동평균값의 이격도를 통해 모멘텀 점수를 계산한다
- 변동성-거래량 점수에 의해 장기이평선 단기이평선 가중을 변경한다 
- 시장의 변동성과 거래량이 높은 (거래량 급등/급락)하는 시장에서 투자자들은 단기간 추세에 민감하게 반응
- 변동성 거래량 점수가 높다면 단기 가중치를 더욱 크게 한다

In [11]:
def momentum_score(S1_list, stock):
    
    short_alpha = [(i*9)+1 for i in S1_list]
    long_alpha = [10 - ((i*9)+1) for i in S1_list]
    
    # lambda
    lambda_30 = 1-(1/30)
    lambda_7 = 1-(1/7)
    
    # close ma
    close_mu30_list = []
    close_mu7_list = []
    for i in range(len(stock.close)):

        # list set
        list1 = []
        list2 = []

        # sumation
        for j in range(i+1):
            close_mu_30 = (1-lambda_30) * (lambda_30**j) * stock.close[i-j]
            close_mu_7 = (1-lambda_7) * (lambda_7**j) * stock.close[i-j]
            list1.append(close_mu_30)
            list2.append(close_mu_7)

        V30 = np.sum(list1)
        V7 = np.sum(list2)
        close_mu30_list.append(V30)
        close_mu7_list.append(V7)
        
    X_short = (stock.close - close_mu7_list) / close_mu7_list
    X_long = (stock.close - close_mu30_list) / close_mu30_list
        
    products_short = [a * b for a, b in zip(short_alpha, X_short[365:])]
    products_long = [a * b for a, b in zip(long_alpha, X_long[365:])]
    product_momentum = [a+b for a,b in zip(products_short, products_long)]
    
    C = 16.387308
    S2_list = [(i*C)/10 for i in product_momentum]
    
    return S2_list

## FG score

- S1_list : 변동성 거래량 점수
    - 스케일 : 0 ~ 1 
    
- S2_list : 모멘텀 점수
    - 스케일 : 실수 범위

- S1_list : FG score
    - 공포탐욕지수
    
- 케이스별 시나리오
    - case1 : 변동성이 큰 상태에서 모멘텀도 크다
        - 탐욕지수가 매우 커진다
    - case2 : 변동성이 작은 상태에서 모멘텀도 크다
        - 탐욕지수가 비교적 상승하고자 한다
        - 지수에 영향이 별로 없다 (0.5에 가깝게 나타난다) 
    - case3 : 변동성이 큰 상태에서 모멘텀이 작다
        - 탐욕지수가 매우 작아진다
    - case4 : 변동성이 작은상태에서 모멘텀이 크다
        - 탐욕지수가 비교적 하락하고자 한다
        - 지수에 영향이 별로 없다 (0.5에 가깝게 나타난다)
        
- 비고
    - 변동성 거래량 점수
        - 0~1이기 때문에 중립에서 양분되어 공포와 탐욕이 커질수록 커지는 값이다 
    - 모멘텀 점수
        - 실수의 범위에서 이격도를 뜻한다

- (1)변동성-거래량 점수와 (2)모멘텀 점수를 곱한다
- 곱한 값을 로지스틱 함수에 대입하여 최종 공포탐욕지수 스코어를 산출한다

In [12]:
def calcul_FGscore(S1_list, S2_list):
    
    S_list = [-(a*b) for a,b in zip(S1_list, S2_list)]
    FG_score = [1/(1+np.exp(i)) for i in S_list]
    
    return FG_score

In [10]:
def FG_index(stock):
    
    print("preprocessing")
    stock = data_preprocessing(stock)
    
    datetime_list = stock['datetime']
    
    print("S1 score")
    Volatility_list = calcul_volatility(stock)
    Volume_list = calcul_volume(stock)
    S1_score = volatility_volume_score(Volatility_list, Volume_list)
    
    print("S2 score")
    S2_score = momentum_score(S1_score, stock)
    
    print("FG score")
    FG_score = calcul_FGscore(S1_score, S2_score)
    
    print("final_data")
    final_data = pd.DataFrame({'date': datetime_list[365:],
                          'close': stock['close'][365:],
                          'volume': stock['volume'][365:],
                          'multiple_volume': stock['multiple_volume'][365:],
                          'per': stock['per'][365:],
                          'Volatility_list': Volatility_list,
                          'Volume_list': Volume_list[365:],
                          'S1_score': S1_score,
                          'S2_score': S2_score,
                          'FG_score': FG_score})

    return final_data
    
    
    

In [18]:
# final_data = FG_index(kodex)

## Plotting

In [19]:
# px.line(final_data, x = 'date', y='FG_score',
#         hover_data={"date": "|%B %d, %Y"})

In [20]:
# fig = make_subplots(specs = [[{'secondary_y':True}]])
# fig.add_trace(
#     go.Scatter(x=final_data.date, y = final_data.FG_score, name = "FG_score"
#                , hovertemplate = 'date = %{x}<br>'+
#                                  'value = %{y}'),
#     secondary_y = False,
# )
# fig.add_trace(
#     go.Scatter(x=final_data.date, y = final_data.close, name = "kodex200"
#                , hovertemplate = 'date = %{x}<br>'+
#                                  'value = %{y}'),
#     secondary_y = True,
# )
# fig.add_trace(
#     go.Scatter(x=final_data.date, y = [0.5]*4550, name = 'middle'),
#     secondary_y = False,
# )

# fig.update_layout(
#     title_text = "FG score", hovermode="x")
# fig.update_xaxes(title_text = "date", rangeslider_visible = True)
# fig.update_yaxes(title_text = "FG_score", secondary_y = False)
# fig.update_yaxes(title_text = "stock_close", secondary_y = True)
# # specific line

# fig.show()