In [0]:

'''
설명 : 주식 코드 데이터를 받아서, 선형 그래프를 그린 후 img 폴더에 저장
      우측에 있는 종목이 보조축을 사용
매개변수 :raw_df = 상관관계를 보기 위한 데이터, 데이터프레임 형식
        pair_df = 페어 데이터, 데이터프레임 형식
        graph_name = 그래프의 주제 입력, 시각화 이미지가 저장될때 곂쳐지지 않기 위함
                     폴더를 만들때 이 이름 기준으로 만드므로 조심하여 사용할 것
                     ex) "가격_오름차순", "수익률_내림차순"
        is_add_yaxis = 보조축 추가 여부, bool 형식
        scr_col_num = 점수(상관계수 등)가 들어있는 컬럼 위치
        strt.dt/ end.dt = 시작날짜/ 끝날짜, 문자열로 입력('2018-01-01'), 입력 없으면 전체 날짜
        code_name = 주식 코드와 이름 매핑. 전처리 과정에서 만든 dic_code_name 사용
필수사항 : 데이터의 컬럼 1,2번은 주식 코드여야 함
'''

def vis_pair_line_plot(raw_df, pair_df, graph_name, is_add_yaxis = False, scr_col_num = 3, 
                       strt_dt = None, end_dt = None, code_name = dicCodeName) :
    
    ### 입력된 날짜로 데이터 필터링
    # 시작 날짜, 입력이 없으면 데이터의 최초날짜
    if strt_dt is None:
        strt_dt = min(pd.DatetimeIndex(raw_df.index)) 
    else :
        strt_dt = dt.datetime.strptime(strt_dt, '%Y-%m-%d')
        
    strtDt = strt_dt.strftime('%Y%m%d')
        
    # 끝 날짜, 입력이 없으면 데이터의 끝날짜        
    if end_dt is None:
        end_dt = max(pd.DatetimeIndex(raw_df.index))
    else :
        end_dt = dt.datetime.strptime(end_dt, '%Y-%m-%d')

    endDt = end_dt.strftime('%Y%m%d')
    
    # 시작~끝 날짜로 필터링
    vis_data = raw_df[(raw_df.index > strt_dt) & (raw_df.index < end_dt)]
        
    # x축에 들어갈 날짜 정보
    axis_x = list(vis_data.index)
    
    # 이 코드를 실행하는 파일의 위치에 vis_img 폴더가 없으면 생성
    img_dir_path = os.path.abspath(os.path.join(path, './3_Reference/vis_img'))
    
    try:
        os.makedirs(img_dir_path)
    except FileExistsError: # directory already exists
        pass
    
    # 이미지 저장할 폴더가 없으면 생성
    tmp_dir_path = (img_dir_path + "/" + graph_name + "_" + strtDt + "_" + endDt)
    
    try:
        os.makedirs(tmp_dir_path)
    except FileExistsError: # directory already exists
        pass
    
    # 시각화 실행 & 저장
    for i in range(0, len(pair_df.index)) :
        print("전체 " + str(len(pair_df.index)) + "개중 " + str(i) + "번 실행중")
        
        # 시각화에 대한 내용
        contents = ("종류 : " + pair_df.columns[scr_col_num - 1] + ", 순위 : " + str(i) + ", 값 : "
                    + "%.5f" % pair_df[pair_df.columns[scr_col_num - 1]].iloc[i] + ", 기간 : " +
                    strtDt + "~" + endDt)
        
        # 시각화할 주식 코드
        pair_01_code = pair_df[pair_df.columns[0]].iloc[i]
        pair_02_code = pair_df[pair_df.columns[1]].iloc[i]

        # 시각화할 주식 코드 + 이름
        pair_01_name = code_name[pair_01_code]
        pair_02_name = code_name[pair_02_code]

        # 주식 데이터
        pair_01 = vis_data[pair_01_code].values
        pair_02 = vis_data[pair_02_code].values
                
        # 선형 그래프 생성
        line_01 = pch.Line(graph_name, contents)
        line_01.add(pair_01_code + ":" + pair_01_name + "(좌)", axis_x, pair_01,
                    mark_line=["average"], mark_point=["max", "min"]) 
        
        line_02 = pch.Line(graph_name, contents)
        line_02.add(pair_02_code + ":" + pair_02_name + "(우)", axis_x, pair_02,
                    mark_line=["average"], mark_point=["max", "min"]) 
            
        line = pch.Overlap()
        line.add(line_01)
        
        if is_add_yaxis == True :
            line.add(line_02, yaxis_index = 1, is_add_yaxis = True)
        else : 
            line.add(line_02)
        
        line.height = 500
        line.width = 800

        # 이미지가 존재하지 않으면 생성
        img_name = (tmp_dir_path + "/" + '{:04}'.format(i) + "_" + pair_01_code + "_" +
                    pair_02_code)

        if os.path.isfile(img_name + ".png"):
            pass
        else :
            line.render(path = img_name + '.png')
        
    return(line)

In [None]:
''' 설명 나중에 추가..
    1. multi index 가져오기  = adf_2015
    2. join 할 데이터 받아서 붙히기
    3. 시각화 (데이터/날짜/주식쌍/이름, 그외 값)
'''

def adf_pair_line_plot(raw_df, pair_df, graph_gubun, 
                          is_add_yaxis = True, is_log = True, code_name = dicCodeName) :
    
    # pair 쌍 추출 (멀티 인덱스 추출)
    dfIndex = pd.DataFrame(index = pair_df.index)    
    
    # 데이터 로그로 변경
    if is_log == True :
        raw_df = np.log(raw_df)
    
    # 시작 날짜
    strt_dt = min(pd.DatetimeIndex(raw_df.index)) 
    strtDt = strt_dt.strftime('%Y%m%d')

    # 끝 날짜
    end_dt = max(pd.DatetimeIndex(raw_df.index))
    endDt = end_dt.strftime('%Y%m%d')

    # 이 코드를 실행하는 파일의 위치에 vis_img 폴더가 없으면 생성
    img_dir_path = os.path.abspath(os.path.join(path, './9_vis_img'))

    try:
        os.makedirs(img_dir_path)
    except FileExistsError: # directory already exists
        pass

    # 이미지 저장할 폴더가 없으면 생성
    tmp_dir_path = (img_dir_path + "/" + graph_gubun + "_" + strtDt + "_" + endDt)

    try:
        os.makedirs(tmp_dir_path)
    except FileExistsError: # directory already exists
        pass

    # 그래프를 기본설정으로 추출하면 깨져보임. 설정 변경
    pch.configure(global_theme='vintage')
    
    # x축에 들어갈 날짜 정보
    axis_x = list(raw_df.index)
    
    # 시각화 실행 & 저장
    for i in range(0, len(pair_df.index)) : 
        print("전체 " + str(len(pair_df.index)) + "개중 " + str(i) + "번 실행중")

        # 시각화할 주식 코드
        pair_01_code = dfIndex.index[i][0]
        pair_02_code = dfIndex.index[i][1]

        # 시각화할 주식 코드 + 이름
        pair_01_name = code_name[pair_01_code]
        pair_02_name = code_name[pair_02_code]

        # 주식 데이터
        pair_01 = raw_df[pair_01_code].values
        pair_02 = raw_df[pair_02_code].values

        # 시각화에 대한 내용, 나중에 변경
        contents = ("ADF : " + str("%.3f" % pair_df.loc[[pair_01_code, pair_02_code] ,'ADF'][0])
                    + "/ Pv : " + str("%.3f" % pair_df.loc[[pair_01_code, pair_02_code] ,'pValue'][0])
                    + "/ cv_1% : " + str("%.3f" % pair_df.loc[[pair_01_code, pair_02_code] ,'CV_1'][0])
                    + "/ cv_5% : " + str("%.3f" % pair_df.loc[[pair_01_code, pair_02_code] ,'CV_5'][0])
                    + "/ cv_10% : " + str("%.3f" % pair_df.loc[[pair_01_code, pair_02_code] ,'CV_10'][0]))
    
        # 선형 그래프 생성
        line_01 = pch.Line(graph_gubun, contents)
        line_01.add(pair_01_code + ":" + pair_01_name + "(좌)", axis_x, pair_01,
                    mark_line=["average"], mark_point=["max", "min"]) 

        line_02 = pch.Line(graph_gubun, contents)
        line_02.add(pair_02_code + ":" + pair_02_name + "(우)", axis_x, pair_02,
                    mark_line=["average"], mark_point=["max", "min"]) 

        line = pch.Overlap()
        line.add(line_01)

        if is_add_yaxis == True :
            line.add(line_02, yaxis_index = 1, is_add_yaxis = True)
        else : 
            line.add(line_02)

#        line.height = 500
#        line.width = 800

        # 이미지가 존재하지 않으면 생성
        img_name = (tmp_dir_path + "/" + '{:04}'.format(i) + "_" + pair_01_code + "_" +
                    pair_02_code)

        if os.path.isfile(img_name + ".png"):
            pass
        else :
            line.render(path = img_name + '.png')

In [2]:
description = """\
설명 : 주식 코드 데이터를 받아서, 선형 그래프를 그린 후 img 폴더에 저장 \
      우측에 있는 종목이 보조축을 사용 \
매개변수 :raw_df = 상관관계를 보기 위한 데이터, 데이터프레임 형식 \
        pair_df = 페어 데이터, 데이터프레임 형식 \
        graph_name = 그래프의 주제 입력, 시각화 이미지가 저장될때 곂쳐지지 않기 위함 \
                     폴더를 만들때 이 이름 기준으로 만드므로 조심하여 사용할 것 \
                     ex) '가격_오름차순', '수익률_내림차순' \
        is_add_yaxis = 보조축 추가 여부, bool 형식 \
        scr_col_num = 점수(상관계수 등)가 들어있는 컬럼 위치 \
        strt.dt/ end.dt = 시작날짜/ 끝날짜, 문자열로 입력('2018-01-01'), 입력 없으면 전체 날짜 \
        code_name = 주식 코드와 이름 매핑. 전처리 과정에서 만든 dic_code_name 사용 \
필수사항 : 데이터의 컬럼 1,2번은 주식 코드여야 함\
"""

print(description)

설명 : 주식 코드 데이터를 받아서, 선형 그래프를 그린 후 img 폴더에 저장       우측에 있는 종목이 보조축을 사용 매개변수 :raw_df = 상관관계를 보기 위한 데이터, 데이터프레임 형식         pair_df = 페어 데이터, 데이터프레임 형식         graph_name = 그래프의 주제 입력, 시각화 이미지가 저장될때 곂쳐지지 않기 위함                      폴더를 만들때 이 이름 기준으로 만드므로 조심하여 사용할 것                      ex) '가격_오름차순', '수익률_내림차순'         is_add_yaxis = 보조축 추가 여부, bool 형식         scr_col_num = 점수(상관계수 등)가 들어있는 컬럼 위치         strt.dt/ end.dt = 시작날짜/ 끝날짜, 문자열로 입력('2018-01-01'), 입력 없으면 전체 날짜         code_name = 주식 코드와 이름 매핑. 전처리 과정에서 만든 dic_code_name 사용 필수사항 : 데이터의 컬럼 1,2번은 주식 코드여야 함
