In [2]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
# 한글 폰트 사용을 위해서 세팅
from matplotlib import font_manager, rc
font_path = "C:/Windows/Fonts/malgun.ttf"
font = font_manager.FontProperties(fname=font_path).get_name()
rc('font', family=font)

import warnings 
warnings.filterwarnings('ignore')
import os 
import re
import FinanceDataReader as fdr
import time

In [3]:
from sklearn.neighbors import KNeighborsClassifier
from sklearn.ensemble import RandomForestClassifier
from xgboost import XGBClassifier
from catboost import CatBoostClassifier
from sklearn.metrics import classification_report, f1_score, roc_auc_score ,accuracy_score, precision_score, recall_score, confusion_matrix
import joblib 

rfc = RandomForestClassifier()
xgb = XGBClassifier()
cat = CatBoostClassifier()
models = [rfc,xgb,cat]

# 함수

## corp_code

In [4]:
df_kospi = pd.read_csv('./data/recent_kospi_list.csv',index_col=0)
# 코드 반환
def corp_code(corp_name):
    code = df_kospi[df_kospi['Name']==corp_name]['Symbol'].iloc[0]
    code = str(code).zfill(6)
    return code

## stock_price()

In [5]:
# 주가데이터
def stock_price(code,bgn_date= '2016-01-01',end_date= '2022-03-31'):

    df_p = fdr.DataReader(code,bgn_date,end_date)
    df_p = df_p.reset_index()
    df_p = df_p.rename(columns = {'Date': '날짜'})
    df_p = df_p.set_index('날짜',drop=True)
    
    return df_p

## merge()

In [6]:
# merge
def merge(df_count,df_p):
    df_merge = pd.merge(df_count,df_p['Close'],left_index=True,right_index=True, how='right')
    return df_merge

## mscaler()

In [7]:
from sklearn.preprocessing import MinMaxScaler

def mscaler(df):

    df.index = pd.DatetimeIndex(df.index)
    col_list = df.columns
    scaler = MinMaxScaler()
    df_scaled = df.copy()
    df_scaled[col_list] = scaler.fit_transform(df[col_list])
    
    return df_scaled

## add_target()

In [8]:
def add_target(df_merge,window_size, period_rate):

    earning_lst = []
    for i in range(len(df_merge)-window_size):
        
        earning_rate = (df_merge.iloc[i+window_size,-1]- df_merge.iloc[i,-1])/df_merge.iloc[i,-1]

        if earning_rate >= period_rate:
            earning_lst.append(1)
        else:
            earning_lst.append(0)

    df_model = df_merge.iloc[:-window_size,:]
    df_model['target'] = earning_lst
    
    return df_model

## feature_visualization()

In [10]:
def feature_visualization(save_path,num):
    
    model = joblib.load(save_path)
    # 배열형태로 반환
    ft_importance_values = model.feature_importances_

    # 정렬과 시각화를 쉽게 하기 위해 series 전환
    ft_series = pd.Series(ft_importance_values, index = x_test.columns)
    ft_top20 = ft_series.sort_values(ascending=False)[:num]

    # 시각화
    plt.figure(figsize=(8,6))
    plt.title('Feature Importance Top 20')
    sns.barplot(x=ft_top20, y=ft_top20.index)
    plt.show()
    
    return ft_top20

In [11]:
pd.set_option('display.max.colwidth', 70)

# 결과 정리

## 모든파일 만들기 7일 5%

In [20]:
window_size = 7
period_rate= 0.05

path = './data/데이터_뉴스키워드빈도/'
file_list = os.listdir(path)

corp_list =[]
model_list = []
accu_list = []
precision_list = []
recall_list = []
roc_list = []
model_path = []

for file in file_list[:] :
    corp_name = file[:-4]
    print('회사이름: ',corp_name)
    code = corp_code(corp_name)
    df_p = stock_price(code)
    
    file_path = os.path.join(path,file)
    df_count = pd.read_csv(file_path,index_col=0)
    df_count.index = pd.DatetimeIndex(df_count.index)
    try:
        last_col = df_count.columns[-1]
    except:
        continue
    
    # 5개 미만 단어 아예없는경우는 생략
    try:
        df_count = mscaler(df_count)

        df_merge = merge(df_count,df_p)

        df_model = add_target(df_merge,window_size=window_size, period_rate= period_rate)

        x_train = df_model.loc[:'2021-10-01',:last_col]
        y_train = df_model.loc[:'2021-10-01','target']

        x_test = df_model.loc['2021-10-01':,:last_col]
        y_test = df_model.loc['2021-10-01':,'target']


        for model in models :
            time.sleep(0.3)
            model_name = model.__class__.__name__

            try:

                if model_name == 'CatBoostClassifier':
                    model.fit(x_train,y_train, silent=True)
                else:
                    model.fit(x_train,y_train)

            except:
                continue

            pred = model.predict(x_test)
            accuracy = accuracy_score(y_test, pred)
            proba = model.predict_proba(x_test)[:,1]
            precision = precision_score(y_test, pred)
            recall = recall_score(y_test, pred)

            try:
                roc_auc = roc_auc_score(y_test, proba)
            except:
                roc_auc = 0

            save_path = f'./data/machine_model2_{window_size}일_{period_rate}/{corp_name}_{model_name}.pkl'


            if (precision > 0.5) & (precision!=1) &(recall!=1):

                corp_list.append(corp_name)
                model_list.append(model_name)
                accu_list.append(accuracy)
                precision_list.append(precision)
                recall_list.append(recall)
                roc_list.append(roc_auc)
                model_path.append(save_path)
                joblib.dump(model, save_path)

                print('회사이름: ',corp_name)
                print('모델이름: ',model_name)
                print('accuracy:{0:.4f}, precision:{1:.4f}, recall:{2:.4f}, roc_auc:{3:.4f}'.format(accuracy,precision,recall,roc_auc))
                print(save_path)
                print('-'*50)

    except:
        print('출현 단어 5개 미만 종목')
    
    print('='* 50)
    
df_result = pd.DataFrame({'회사이름':corp_list, '모델이름':model_list,'accuracy':accu_list,
                          'precision':precision_list,'recall':recall_list,'roc_auc':roc_list,'모델주소':model_path})

df_result.to_csv(f'./data/model_result/machine_model2_{window_size}일_{period_rate}.csv')

    

회사이름:  AJ네트웍스
회사이름:  AK홀딩스
회사이름:  BGF
회사이름:  BYC
회사이름:  CJ CGV
회사이름:  CJ
회사이름:  CJ대한통운
회사이름:  CJ제일제당
회사이름:  CS홀딩스
회사이름:  DB
회사이름:  DB하이텍
회사이름:  DI동일
회사이름:  DL
회사이름:  DRB동일
회사이름:  DSR
회사이름:  E1
회사이름:  F&F홀딩스
회사이름:  GS건설
회사이름:  GS글로벌
회사이름:  GS리테일
회사이름:  HDC
회사이름:  HDC랩스
회사이름:  HDC현대EP


회사이름:  HJ중공업
회사이름:  HMM


Custom logger is already specified. Specify more than one logger at same time is not thread safe.

회사이름:  HSD엔진
회사이름:  IHQ
회사이름:  JW중외제약
회사이름:  JW홀딩스
회사이름:  KCTC
회사이름:  KC그린홀딩스
회사이름:  KC코트렐
회사이름:  KEC
회사이름:  KG스틸
회사이름:  KG케미칼
회사이름:  KH 필룩스
회사이름:  KISCO홀딩스
회사이름:  KPX케미칼
회사이름:  KPX홀딩스
회사이름:  KR모터스
회사이름:  KSS해운
회사이름:  KT&G
회사이름:  KT
회사이름:  KTcs
회사이름:  LF
회사이름:  LG
회사이름:  LG디스플레이
회사이름:  LG생활건강


회사이름:  LG유플러스
회사이름:  LG이노텍
회사이름:  LG이노텍
모델이름:  RandomForestClassifier
accuracy:0.5391, precision:0.6667, recall:0.1404, roc_auc:0.6087
./data/machine_model2_7일_0.05/LG이노텍_RandomForestClassifier.pkl
--------------------------------------------------
회사이름:  LG이노텍
모델이름:  XGBClassifier
accuracy:0.5130, precision:0.6667, recall:0.0351, roc_auc:0.5744
./data/machine_model2_7일_0.05/LG이노텍_XGBClassifier.pkl
--------------------------------------------------
회사이름:  LG이노텍
모델이름:  CatBoostClassifier
accuracy:0.5217, precision:0.7500, recall:0.0526, roc_auc:0.5576
./data/machine_model2_7일_0.05/LG이노텍_CatBoostClassifier.pkl
--------------------------------------------------
회사이름:  LG전자
회사이름:  LG화학
회사이름:  LIG넥스원
회사이름:  LS ELECTRIC
회사이름:  LS
회사이름:  LS네트웍스
회사이름:  LX인터내셔널
회사이름:  LX하우시스
회사이름:  MH에탄올
회사이름:  NAVER
회사이름:  NICE
회사이름:  NPC
회사이름:  OCI
회사이름:  POSCO홀딩스
회사이름:  S-Oil
회사이름:  S-Oil
모델이름:  RandomForestClassifier
accuracy:0.8174, precision:0.7500, recall:0.1304, roc_auc:0.5794
./data/machine_model2_7일_0

회사이름:  SG세계물산
회사이름:  SIMPAC
회사이름:  SJM
회사이름:  SJM홀딩스
회사이름:  SK
회사이름:  SKC
회사이름:  SKC
모델이름:  XGBClassifier
accuracy:0.7913, precision:0.5714, recall:0.1600, roc_auc:0.5869
./data/machine_model2_7일_0.05/SKC_XGBClassifier.pkl
--------------------------------------------------
회사이름:  SK가스
회사이름:  SK네트웍스
회사이름:  SK디스커버리
회사이름:  SK디앤디
회사이름:  SK렌터카
회사이름:  SK이노베이션
회사이름:  SK텔레콤
회사이름:  SK하이닉스
회사이름:  SNT모티브
회사이름:  SNT중공업
회사이름:  SNT홀딩스
회사이름:  SPC삼립
회사이름:  STX
회사이름:  STX
모델이름:  RandomForestClassifier
accuracy:0.7739, precision:0.6667, recall:0.0741, roc_auc:0.4364
./data/machine_model2_7일_0.05/STX_RandomForestClassifier.pkl
--------------------------------------------------
회사이름:  STX엔진
회사이름:  STX중공업
회사이름:  SUN&L


회사이름:  TCC스틸
회사이름:  TCC스틸
모델이름:  RandomForestClassifier
accuracy:0.6522, precision:0.6667, recall:0.1395, roc_auc:0.5417
./data/machine_model2_7일_0.05/TCC스틸_RandomForestClassifier.pkl
--------------------------------------------------
회사이름:  TCC스틸
모델이름:  XGBClassifier
accuracy:0.6435, precision:0.6000, recall:0.1395, roc_auc:0.5589
./data/machine_model2_7일_0.05/TCC스틸_XGBClassifier.pkl
--------------------------------------------------
회사이름:  TCC스틸
모델이름:  CatBoostClassifier
accuracy:0.6435, precision:0.6250, recall:0.1163, roc_auc:0.5927
./data/machine_model2_7일_0.05/TCC스틸_CatBoostClassifier.pkl
--------------------------------------------------
회사이름:  TKG휴켐스
회사이름:  TYM
회사이름:  WISCOM
회사이름:  YG PLUS
회사이름:  가온전선
회사이름:  강남제비스코
회사이름:  강원랜드
회사이름:  경농
회사이름:  경동나비엔
회사이름:  경동나비엔
모델이름:  XGBClassifier
accuracy:0.8522, precision:0.6000, recall:0.1667, roc_auc:0.6922
./data/machine_model2_7일_0.05/경동나비엔_XGBClassifier.pkl
--------------------------------------------------
회사이름:  경방
회사이름:  경인양행
회사이름: 

회사이름:  국도화학
회사이름:  국동
회사이름:  국제약품
회사이름:  극동유화
회사이름:  금강공업
회사이름:  금양
회사이름:  금호건설
회사이름:  금호석유
회사이름:  금호에이치티
회사이름:  금호전기
회사이름:  금호타이어
회사이름:  기아
회사이름:  깨끗한나라
회사이름:  남광토건
회사이름:  남성
회사이름:  남양유업
회사이름:  넥센
회사이름:  넥센타이어
회사이름:  노루페인트
회사이름:  노루페인트
모델이름:  XGBClassifier
accuracy:0.6783, precision:0.6667, recall:0.0526, roc_auc:0.5545
./data/machine_model2_7일_0.05/노루페인트_XGBClassifier.pkl
--------------------------------------------------
회사이름:  노루홀딩스
회사이름:  녹십자
회사이름:  녹십자홀딩스


회사이름:  농심
회사이름:  농심홀딩스
회사이름:  다스코
회사이름:  다우기술
회사이름:  다이나믹디자인
회사이름:  대교


Custom logger is already specified. Specify more than one logger at same time is not thread safe.

회사이름:  대동
회사이름:  대림B&Co
회사이름:  대림통상
회사이름:  대상홀딩스
회사이름:  대성산업
회사이름:  대성홀딩스
회사이름:  대우건설
회사이름:  대우조선해양
회사이름:  대웅
회사이름:  대웅제약
회사이름:  대원강업
회사이름:  대원전선
회사이름:  대원제약
회사이름:  대원화성
회사이름:  대유에이텍
회사이름:  대유에이텍
모델이름:  RandomForestClassifier
accuracy:0.8696, precision:0.6667, recall:0.2353, roc_auc:0.5492
./data/machine_model2_7일_0.05/대유에이텍_RandomForestClassifier.pkl
--------------------------------------------------
회사이름:  대유플러스
회사이름:  대창
회사이름:  대창단조
회사이름:  대한방직
회사이름:  대한유화
회사이름:  대한전선
회사이름:  대한제강


회사이름:  대한제당
회사이름:  대한제분
회사이름:  대한항공
회사이름:  대한해운
회사이름:  더블유게임즈
회사이름:  더존비즈온
회사이름:  덕성
회사이름:  덕양산업
회사이름:  도화엔지니어링
회사이름:  동국제강
회사이름:  동방
회사이름:  동방아그로
회사이름:  동부건설
회사이름:  동서
회사이름:  동성케미컬
회사이름:  동아쏘시오홀딩스
회사이름:  동아에스티
회사이름:  동아지질
회사이름:  동양
회사이름:  동양고속
회사이름:  동양철관
회사이름:  동원F&B


회사이름:  동원산업
회사이름:  동원수산
회사이름:  동원시스템즈
회사이름:  동일고무벨트
회사이름:  동일산업
회사이름:  두산
회사이름:  두산에너빌리티
회사이름:  디아이
회사이름:  디아이
모델이름:  RandomForestClassifier
accuracy:0.7217, precision:0.6667, recall:0.0606, roc_auc:0.5218
./data/machine_model2_7일_0.05/디아이_RandomForestClassifier.pkl
--------------------------------------------------


Custom logger is already specified. Specify more than one logger at same time is not thread safe.

회사이름:  디아이씨
회사이름:  디아이씨
모델이름:  RandomForestClassifier
accuracy:0.8174, precision:0.6667, recall:0.0909, roc_auc:0.5694
./data/machine_model2_7일_0.05/디아이씨_RandomForestClassifier.pkl
--------------------------------------------------
회사이름:  디아이씨
모델이름:  XGBClassifier
accuracy:0.8174, precision:0.6667, recall:0.0909, roc_auc:0.5777
./data/machine_model2_7일_0.05/디아이씨_XGBClassifier.pkl
--------------------------------------------------
회사이름:  디아이씨
모델이름:  CatBoostClassifier
accuracy:0.8174, precision:0.6667, recall:0.0909, roc_auc:0.6061
./data/machine_model2_7일_0.05/디아이씨_CatBoostClassifier.pkl
--------------------------------------------------
회사이름:  디와이
회사이름:  디와이파워
회사이름:  디티알오토모티브
회사이름:  락앤락
회사이름:  롯데관광개발
회사이름:  롯데쇼핑
회사이름:  롯데정밀화학
회사이름:  롯데칠성
회사이름:  롯데케미칼
회사이름:  마니커
회사이름:  만도
회사이름:  메타랩스
회사이름:  명문제약
회사이름:  모나미
회사이름:  모토닉
회사이름:  무림P&P
회사이름:  무림페이퍼
회사이름:  무학
회사이름:  미래산업
회사이름:  미래아이앤지


회사이름:  미원상사
회사이름:  바다로19호
회사이름:  백산
회사이름:  범양건영
회사이름:  벽산
회사이름:  보령
회사이름:  보해양조
회사이름:  부광약품
회사이름:  부산산업
회사이름:  비비안
회사이름:  비상교육
회사이름:  비케이탑스
회사이름:  비케이탑스
모델이름:  RandomForestClassifier
accuracy:0.6696, precision:0.5556, recall:0.1282, roc_auc:0.5735
./data/machine_model2_7일_0.05/비케이탑스_RandomForestClassifier.pkl
--------------------------------------------------
회사이름:  비케이탑스
모델이름:  CatBoostClassifier
accuracy:0.6870, precision:0.7143, recall:0.1282, roc_auc:0.6164
./data/machine_model2_7일_0.05/비케이탑스_CatBoostClassifier.pkl
--------------------------------------------------
회사이름:  사조대림
회사이름:  사조동아원
회사이름:  사조산업
회사이름:  삼부토건
회사이름:  삼성SDI
회사이름:  삼성공조
회사이름:  삼성물산
회사이름:  삼성에스디에스
회사이름:  삼성엔지니어링


회사이름:  삼성전기
회사이름:  삼성전자
회사이름:  삼성중공업
회사이름:  삼성출판사
회사이름:  삼양사
회사이름:  삼양식품
회사이름:  삼양통상
회사이름:  삼영무역
회사이름:  삼영전자
회사이름:  삼영화학
회사이름:  삼익악기
회사이름:  삼일제약
회사이름:  삼천리
회사이름:  삼호개발
회사이름:  삼화전기
회사이름:  삼화전자
회사이름:  삼화콘덴서
회사이름:  삼화페인트
회사이름:  상신브레이크
회사이름:  새론오토모티브
회사이름:  샘표
회사이름:  서연


회사이름:  서연이화
회사이름:  서울가스
회사이름:  서원
회사이름:  서흥
회사이름:  선도전기
회사이름:  선진
회사이름:  성문전자
회사이름:  성신양회
회사이름:  성신양회
모델이름:  RandomForestClassifier
accuracy:0.6957, precision:0.7500, recall:0.0811, roc_auc:0.6389
./data/machine_model2_7일_0.05/성신양회_RandomForestClassifier.pkl
--------------------------------------------------
회사이름:  성안
회사이름:  성창기업지주
회사이름:  세방
회사이름:  세방전지
회사이름:  세아베스틸지주
회사이름:  세아제강지주
회사이름:  세아제강지주
모델이름:  XGBClassifier
accuracy:0.7391, precision:0.6000, recall:0.0968, roc_auc:0.6219
./data/machine_model2_7일_0.05/세아제강지주_XGBClassifier.pkl
--------------------------------------------------
회사이름:  세아제강지주
모델이름:  CatBoostClassifier
accuracy:0.7391, precision:0.6667, recall:0.0645, roc_auc:0.6200
./data/machine_model2_7일_0.05/세아제강지주_CatBoostClassifier.pkl
--------------------------------------------------
회사이름:  세아특수강
회사이름:  세아홀딩스
회사이름:  세우글로벌
회사이름:  세원이앤씨
회사이름:  세이브존I&C
회사이름:  세종공업
회사이름:  세진중공업
회사이름:  센트럴인사이트
회사이름:  셀트리온


회사이름:  송원산업
회사이름:  수산중공업
회사이름:  스카이라이프
회사이름:  신대양제지
회사이름:  신도리코
회사이름:  신라교역
회사이름:  신성이엔지
회사이름:  신세계
회사이름:  신세계인터내셔날
회사이름:  신세계푸드
회사이름:  신송홀딩스
회사이름:  신영와코루
회사이름:  신원
회사이름:  신풍제약
회사이름:  신풍제지
회사이름:  신흥
회사이름:  쌍방울
회사이름:  쌍방울
모델이름:  CatBoostClassifier
accuracy:0.8522, precision:0.6667, recall:0.1111, roc_auc:0.5427
./data/machine_model2_7일_0.05/쌍방울_CatBoostClassifier.pkl
--------------------------------------------------
회사이름:  쌍용C&E
회사이름:  쌍용차
회사이름:  써니전자
회사이름:  쎌마테라퓨틱스


회사이름:  씨아이테크
회사이름:  씨에스윈드
회사이름:  씨에스윈드
모델이름:  RandomForestClassifier
accuracy:0.8261, precision:0.5714, recall:0.1905, roc_auc:0.7867
./data/machine_model2_7일_0.05/씨에스윈드_RandomForestClassifier.pkl
--------------------------------------------------
회사이름:  아모레G
회사이름:  아모레퍼시픽
회사이름:  아세아
회사이름:  아세아시멘트
회사이름:  아세아제지
회사이름:  아센디오
회사이름:  아센디오
모델이름:  RandomForestClassifier
accuracy:0.8000, precision:0.6667, recall:0.0833, roc_auc:0.5156
./data/machine_model2_7일_0.05/아센디오_RandomForestClassifier.pkl
--------------------------------------------------
회사이름:  아센디오
모델이름:  CatBoostClassifier
accuracy:0.8000, precision:0.6667, recall:0.0833, roc_auc:0.5343
./data/machine_model2_7일_0.05/아센디오_CatBoostClassifier.pkl
--------------------------------------------------
회사이름:  아시아나항공
회사이름:  아이마켓코리아
회사이름:  아이에스동서
회사이름:  알루코
회사이름:  애경케미칼
회사이름:  에넥스
회사이름:  에넥스
모델이름:  RandomForestClassifier
accuracy:0.6957, precision:0.5556, recall:0.1389, roc_auc:0.5185
./data/machine_model2_7일_0.05/에넥스_RandomForestClassifier.pkl

회사이름:  엔씨소프트
회사이름:  엔케이
회사이름:  엘브이엠씨홀딩스
회사이름:  엠씨넥스
회사이름:  엠씨넥스
모델이름:  XGBClassifier
accuracy:0.6870, precision:0.5714, recall:0.1081, roc_auc:0.5703
./data/machine_model2_7일_0.05/엠씨넥스_XGBClassifier.pkl
--------------------------------------------------
회사이름:  영보화학
회사이름:  영원무역
회사이름:  영원무역홀딩스
회사이름:  영풍
회사이름:  영흥
회사이름:  예스코홀딩스
회사이름:  오뚜기
회사이름:  오리온홀딩스
회사이름:  와이투솔루션
회사이름:  우성
회사이름:  우신시스템
회사이름:  우진
회사이름:  우진플라임
회사이름:  웅진
회사이름:  웅진씽크빅
회사이름:  원림
회사이름:  웰바이오텍
회사이름:  유니드


회사이름:  유니온
회사이름:  유니온머티리얼
회사이름:  유니켐
회사이름:  유니퀘스트
회사이름:  유성기업
회사이름:  유수홀딩스
회사이름:  유엔젤
회사이름:  유한양행
회사이름:  이건산업
회사이름:  이노션
회사이름:  이마트
회사이름:  이수페타시스
회사이름:  이수페타시스
모델이름:  RandomForestClassifier
accuracy:0.5565, precision:0.5714, recall:0.0769, roc_auc:0.5095
./data/machine_model2_7일_0.05/이수페타시스_RandomForestClassifier.pkl
--------------------------------------------------
회사이름:  이수화학
회사이름:  이엔플러스
회사이름:  이연제약
회사이름:  인디에프
회사이름:  인스코비
회사이름:  인지컨트롤스
회사이름:  인터지스
회사이름:  인팩
회사이름:  일동홀딩스
회사이름:  일성건설


회사이름:  일신방직
회사이름:  일양약품
회사이름:  일정실업
회사이름:  일진다이아
회사이름:  일진머티리얼즈
회사이름:  일진전기
회사이름:  잇츠한불
회사이름:  자화전자
회사이름:  전방
회사이름:  제이에스코퍼레이션
회사이름:  제이준코스메틱
회사이름:  제일기획
회사이름:  제일연마
회사이름:  제일파마홀딩스
회사이름:  제주항공
회사이름:  조광페인트
회사이름:  조선내화
회사이름:  종근당
회사이름:  종근당홀딩스
회사이름:  주연테크
회사이름:  지엠비코리아
회사이름:  지투알


회사이름:  진도
회사이름:  진양산업
회사이름:  진양홀딩스
회사이름:  진원생명과학
회사이름:  참엔지니어링
회사이름:  카카오
회사이름:  컨버즈
회사이름:  케이비아이동국실업
회사이름:  케이씨
회사이름:  코리아써키트
회사이름:  코리아써키트
모델이름:  XGBClassifier
accuracy:0.5652, precision:0.7500, recall:0.0577, roc_auc:0.5769
./data/machine_model2_7일_0.05/코리아써키트_XGBClassifier.pkl
--------------------------------------------------
회사이름:  코스맥스
회사이름:  코스맥스비티아이
회사이름:  코아스
회사이름:  코오롱
회사이름:  코오롱인더
회사이름:  코오롱플라스틱
회사이름:  코웨이
회사이름:  콘텐트리중앙
회사이름:  콤텍시스템
회사이름:  쿠쿠홀딩스
회사이름:  크라운해태홀딩스
회사이름:  태경비케이
회사이름:  태경산업


회사이름:  태경케미컬
회사이름:  태광산업
회사이름:  태림포장
회사이름:  태양금속
회사이름:  태영건설
회사이름:  태평양물산
회사이름:  텔코웨어
회사이름:  토니모리
회사이름:  티에이치엔
회사이름:  티웨이홀딩스
회사이름:  팜스코
회사이름:  팜젠사이언스
회사이름:  팬오션
회사이름:  페이퍼코리아
회사이름:  평화산업
회사이름:  평화홀딩스
회사이름:  포스코스틸리온
회사이름:  포스코인터내셔널


Custom logger is already specified. Specify more than one logger at same time is not thread safe.

회사이름:  포스코케미칼
회사이름:  풀무원
회사이름:  풍산홀딩스
회사이름:  플레이그램
회사이름:  하나투어
회사이름:  하이스틸
회사이름:  하이스틸
모델이름:  RandomForestClassifier
accuracy:0.6783, precision:0.6667, recall:0.0526, roc_auc:0.4655
./data/machine_model2_7일_0.05/하이스틸_RandomForestClassifier.pkl
--------------------------------------------------
회사이름:  하이트진로
회사이름:  한국가스공사
회사이름:  한국공항
회사이름:  한국단자
회사이름:  한국석유
회사이름:  한국수출포장
회사이름:  한국앤컴퍼니
회사이름:  한국전력
회사이름:  한국전자홀딩스
회사이름:  한국조선해양
회사이름:  한국카본
회사이름:  한국콜마홀딩스
회사이름:  한국타이어앤테크놀로지
회사이름:  한국프랜지
회사이름:  한국항공우주
회사이름:  한국화장품
회사이름:  한독


회사이름:  한라홀딩스
회사이름:  한미글로벌
회사이름:  한미글로벌
모델이름:  RandomForestClassifier
accuracy:0.7217, precision:0.7500, recall:0.0882, roc_auc:0.4969
./data/machine_model2_7일_0.05/한미글로벌_RandomForestClassifier.pkl
--------------------------------------------------
회사이름:  한미반도체
회사이름:  한미반도체
모델이름:  XGBClassifier
accuracy:0.7652, precision:0.6000, recall:0.1071, roc_auc:0.5023
./data/machine_model2_7일_0.05/한미반도체_XGBClassifier.pkl
--------------------------------------------------
회사이름:  한미사이언스
회사이름:  한미약품
회사이름:  한섬
회사이름:  한세실업
회사이름:  한세엠케이
회사이름:  한세예스24홀딩스
회사이름:  한솔로지스틱스
회사이름:  한솔제지
회사이름:  한솔케미칼
회사이름:  한솔테크닉스
회사이름:  한솔홀딩스
회사이름:  한솔홈데코
회사이름:  한신공영
회사이름:  한신기계
회사이름:  한온시스템
회사이름:  한올바이오파마
회사이름:  한익스프레스
회사이름:  한일철강


회사이름:  한일홀딩스
회사이름:  한전KPS
회사이름:  한전산업
회사이름:  한진
회사이름:  한진중공업홀딩스
회사이름:  한진칼
회사이름:  한화
회사이름:  한화솔루션
회사이름:  한화에어로스페이스
회사이름:  한화에어로스페이스
모델이름:  CatBoostClassifier
accuracy:0.7478, precision:0.6000, recall:0.1000, roc_auc:0.5888
./data/machine_model2_7일_0.05/한화에어로스페이스_CatBoostClassifier.pkl
--------------------------------------------------
회사이름:  해태제과식품
회사이름:  현대건설
회사이름:  현대그린푸드
회사이름:  현대글로비스
회사이름:  현대두산인프라코어
회사이름:  현대로템
회사이름:  현대리바트
회사이름:  현대모비스
회사이름:  현대미포조선
회사이름:  현대미포조선
모델이름:  CatBoostClassifier
accuracy:0.7652, precision:0.8000, recall:0.1333, roc_auc:0.5508
./data/machine_model2_7일_0.05/현대미포조선_CatBoostClassifier.pkl
--------------------------------------------------
회사이름:  현대백화점
회사이름:  현대비앤지스틸
회사이름:  현대엘리베이


회사이름:  현대위아
회사이름:  현대제철
회사이름:  현대차
회사이름:  현대코퍼레이션
회사이름:  현대코퍼레이션홀딩스
회사이름:  현대퓨처넷
회사이름:  현대홈쇼핑
회사이름:  혜인
회사이름:  호텔신라
회사이름:  화승인더
회사이름:  화승코퍼레이션
회사이름:  화신
회사이름:  화천기공
회사이름:  황금에스티
회사이름:  효성
회사이름:  효성ITX
회사이름:  후성
회사이름:  휠라홀딩스
회사이름:  휴스틸
회사이름:  흥아해운


In [21]:
df_result

Unnamed: 0,회사이름,모델이름,accuracy,precision,recall,roc_auc,모델주소
0,LG이노텍,RandomForestClassifier,0.53913,0.666667,0.140351,0.608742,./data/machine_model2_7일_0.05/LG이노텍_RandomForestClassifier.pkl
1,LG이노텍,XGBClassifier,0.513043,0.666667,0.035088,0.57441,./data/machine_model2_7일_0.05/LG이노텍_XGBClassifier.pkl
2,LG이노텍,CatBoostClassifier,0.521739,0.75,0.052632,0.557623,./data/machine_model2_7일_0.05/LG이노텍_CatBoostClassifier.pkl
3,S-Oil,RandomForestClassifier,0.817391,0.75,0.130435,0.579395,./data/machine_model2_7일_0.05/S-Oil_RandomForestClassifier.pkl
4,S-Oil,CatBoostClassifier,0.808696,0.6,0.130435,0.512287,./data/machine_model2_7일_0.05/S-Oil_CatBoostClassifier.pkl
5,SKC,XGBClassifier,0.791304,0.571429,0.16,0.586889,./data/machine_model2_7일_0.05/SKC_XGBClassifier.pkl
6,STX,RandomForestClassifier,0.773913,0.666667,0.074074,0.436448,./data/machine_model2_7일_0.05/STX_RandomForestClassifier.pkl
7,TCC스틸,RandomForestClassifier,0.652174,0.666667,0.139535,0.541667,./data/machine_model2_7일_0.05/TCC스틸_RandomForestClassifier.pkl
8,TCC스틸,XGBClassifier,0.643478,0.6,0.139535,0.558947,./data/machine_model2_7일_0.05/TCC스틸_XGBClassifier.pkl
9,TCC스틸,CatBoostClassifier,0.643478,0.625,0.116279,0.5927,./data/machine_model2_7일_0.05/TCC스틸_CatBoostClassifier.pkl


In [22]:
x_train

Unnamed: 0_level_0,케미컬탱커,영업익,법정관리,반사이익,가능성,장학금,국내,유지,하락세,지분,...,팬오션,대한해운,하락,현대상선,와이엔텍,통합,해운,해운사,상승률,상승
날짜,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
2016-01-04,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.000000,0.0,0.0,...,0.0,0.0,0.0,0.0,0.0,0.0,0.052632,0.0,0.0,0.000000
2016-01-05,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.000000,0.0,0.0,...,0.0,0.0,0.0,0.0,0.0,0.0,0.000000,0.0,0.0,0.000000
2016-01-06,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.000000,0.0,0.0,...,0.0,0.0,0.0,0.0,0.0,0.0,0.000000,0.0,0.0,0.000000
2016-01-07,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.000000,0.0,0.0,...,0.0,0.0,0.0,0.0,0.0,0.0,0.000000,0.0,0.0,0.000000
2016-01-08,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.000000,0.0,0.0,...,0.0,0.0,0.0,0.0,0.0,0.0,0.000000,0.0,0.0,0.000000
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
2021-09-27,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.333333,0.0,0.0,...,0.0,0.0,0.0,0.0,0.0,0.0,0.210526,0.0,0.0,0.222222
2021-09-28,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.000000,0.0,0.0,...,0.0,0.0,0.0,0.0,0.0,0.0,0.263158,0.0,0.0,0.000000
2021-09-29,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.000000,0.0,0.0,...,0.0,0.0,0.0,0.0,0.0,0.0,0.052632,0.0,0.0,0.000000
2021-09-30,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.000000,0.0,0.0,...,0.0,0.0,0.0,0.0,0.0,0.0,0.000000,0.0,0.0,0.000000


In [23]:
# 모델 검증하기
# 한진칼,  
corp_name = '대웅'
model_path = './data/machine_model2_30일_0.1/대웅_CatBoostClassifier.pkl'
window_size = 30
period_rate= 0.1

code = corp_code(corp_name)
df_p = stock_price(code)

path = './data/데이터_뉴스키워드빈도/'
file_path = os.path.join(path,corp_name+'.csv')
df_count = pd.read_csv(file_path,index_col=0)
df_count.index = pd.DatetimeIndex(df_count.index)

df_merge = merge(df_count,df_p)
df_model = add_target(df_merge,window_size=window_size, period_rate= period_rate)

x_train = df_model.loc[:'2021-10-01',:'Close']
y_train = df_model.loc[:'2021-10-01','target']

x_test = df_model.loc['2021-10-01':,:'Close']
y_test = df_model.loc['2021-10-01':,'target']


# featurn importance
model = joblib.load(model_path)
pred = model.predict(x_test)

print(classification_report(y_test,pred))


              precision    recall  f1-score   support

           0       0.92      0.93      0.93        74
           1       0.71      0.67      0.69        18

    accuracy                           0.88        92
   macro avg       0.81      0.80      0.81        92
weighted avg       0.88      0.88      0.88        92



## 모든파일 만들기 7일 10%

In [23]:
window_size = 7
period_rate= 0.1

path = './data/데이터_뉴스키워드빈도/'
file_list = os.listdir(path)

corp_list =[]
model_list = []
accu_list = []
precision_list = []
recall_list = []
roc_list = []
model_path = []

for file in file_list[:] :
    corp_name = file[:-4]
    print('회사이름: ',corp_name)
    code = corp_code(corp_name)
    df_p = stock_price(code)
    
    file_path = os.path.join(path,file)
    df_count = pd.read_csv(file_path,index_col=0)
    df_count.index = pd.DatetimeIndex(df_count.index)
    try:
        last_col = df_count.columns[-1]
    except:
        continue
    
    # 5개 미만 단어 아예없는경우는 생략
    try:
        df_count = mscaler(df_count)

        df_merge = merge(df_count,df_p)

        df_model = add_target(df_merge,window_size=window_size, period_rate= period_rate)

        x_train = df_model.loc[:'2021-10-01',:last_col]
        y_train = df_model.loc[:'2021-10-01','target']

        x_test = df_model.loc['2021-10-01':,:last_col]
        y_test = df_model.loc['2021-10-01':,'target']


        for model in models :
            time.sleep(0.3)
            model_name = model.__class__.__name__

            try:

                if model_name == 'CatBoostClassifier':
                    model.fit(x_train,y_train, silent=True)
                else:
                    model.fit(x_train,y_train)

            except:
                continue

            pred = model.predict(x_test)
            accuracy = accuracy_score(y_test, pred)
            proba = model.predict_proba(x_test)[:,1]
            precision = precision_score(y_test, pred)
            recall = recall_score(y_test, pred)

            try:
                roc_auc = roc_auc_score(y_test, proba)
            except:
                roc_auc = 0

            save_path = f'./data/machine_model2_{window_size}일_{period_rate}/{corp_name}_{model_name}.pkl'


            if (precision > 0.5) & (precision!=1) &(recall!=1):

                corp_list.append(corp_name)
                model_list.append(model_name)
                accu_list.append(accuracy)
                precision_list.append(precision)
                recall_list.append(recall)
                roc_list.append(roc_auc)
                model_path.append(save_path)
                joblib.dump(model, save_path)

                print('회사이름: ',corp_name)
                print('모델이름: ',model_name)
                print('accuracy:{0:.4f}, precision:{1:.4f}, recall:{2:.4f}, roc_auc:{3:.4f}'.format(accuracy,precision,recall,roc_auc))
                print(save_path)
                print('-'*50)

    except:
        print('출현 단어 5개 미만 종목')
    
    print('='* 50)
    
df_result = pd.DataFrame({'회사이름':corp_list, '모델이름':model_list,'accuracy':accu_list,
                          'precision':precision_list,'recall':recall_list,'roc_auc':roc_list,'모델주소':model_path})

df_result.to_csv(f'./data/model_result/machine_model2_{window_size}일_{period_rate}.csv')

    

회사이름:  AJ네트웍스
회사이름:  AK홀딩스
회사이름:  BGF
회사이름:  BYC
회사이름:  CJ CGV
회사이름:  CJ
회사이름:  CJ대한통운
회사이름:  CJ제일제당
회사이름:  CS홀딩스
회사이름:  DB
회사이름:  DB하이텍
회사이름:  DI동일
회사이름:  DL
회사이름:  DRB동일
회사이름:  DSR
회사이름:  E1
회사이름:  F&F홀딩스
회사이름:  GS건설
회사이름:  GS글로벌
회사이름:  GS리테일
회사이름:  HDC
회사이름:  HDC랩스
회사이름:  HDC현대EP


회사이름:  HJ중공업
회사이름:  HMM


Custom logger is already specified. Specify more than one logger at same time is not thread safe.

회사이름:  HSD엔진
회사이름:  IHQ
회사이름:  JW중외제약
회사이름:  JW홀딩스
회사이름:  KCTC
회사이름:  KC그린홀딩스
회사이름:  KC코트렐
회사이름:  KEC
회사이름:  KG스틸
회사이름:  KG케미칼
회사이름:  KH 필룩스
회사이름:  KISCO홀딩스
회사이름:  KPX케미칼
회사이름:  KPX홀딩스
회사이름:  KR모터스
회사이름:  KSS해운
회사이름:  KT&G
회사이름:  KT
회사이름:  KTcs
회사이름:  LF
회사이름:  LG
회사이름:  LG디스플레이
회사이름:  LG생활건강


회사이름:  LG유플러스
회사이름:  LG이노텍
회사이름:  LG전자
회사이름:  LG화학
회사이름:  LIG넥스원
회사이름:  LS ELECTRIC
회사이름:  LS
회사이름:  LS네트웍스
회사이름:  LX인터내셔널
회사이름:  LX하우시스
회사이름:  MH에탄올
회사이름:  NAVER
회사이름:  NICE
회사이름:  NPC
회사이름:  OCI
회사이름:  POSCO홀딩스
회사이름:  S-Oil
회사이름:  SBS
회사이름:  SGC에너지
회사이름:  SG글로벌
회사이름:  SG세계물산
회사이름:  SIMPAC
회사이름:  SJM


회사이름:  SJM홀딩스
회사이름:  SK
회사이름:  SKC
회사이름:  SK가스
회사이름:  SK네트웍스
회사이름:  SK디스커버리
회사이름:  SK디앤디
회사이름:  SK렌터카
회사이름:  SK이노베이션
회사이름:  SK텔레콤
회사이름:  SK하이닉스
회사이름:  SNT모티브
회사이름:  SNT중공업
회사이름:  SNT홀딩스
회사이름:  SPC삼립
회사이름:  STX
회사이름:  STX엔진
회사이름:  STX중공업
회사이름:  SUN&L
회사이름:  TCC스틸
회사이름:  TKG휴켐스
회사이름:  TYM
회사이름:  WISCOM
회사이름:  YG PLUS


회사이름:  가온전선
회사이름:  강남제비스코
회사이름:  강원랜드
회사이름:  경농
회사이름:  경동나비엔
회사이름:  경방
회사이름:  경인양행
회사이름:  경인전자
회사이름:  계룡건설
회사이름:  계양전기
회사이름:  고려산업
회사이름:  고려아연
회사이름:  고려제강
회사이름:  광동제약
회사이름:  광명전기
회사이름:  광전자
회사이름:  국도화학
회사이름:  국동
회사이름:  국제약품
회사이름:  극동유화
회사이름:  금강공업
회사이름:  금양


회사이름:  금호건설
회사이름:  금호석유
회사이름:  금호에이치티
회사이름:  금호전기
회사이름:  금호타이어
회사이름:  기아
회사이름:  깨끗한나라
회사이름:  남광토건
회사이름:  남성
회사이름:  남양유업
회사이름:  넥센
회사이름:  넥센타이어
회사이름:  노루페인트
회사이름:  노루홀딩스
회사이름:  녹십자
회사이름:  녹십자홀딩스
회사이름:  농심
회사이름:  농심홀딩스
회사이름:  다스코
회사이름:  다우기술
회사이름:  다이나믹디자인
회사이름:  대교


Custom logger is already specified. Specify more than one logger at same time is not thread safe.

회사이름:  대동
회사이름:  대림B&Co
회사이름:  대림통상
회사이름:  대상홀딩스
회사이름:  대성산업
회사이름:  대성홀딩스
회사이름:  대우건설
회사이름:  대우조선해양
회사이름:  대웅
회사이름:  대웅제약
회사이름:  대원강업
회사이름:  대원전선
회사이름:  대원제약
회사이름:  대원화성
회사이름:  대유에이텍
회사이름:  대유에이텍
모델이름:  CatBoostClassifier
accuracy:0.9652, precision:0.6667, recall:0.4000, roc_auc:0.5082
./data/machine_model2_7일_0.1/대유에이텍_CatBoostClassifier.pkl
--------------------------------------------------
회사이름:  대유플러스
회사이름:  대창
회사이름:  대창단조
회사이름:  대한방직
회사이름:  대한유화
회사이름:  대한전선
회사이름:  대한제강


회사이름:  대한제당
회사이름:  대한제분
회사이름:  대한항공
회사이름:  대한해운
회사이름:  더블유게임즈
회사이름:  더존비즈온
회사이름:  덕성
회사이름:  덕양산업
회사이름:  도화엔지니어링
회사이름:  동국제강
회사이름:  동방
회사이름:  동방아그로
회사이름:  동부건설
회사이름:  동서
회사이름:  동성케미컬
회사이름:  동아쏘시오홀딩스
회사이름:  동아에스티
회사이름:  동아지질
회사이름:  동양
회사이름:  동양
모델이름:  RandomForestClassifier
accuracy:0.9478, precision:0.6667, recall:0.2857, roc_auc:0.5642
./data/machine_model2_7일_0.1/동양_RandomForestClassifier.pkl
--------------------------------------------------
회사이름:  동양고속
회사이름:  동양철관
회사이름:  동원F&B


회사이름:  동원산업
회사이름:  동원수산
회사이름:  동원시스템즈
회사이름:  동일고무벨트
회사이름:  동일산업
회사이름:  두산
회사이름:  두산에너빌리티
회사이름:  디아이


Custom logger is already specified. Specify more than one logger at same time is not thread safe.

회사이름:  디아이씨
회사이름:  디와이
회사이름:  디와이파워
회사이름:  디티알오토모티브
회사이름:  락앤락
회사이름:  롯데관광개발
회사이름:  롯데쇼핑
회사이름:  롯데정밀화학
회사이름:  롯데칠성
회사이름:  롯데케미칼
회사이름:  마니커
회사이름:  만도
회사이름:  메타랩스
회사이름:  명문제약
회사이름:  모나미
회사이름:  모토닉
회사이름:  무림P&P
회사이름:  무림페이퍼
회사이름:  무학
회사이름:  미래산업
회사이름:  미래아이앤지
회사이름:  미원상사


회사이름:  바다로19호
회사이름:  백산
회사이름:  범양건영
회사이름:  벽산
회사이름:  보령
회사이름:  보해양조
회사이름:  부광약품
회사이름:  부산산업
회사이름:  비비안
회사이름:  비상교육
회사이름:  비케이탑스
회사이름:  사조대림
회사이름:  사조동아원
회사이름:  사조산업
회사이름:  삼부토건
회사이름:  삼성SDI
회사이름:  삼성공조
회사이름:  삼성물산
회사이름:  삼성에스디에스
회사이름:  삼성엔지니어링
회사이름:  삼성전기
회사이름:  삼성전자


회사이름:  삼성중공업
회사이름:  삼성출판사
회사이름:  삼양사
회사이름:  삼양식품
회사이름:  삼양통상
회사이름:  삼영무역
회사이름:  삼영전자
회사이름:  삼영화학
회사이름:  삼익악기
회사이름:  삼일제약
회사이름:  삼천리
회사이름:  삼호개발
회사이름:  삼화전기
회사이름:  삼화전자
회사이름:  삼화콘덴서
회사이름:  삼화페인트
회사이름:  상신브레이크
회사이름:  새론오토모티브
회사이름:  샘표
회사이름:  서연
회사이름:  서연이화
회사이름:  서울가스


회사이름:  서원
회사이름:  서흥
회사이름:  선도전기
회사이름:  선진
회사이름:  성문전자
회사이름:  성신양회
회사이름:  성안
회사이름:  성창기업지주
회사이름:  세방
회사이름:  세방전지
회사이름:  세아베스틸지주
회사이름:  세아제강지주
회사이름:  세아특수강
회사이름:  세아홀딩스
회사이름:  세우글로벌
회사이름:  세원이앤씨
회사이름:  세이브존I&C
회사이름:  세종공업
회사이름:  세진중공업
회사이름:  센트럴인사이트
회사이름:  셀트리온
회사이름:  송원산업
회사이름:  수산중공업
회사이름:  스카이라이프


회사이름:  신대양제지
회사이름:  신도리코
회사이름:  신라교역
회사이름:  신성이엔지
회사이름:  신세계
회사이름:  신세계인터내셔날
회사이름:  신세계푸드
회사이름:  신송홀딩스
회사이름:  신영와코루
회사이름:  신원
회사이름:  신풍제약
회사이름:  신풍제지
회사이름:  신흥
회사이름:  쌍방울
회사이름:  쌍용C&E
회사이름:  쌍용차
회사이름:  써니전자
회사이름:  쎌마테라퓨틱스
회사이름:  씨아이테크
회사이름:  씨에스윈드
회사이름:  아모레G
회사이름:  아모레퍼시픽


회사이름:  아세아
회사이름:  아세아시멘트
회사이름:  아세아제지
회사이름:  아센디오
회사이름:  아시아나항공
회사이름:  아이마켓코리아
회사이름:  아이에스동서
회사이름:  알루코
회사이름:  애경케미칼
회사이름:  에넥스
회사이름:  에스엘
회사이름:  에스원
회사이름:  에이블씨엔씨
회사이름:  에이엔피
회사이름:  에이프로젠 MED
회사이름:  에이프로젠제약
회사이름:  엔씨소프트
회사이름:  엔케이
회사이름:  엘브이엠씨홀딩스
회사이름:  엠씨넥스
회사이름:  영보화학
회사이름:  영원무역


회사이름:  영원무역홀딩스
회사이름:  영풍
회사이름:  영흥
회사이름:  예스코홀딩스
회사이름:  오뚜기
회사이름:  오리온홀딩스
회사이름:  와이투솔루션
회사이름:  우성
회사이름:  우신시스템
회사이름:  우진
회사이름:  우진플라임
회사이름:  웅진
회사이름:  웅진씽크빅
회사이름:  원림
회사이름:  웰바이오텍
회사이름:  유니드
회사이름:  유니온
회사이름:  유니온머티리얼
회사이름:  유니켐
회사이름:  유니퀘스트
회사이름:  유성기업
회사이름:  유수홀딩스
회사이름:  유엔젤


회사이름:  유한양행
회사이름:  이건산업
회사이름:  이노션
회사이름:  이마트
회사이름:  이수페타시스
회사이름:  이수화학
회사이름:  이엔플러스
회사이름:  이연제약
회사이름:  인디에프
회사이름:  인스코비
회사이름:  인지컨트롤스
회사이름:  인터지스
회사이름:  인팩
회사이름:  일동홀딩스
회사이름:  일성건설
회사이름:  일신방직
회사이름:  일양약품
회사이름:  일정실업
회사이름:  일진다이아
회사이름:  일진머티리얼즈
회사이름:  일진머티리얼즈
모델이름:  CatBoostClassifier
accuracy:0.9130, precision:0.6667, recall:0.1818, roc_auc:0.5970
./data/machine_model2_7일_0.1/일진머티리얼즈_CatBoostClassifier.pkl
--------------------------------------------------
회사이름:  일진전기
회사이름:  잇츠한불


회사이름:  자화전자
회사이름:  전방
회사이름:  제이에스코퍼레이션
회사이름:  제이준코스메틱
회사이름:  제일기획
회사이름:  제일연마
회사이름:  제일파마홀딩스
회사이름:  제주항공
회사이름:  조광페인트
회사이름:  조선내화
회사이름:  종근당
회사이름:  종근당홀딩스
회사이름:  주연테크
회사이름:  지엠비코리아
회사이름:  지투알
회사이름:  진도
회사이름:  진양산업
회사이름:  진양홀딩스
회사이름:  진원생명과학
회사이름:  진원생명과학
모델이름:  RandomForestClassifier
accuracy:0.8435, precision:0.6000, recall:0.1579, roc_auc:0.5932
./data/machine_model2_7일_0.1/진원생명과학_RandomForestClassifier.pkl
--------------------------------------------------
회사이름:  참엔지니어링
회사이름:  카카오
회사이름:  컨버즈


회사이름:  케이비아이동국실업
회사이름:  케이씨
회사이름:  코리아써키트
회사이름:  코스맥스
회사이름:  코스맥스비티아이
회사이름:  코아스
회사이름:  코오롱
회사이름:  코오롱인더
회사이름:  코오롱플라스틱
회사이름:  코웨이
회사이름:  콘텐트리중앙
회사이름:  콤텍시스템
회사이름:  쿠쿠홀딩스
회사이름:  크라운해태홀딩스
회사이름:  태경비케이
회사이름:  태경산업
회사이름:  태경케미컬
회사이름:  태광산업
회사이름:  태림포장
회사이름:  태양금속
회사이름:  태영건설
회사이름:  태평양물산
회사이름:  텔코웨어


회사이름:  토니모리
회사이름:  티에이치엔
회사이름:  티웨이홀딩스
회사이름:  팜스코
회사이름:  팜젠사이언스
회사이름:  팬오션
회사이름:  페이퍼코리아
회사이름:  평화산업
회사이름:  평화홀딩스
회사이름:  포스코스틸리온
회사이름:  포스코인터내셔널


Custom logger is already specified. Specify more than one logger at same time is not thread safe.

회사이름:  포스코케미칼
회사이름:  풀무원
회사이름:  풍산홀딩스
회사이름:  플레이그램
회사이름:  하나투어
회사이름:  하이스틸
회사이름:  하이트진로
회사이름:  한국가스공사
회사이름:  한국공항
회사이름:  한국단자
회사이름:  한국석유
회사이름:  한국수출포장
회사이름:  한국앤컴퍼니
회사이름:  한국전력
회사이름:  한국전자홀딩스
회사이름:  한국조선해양
회사이름:  한국카본
회사이름:  한국콜마홀딩스
회사이름:  한국타이어앤테크놀로지
회사이름:  한국프랜지
회사이름:  한국항공우주
회사이름:  한국화장품
회사이름:  한독


회사이름:  한라홀딩스
회사이름:  한미글로벌
회사이름:  한미반도체
회사이름:  한미사이언스
회사이름:  한미약품
회사이름:  한섬
회사이름:  한세실업
회사이름:  한세엠케이
회사이름:  한세예스24홀딩스
회사이름:  한솔로지스틱스
회사이름:  한솔제지
회사이름:  한솔케미칼
회사이름:  한솔테크닉스
회사이름:  한솔홀딩스
회사이름:  한솔홈데코
회사이름:  한신공영
회사이름:  한신기계
회사이름:  한온시스템
회사이름:  한올바이오파마
회사이름:  한익스프레스
회사이름:  한일철강
회사이름:  한일홀딩스


회사이름:  한전KPS
회사이름:  한전산업
회사이름:  한진
회사이름:  한진중공업홀딩스
회사이름:  한진칼
회사이름:  한화
회사이름:  한화솔루션
회사이름:  한화에어로스페이스
회사이름:  해태제과식품
회사이름:  현대건설
회사이름:  현대그린푸드
회사이름:  현대글로비스
회사이름:  현대두산인프라코어
회사이름:  현대로템
회사이름:  현대리바트
회사이름:  현대모비스
회사이름:  현대미포조선
회사이름:  현대백화점
회사이름:  현대비앤지스틸
회사이름:  현대엘리베이
회사이름:  현대위아
회사이름:  현대제철


회사이름:  현대차
회사이름:  현대코퍼레이션
회사이름:  현대코퍼레이션홀딩스
회사이름:  현대퓨처넷
회사이름:  현대홈쇼핑
회사이름:  혜인
회사이름:  호텔신라
회사이름:  화승인더
회사이름:  화승코퍼레이션
회사이름:  화신
회사이름:  화신
모델이름:  RandomForestClassifier
accuracy:0.9391, precision:0.6667, recall:0.2500, roc_auc:0.7547
./data/machine_model2_7일_0.1/화신_RandomForestClassifier.pkl
--------------------------------------------------
회사이름:  화천기공
회사이름:  황금에스티
회사이름:  효성
회사이름:  효성ITX
회사이름:  후성
회사이름:  휠라홀딩스
회사이름:  휴스틸
회사이름:  흥아해운


In [27]:
df_result

Unnamed: 0,회사이름,모델이름,accuracy,precision,recall,roc_auc,모델주소
0,대유에이텍,CatBoostClassifier,0.965217,0.666667,0.4,0.508182,./data/machine_model2_7일_0.1/대유에이텍_CatBoostClassifier.pkl
1,동양,RandomForestClassifier,0.947826,0.666667,0.285714,0.564153,./data/machine_model2_7일_0.1/동양_RandomForestClassifier.pkl
2,일진머티리얼즈,CatBoostClassifier,0.913043,0.666667,0.181818,0.597028,./data/machine_model2_7일_0.1/일진머티리얼즈_CatBoostClassifier.pkl
3,진원생명과학,RandomForestClassifier,0.843478,0.6,0.157895,0.593202,./data/machine_model2_7일_0.1/진원생명과학_RandomForestClassifier.pkl
4,화신,RandomForestClassifier,0.93913,0.666667,0.25,0.754673,./data/machine_model2_7일_0.1/화신_RandomForestClassifier.pkl


## 모든파일 만들기 7일 15%

In [28]:
window_size = 7
period_rate= 0.15

path = './data/데이터_뉴스키워드빈도/'
file_list = os.listdir(path)

corp_list =[]
model_list = []
accu_list = []
precision_list = []
recall_list = []
roc_list = []
model_path = []

for file in file_list[:] :
    corp_name = file[:-4]
    print('회사이름: ',corp_name)
    code = corp_code(corp_name)
    df_p = stock_price(code)
    
    file_path = os.path.join(path,file)
    df_count = pd.read_csv(file_path,index_col=0)
    df_count.index = pd.DatetimeIndex(df_count.index)
    try:
        last_col = df_count.columns[-1]
    except:
        continue
    
    # 5개 미만 단어 아예없는경우는 생략
    try:
        df_count = mscaler(df_count)

        df_merge = merge(df_count,df_p)

        df_model = add_target(df_merge,window_size=window_size, period_rate= period_rate)

        x_train = df_model.loc[:'2021-10-01',:last_col]
        y_train = df_model.loc[:'2021-10-01','target']

        x_test = df_model.loc['2021-10-01':,:last_col]
        y_test = df_model.loc['2021-10-01':,'target']


        for model in models :
            time.sleep(0.3)
            model_name = model.__class__.__name__

            try:

                if model_name == 'CatBoostClassifier':
                    model.fit(x_train,y_train, silent=True)
                else:
                    model.fit(x_train,y_train)

            except:
                continue

            pred = model.predict(x_test)
            accuracy = accuracy_score(y_test, pred)
            proba = model.predict_proba(x_test)[:,1]
            precision = precision_score(y_test, pred)
            recall = recall_score(y_test, pred)

            try:
                roc_auc = roc_auc_score(y_test, proba)
            except:
                roc_auc = 0

            save_path = f'./data/machine_model2_{window_size}일_{period_rate}/{corp_name}_{model_name}.pkl'


            if (precision > 0.5) & (precision!=1) &(recall!=1):

                corp_list.append(corp_name)
                model_list.append(model_name)
                accu_list.append(accuracy)
                precision_list.append(precision)
                recall_list.append(recall)
                roc_list.append(roc_auc)
                model_path.append(save_path)
                joblib.dump(model, save_path)

                print('회사이름: ',corp_name)
                print('모델이름: ',model_name)
                print('accuracy:{0:.4f}, precision:{1:.4f}, recall:{2:.4f}, roc_auc:{3:.4f}'.format(accuracy,precision,recall,roc_auc))
                print(save_path)
                print('-'*50)

    except:
        print('출현 단어 5개 미만 종목')
    
    print('='* 50)
    
df_result = pd.DataFrame({'회사이름':corp_list, '모델이름':model_list,'accuracy':accu_list,
                          'precision':precision_list,'recall':recall_list,'roc_auc':roc_list,'모델주소':model_path})

df_result.to_csv(f'./data/model_result/machine_model2_{window_size}일_{period_rate}.csv')

    

회사이름:  AJ네트웍스
회사이름:  AK홀딩스
회사이름:  BGF
회사이름:  BYC
회사이름:  CJ CGV
회사이름:  CJ
회사이름:  CJ대한통운
회사이름:  CJ제일제당
회사이름:  CS홀딩스
회사이름:  DB
회사이름:  DB하이텍
회사이름:  DI동일
회사이름:  DL
회사이름:  DRB동일
회사이름:  DSR
회사이름:  E1
회사이름:  F&F홀딩스
회사이름:  GS건설
회사이름:  GS글로벌
회사이름:  GS리테일
회사이름:  HDC
회사이름:  HDC랩스
회사이름:  HDC현대EP


회사이름:  HJ중공업
회사이름:  HMM


Custom logger is already specified. Specify more than one logger at same time is not thread safe.

회사이름:  HSD엔진
회사이름:  IHQ
회사이름:  JW중외제약
회사이름:  JW홀딩스
회사이름:  KCTC
회사이름:  KC그린홀딩스
회사이름:  KC코트렐
회사이름:  KEC
회사이름:  KG스틸
회사이름:  KG케미칼
회사이름:  KH 필룩스
회사이름:  KISCO홀딩스
회사이름:  KPX케미칼
회사이름:  KPX홀딩스
회사이름:  KR모터스
회사이름:  KSS해운
회사이름:  KT&G
회사이름:  KT
출현 단어 5개 미만 종목
회사이름:  KTcs
회사이름:  LF
회사이름:  LG
회사이름:  LG디스플레이
회사이름:  LG생활건강
회사이름:  LG유플러스


회사이름:  LG이노텍
회사이름:  LG전자
회사이름:  LG화학
회사이름:  LIG넥스원
회사이름:  LS ELECTRIC
회사이름:  LS
회사이름:  LS네트웍스
회사이름:  LX인터내셔널
회사이름:  LX하우시스
회사이름:  MH에탄올
회사이름:  NAVER
회사이름:  NICE
회사이름:  NPC
회사이름:  OCI
회사이름:  POSCO홀딩스
회사이름:  S-Oil
회사이름:  SBS
회사이름:  SGC에너지
회사이름:  SG글로벌
회사이름:  SG세계물산
회사이름:  SIMPAC
회사이름:  SJM
회사이름:  SJM홀딩스


회사이름:  SK
회사이름:  SKC
회사이름:  SK가스
회사이름:  SK네트웍스
회사이름:  SK디스커버리
회사이름:  SK디앤디
회사이름:  SK렌터카
회사이름:  SK이노베이션
회사이름:  SK텔레콤
출현 단어 5개 미만 종목
회사이름:  SK하이닉스
회사이름:  SNT모티브
회사이름:  SNT중공업
회사이름:  SNT홀딩스
회사이름:  SPC삼립
회사이름:  STX
회사이름:  STX엔진
회사이름:  STX중공업
회사이름:  SUN&L
회사이름:  TCC스틸
회사이름:  TKG휴켐스
회사이름:  TYM
회사이름:  WISCOM
회사이름:  YG PLUS
회사이름:  가온전선
회사이름:  강남제비스코


회사이름:  강원랜드
회사이름:  경농
회사이름:  경동나비엔
회사이름:  경방
회사이름:  경인양행
회사이름:  경인전자
회사이름:  계룡건설
회사이름:  계양전기
회사이름:  고려산업
회사이름:  고려아연
회사이름:  고려제강
회사이름:  광동제약
회사이름:  광명전기
회사이름:  광전자
회사이름:  국도화학
회사이름:  국동
회사이름:  국제약품
회사이름:  극동유화
회사이름:  금강공업
회사이름:  금양
회사이름:  금호건설
회사이름:  금호석유


회사이름:  금호에이치티
회사이름:  금호전기
회사이름:  금호타이어
회사이름:  기아
회사이름:  깨끗한나라
회사이름:  남광토건
회사이름:  남성
회사이름:  남양유업
회사이름:  넥센
회사이름:  넥센타이어
회사이름:  노루페인트
회사이름:  노루홀딩스
회사이름:  녹십자
회사이름:  녹십자홀딩스
회사이름:  농심
회사이름:  농심홀딩스
회사이름:  다스코
회사이름:  다우기술
회사이름:  다이나믹디자인
회사이름:  대교


Custom logger is already specified. Specify more than one logger at same time is not thread safe.

회사이름:  대동
회사이름:  대림B&Co
회사이름:  대림통상
회사이름:  대상홀딩스
회사이름:  대성산업
회사이름:  대성홀딩스
회사이름:  대우건설
회사이름:  대우조선해양
회사이름:  대웅
회사이름:  대웅제약
회사이름:  대원강업
회사이름:  대원전선
회사이름:  대원제약
회사이름:  대원화성
회사이름:  대유에이텍
회사이름:  대유플러스
회사이름:  대창
회사이름:  대창단조
회사이름:  대한방직
회사이름:  대한유화
회사이름:  대한전선
회사이름:  대한제강


회사이름:  대한제당
회사이름:  대한제분
회사이름:  대한항공
회사이름:  대한해운
회사이름:  더블유게임즈
회사이름:  더존비즈온
회사이름:  덕성
회사이름:  덕양산업
회사이름:  도화엔지니어링
회사이름:  동국제강
회사이름:  동방
회사이름:  동방아그로
회사이름:  동부건설
회사이름:  동서
회사이름:  동성케미컬
회사이름:  동아쏘시오홀딩스
회사이름:  동아에스티
회사이름:  동아지질
회사이름:  동양
회사이름:  동양고속
회사이름:  동양철관
회사이름:  동원F&B


회사이름:  동원산업
회사이름:  동원수산
회사이름:  동원시스템즈
회사이름:  동일고무벨트
회사이름:  동일산업
회사이름:  두산
회사이름:  두산에너빌리티
회사이름:  디아이


Custom logger is already specified. Specify more than one logger at same time is not thread safe.

회사이름:  디아이씨
회사이름:  디와이
회사이름:  디와이파워
회사이름:  디티알오토모티브
회사이름:  락앤락
회사이름:  롯데관광개발
회사이름:  롯데쇼핑
회사이름:  롯데정밀화학
회사이름:  롯데칠성
회사이름:  롯데케미칼
회사이름:  마니커
회사이름:  만도
회사이름:  메타랩스
회사이름:  명문제약
회사이름:  모나미
회사이름:  모토닉
회사이름:  무림P&P
회사이름:  무림페이퍼
회사이름:  무학
회사이름:  미래산업
회사이름:  미래아이앤지
회사이름:  미원상사


회사이름:  바다로19호
회사이름:  백산
회사이름:  범양건영
회사이름:  벽산
회사이름:  보령
회사이름:  보해양조
회사이름:  부광약품
회사이름:  부산산업
회사이름:  비비안
회사이름:  비상교육
회사이름:  비케이탑스
회사이름:  사조대림
회사이름:  사조동아원
회사이름:  사조산업
회사이름:  삼부토건
회사이름:  삼성SDI
회사이름:  삼성공조
회사이름:  삼성물산
회사이름:  삼성에스디에스
회사이름:  삼성엔지니어링
회사이름:  삼성전기
회사이름:  삼성전자


회사이름:  삼성중공업
회사이름:  삼성출판사
회사이름:  삼양사
회사이름:  삼양식품
회사이름:  삼양통상
회사이름:  삼영무역
회사이름:  삼영전자
회사이름:  삼영화학
회사이름:  삼익악기
회사이름:  삼일제약
회사이름:  삼천리
회사이름:  삼호개발
회사이름:  삼화전기
회사이름:  삼화전자
회사이름:  삼화콘덴서
회사이름:  삼화페인트
회사이름:  상신브레이크
회사이름:  새론오토모티브
회사이름:  샘표
회사이름:  서연
회사이름:  서연이화
회사이름:  서울가스


회사이름:  서원
회사이름:  서흥
회사이름:  선도전기
회사이름:  선진
회사이름:  성문전자
회사이름:  성신양회
회사이름:  성안
회사이름:  성창기업지주
회사이름:  세방
회사이름:  세방전지
회사이름:  세아베스틸지주
회사이름:  세아제강지주
회사이름:  세아특수강
회사이름:  세아홀딩스
회사이름:  세우글로벌
회사이름:  세원이앤씨
회사이름:  세이브존I&C
회사이름:  세종공업
회사이름:  세진중공업
회사이름:  센트럴인사이트
회사이름:  셀트리온
회사이름:  송원산업
회사이름:  수산중공업
회사이름:  스카이라이프


회사이름:  신대양제지
회사이름:  신도리코
회사이름:  신라교역
회사이름:  신성이엔지
회사이름:  신세계
회사이름:  신세계인터내셔날
회사이름:  신세계푸드
회사이름:  신송홀딩스
회사이름:  신영와코루
회사이름:  신원
회사이름:  신풍제약
회사이름:  신풍제지
회사이름:  신흥
회사이름:  쌍방울
회사이름:  쌍용C&E
회사이름:  쌍용차
회사이름:  써니전자
회사이름:  쎌마테라퓨틱스
회사이름:  씨아이테크
회사이름:  씨에스윈드
회사이름:  아모레G
회사이름:  아모레퍼시픽


회사이름:  아세아
회사이름:  아세아시멘트
회사이름:  아세아제지
회사이름:  아센디오
회사이름:  아시아나항공
회사이름:  아이마켓코리아
회사이름:  아이에스동서
회사이름:  알루코
회사이름:  애경케미칼
회사이름:  에넥스
회사이름:  에스엘
회사이름:  에스원
출현 단어 5개 미만 종목
회사이름:  에이블씨엔씨
회사이름:  에이엔피
회사이름:  에이프로젠 MED
회사이름:  에이프로젠제약
회사이름:  엔씨소프트
회사이름:  엔케이
회사이름:  엘브이엠씨홀딩스
회사이름:  엠씨넥스
회사이름:  영보화학
회사이름:  영원무역
회사이름:  영원무역홀딩스


회사이름:  영풍
회사이름:  영흥
회사이름:  예스코홀딩스
회사이름:  오뚜기
회사이름:  오리온홀딩스
회사이름:  와이투솔루션
회사이름:  우성
회사이름:  우신시스템
회사이름:  우진
회사이름:  우진플라임
회사이름:  웅진
회사이름:  웅진씽크빅
회사이름:  원림
회사이름:  웰바이오텍
회사이름:  유니드
회사이름:  유니온
회사이름:  유니온머티리얼
회사이름:  유니켐
회사이름:  유니퀘스트
회사이름:  유성기업
회사이름:  유수홀딩스
회사이름:  유엔젤
회사이름:  유한양행


회사이름:  이건산업
회사이름:  이노션
회사이름:  이마트
회사이름:  이수페타시스
회사이름:  이수화학
회사이름:  이엔플러스
회사이름:  이연제약
회사이름:  인디에프
회사이름:  인스코비
회사이름:  인지컨트롤스
회사이름:  인터지스
회사이름:  인팩
회사이름:  일동홀딩스
회사이름:  일성건설
회사이름:  일신방직
회사이름:  일양약품
회사이름:  일정실업
회사이름:  일진다이아
회사이름:  일진머티리얼즈
회사이름:  일진전기
회사이름:  잇츠한불
회사이름:  자화전자


회사이름:  전방
회사이름:  제이에스코퍼레이션
회사이름:  제이준코스메틱
회사이름:  제일기획
회사이름:  제일연마
회사이름:  제일파마홀딩스
회사이름:  제주항공
회사이름:  조광페인트
회사이름:  조선내화
회사이름:  종근당
회사이름:  종근당홀딩스
회사이름:  주연테크
회사이름:  지엠비코리아
회사이름:  지투알
회사이름:  진도
회사이름:  진양산업
회사이름:  진양홀딩스
회사이름:  진원생명과학
회사이름:  참엔지니어링
회사이름:  카카오
회사이름:  컨버즈
회사이름:  케이비아이동국실업


회사이름:  케이씨
회사이름:  코리아써키트
회사이름:  코스맥스
회사이름:  코스맥스비티아이
회사이름:  코아스
회사이름:  코오롱
회사이름:  코오롱인더
회사이름:  코오롱플라스틱
회사이름:  코웨이
회사이름:  콘텐트리중앙
회사이름:  콤텍시스템
회사이름:  쿠쿠홀딩스
회사이름:  크라운해태홀딩스
회사이름:  태경비케이
회사이름:  태경산업
회사이름:  태경케미컬
회사이름:  태광산업
회사이름:  태림포장
회사이름:  태양금속
회사이름:  태영건설
회사이름:  태평양물산
회사이름:  텔코웨어
회사이름:  토니모리


회사이름:  티에이치엔
회사이름:  티웨이홀딩스
회사이름:  팜스코
회사이름:  팜젠사이언스
회사이름:  팬오션
회사이름:  페이퍼코리아
회사이름:  평화산업
회사이름:  평화홀딩스
회사이름:  포스코스틸리온
회사이름:  포스코인터내셔널


Custom logger is already specified. Specify more than one logger at same time is not thread safe.

회사이름:  포스코케미칼
회사이름:  풀무원
회사이름:  풍산홀딩스
회사이름:  플레이그램
회사이름:  하나투어
회사이름:  하이스틸
회사이름:  하이트진로
회사이름:  한국가스공사
회사이름:  한국공항
회사이름:  한국단자
회사이름:  한국석유
회사이름:  한국수출포장
회사이름:  한국앤컴퍼니
회사이름:  한국전력
회사이름:  한국전자홀딩스
회사이름:  한국조선해양
회사이름:  한국카본
회사이름:  한국콜마홀딩스
회사이름:  한국타이어앤테크놀로지
회사이름:  한국프랜지
회사이름:  한국항공우주
회사이름:  한국화장품
회사이름:  한독


회사이름:  한라홀딩스
회사이름:  한미글로벌
회사이름:  한미반도체
회사이름:  한미사이언스
회사이름:  한미약품
회사이름:  한섬
회사이름:  한세실업
회사이름:  한세엠케이
회사이름:  한세예스24홀딩스
회사이름:  한솔로지스틱스
회사이름:  한솔제지
회사이름:  한솔케미칼
회사이름:  한솔테크닉스
회사이름:  한솔홀딩스
회사이름:  한솔홈데코
회사이름:  한신공영
회사이름:  한신기계
회사이름:  한온시스템
회사이름:  한올바이오파마
회사이름:  한익스프레스
회사이름:  한일철강
회사이름:  한일홀딩스


회사이름:  한전KPS
회사이름:  한전산업
회사이름:  한진
회사이름:  한진중공업홀딩스
회사이름:  한진칼
회사이름:  한화
회사이름:  한화솔루션
회사이름:  한화에어로스페이스
회사이름:  해태제과식품
회사이름:  현대건설
회사이름:  현대그린푸드
회사이름:  현대글로비스
회사이름:  현대두산인프라코어
회사이름:  현대로템
회사이름:  현대리바트
회사이름:  현대모비스
회사이름:  현대미포조선
회사이름:  현대백화점
회사이름:  현대비앤지스틸
회사이름:  현대엘리베이
회사이름:  현대위아
회사이름:  현대제철


회사이름:  현대차
회사이름:  현대코퍼레이션
회사이름:  현대코퍼레이션홀딩스
회사이름:  현대퓨처넷
회사이름:  현대홈쇼핑
회사이름:  혜인
회사이름:  호텔신라
회사이름:  화승인더
회사이름:  화승코퍼레이션
회사이름:  화신
회사이름:  화천기공
회사이름:  황금에스티
회사이름:  효성
회사이름:  효성ITX
회사이름:  후성
회사이름:  휠라홀딩스
회사이름:  휴스틸
회사이름:  흥아해운


In [29]:
df_result

Unnamed: 0,회사이름,모델이름,accuracy,precision,recall,roc_auc,모델주소


## 모든파일 만들기 30일 5%

## 모든파일 만들기 30일 10%

## 모든파일 만들기 30일 15%

## 모든파일 만들기 90일 5%

## 모든파일 만들기 90일 10%

## 모든파일 만들기 90일 15%