# Quantative Analysis

## Library 설치 필요

- pykrx : 주가 정보 산출 Library

    - pip install pykrx

- dart-fss : open-dart API를 활용하여 재무제표를 활용할 수 있게 해주는 Library 

- TA-Lib : 기술적 분석 지표 산출 Library

    1) https://www.lfd.uci.edu/~gohlke/pythonlibs/#ta-lib : 해당 버전의 TA-Lib 다운로드

    2) 다운받은 폴더로 cd 한 후 pip install (파일이름)

## 분석 대상 종목

- 건설
    - 현대건설
    - GS건설
    - 삼부토건
- 화학
    - LG화학
    - 진양화학
- 철강
    - POSCO
    - 현대제철
    - 조선선재
    - 하이스틸
- 전기제품
    - 삼성SDI
    - 삼화전기
    - KH 필룩스
- 조선
    - 한국조선해양
    - 대우조선해양
- 석유와가스
    - S-Oil
    - 극동유화
    - 미창석유
    - 대성산업
- 백화점과 일반상점
    - 롯데쇼핑
    - 세이브존 I&C
- 가스유틸리티
    - 한국가스공사
    - 서울가스
- 양방향미디어와 서비스
    - NAVER
    - 카카오
- 제약
    - 삼성바이오로직스
    - 한미약품
    - 동화약품
- 항공사
    - 대한항공
- 반도체와 반도체장비
    - 삼성전자
    - 유니퀘스트
- 호텔, 레스토랑, 레저
    - 호텔신라
    - 이월드
- 비철금속
    - 고려아연
    - 삼아알미늄
    - 조선내화
- 전자장비와 기기
    - LG이노텍
    - 일진머티리얼즈
    - 써니전자
- 항공화물운송과 물류
    - 현대글로비스
    - 세방
    - CJ 제일제당
- 자동차 부품
    - 현대위아
    - 계양전기
- 전기유틸리티
    - 한국전력
- 다각화된 통신서비스
    - KT

### NAME : MARKET - TICKER - SECTOR Dictionary Update (WICS 기준)

- WICS 기준
    - Wise Industry Classification Standard : FnGuide에서 전세계적으로 사용하는 산업분류 기준을 국내에 맞게 만든 주식 업종 분류 기준. 
    - SECTOR는 WICS 소분류를 입력 (NAVER 등 포탈 증권 페이지의 업종 분류도 WICS 기준)

- 주가 정보 DataFrame에 사용되는 맵핑 dictionary 업데이트

- 업데이트된 dictionary 파일은 ./dataset/N_MTS_dict.pkl 로 저장

## 주가 관련 데이터 산출

pykrx 라이브러리 사용

사용법 https://github.com/sharebook-kr/pykrx

- OHLCV data
    - OPEN : 시가
    - HIGH : 고가
    - LOW : 저가
    - CLOSE : 종가
    - VOLUME : 거래량

- 1M_CLOSE_STD : 최근 한 달 종가들의 표준편차

- 기본 지표
    - PER = CLOSE / EPS
    - PBR = cLOSE / BPS
    - EPS = 당기순이익 / 발행주식수
    - BPS = (총자산 - 총부채) / 발행주식수
    - DIV = DPS / CLOSE
    - DPS = 배당금 총액 / 발행주식수

- CAPITALIZATION : 시가총액

- NUMB_OF_SHARES : 발행주식수

- 거래원별 순매수거래금액
    - INSTITUTION(NP) : 기관
    - CORP(NP) : 기타 법인
    - INDIVIDUAL(NP) : 개인

In [1]:
import numpy as np
import pandas as pd
import warnings
import QuantativeAnalysis as qa

warnings.filterwarnings('ignore')

stock_list = ['현대건설', 'LG화학', 'POSCO', '삼성SDI', '한국조선해양', 'S-Oil', '롯데케미칼', '롯데쇼핑', '한국가스공사', 'GS건설', 'SK이노베이션',
              'NAVER', '삼성바이오로직스', '대한항공', '현대제철', '삼성전자', '호텔신라', '고려아연', 'LG이노텍', '한국전력', 'KT', '한전KPS',
              '현대글로비스', 'CJ제일제당', '카카오', '삼부토건', '진양화학', '조선선재', '하이스틸', '삼화전기', 'KH 필룩스', '대우조선해양', '극동유화', 
              '세이브존I&C', '서울가스', '미창석유', '대성산업', '한미약품', '동화약품', '유니퀘스트', '이월드', '삼아알미늄', '조선내화', '일진머티리얼즈', 
              '써니전자', '세방', '현대위아', '계양전기']

df = qa.get_stock_price_data('20171001', '20210228', stock_list)
df

LG화학 OHLCV complete
POSCO OHLCV complete
삼성SDI OHLCV complete
한국조선해양 OHLCV complete
S-Oil OHLCV complete
롯데케미칼 OHLCV complete
롯데쇼핑 OHLCV complete
한국가스공사 OHLCV complete
GS건설 OHLCV complete
SK이노베이션 OHLCV complete
NAVER OHLCV complete
삼성바이오로직스 OHLCV complete
대한항공 OHLCV complete
현대제철 OHLCV complete
삼성전자 OHLCV complete
호텔신라 OHLCV complete
고려아연 OHLCV complete
LG이노텍 OHLCV complete
한국전력 OHLCV complete
KT OHLCV complete
한전KPS OHLCV complete
현대글로비스 OHLCV complete
CJ제일제당 OHLCV complete
카카오 OHLCV complete
삼부토건 OHLCV complete
진양화학 OHLCV complete
조선선재 OHLCV complete
하이스틸 OHLCV complete
삼화전기 OHLCV complete
KH 필룩스 OHLCV complete
대우조선해양 OHLCV complete
극동유화 OHLCV complete
세이브존I&C OHLCV complete
서울가스 OHLCV complete
미창석유 OHLCV complete
대성산업 OHLCV complete
한미약품 OHLCV complete
동화약품 OHLCV complete
유니퀘스트 OHLCV complete
이월드 OHLCV complete
삼아알미늄 OHLCV complete
조선내화 OHLCV complete
일진머티리얼즈 OHLCV complete
써니전자 OHLCV complete
세방 OHLCV complete
현대위아 OHLCV complete
계양전기 OHLCV complete
LG화학 PER data complete
POSCO PER

Unnamed: 0,DATE,NAME,SECTOR,OPEN,HIGH,LOW,CLOSE,VOLUME,1M_CLOSE_STD,PER,...,EPS,BPS,DIV,DPS,CAPITALIZATION,NUMB_OF_SHARES,INSTITUTION(NP),CORP(NP),INDIVIDUAL(NP),FOREIGN(NP)
0,2017-10-10,현대건설,건설,38350,38700,37350,37650,436016,0.000000,8.55,...,4403,56944,1.33,500,4192544552250,111355765,-4772067750,-23761100,2622048700,2173780150
1,2017-10-11,현대건설,건설,37550,37800,37350,37450,396581,0.000000,8.51,...,4403,56944,1.34,500,4170273399250,111355765,-6560995050,-22273750,4865588050,1717680750
2,2017-10-12,현대건설,건설,37650,40150,37650,39900,1101121,0.000000,9.06,...,4403,56944,1.25,500,4443095023500,111355765,5587452550,-8327300,-12323171150,6744045900
3,2017-10-13,현대건설,건설,39900,40250,38900,39050,548941,0.000000,8.87,...,4403,56944,1.28,500,4348442623250,111355765,2458753000,141256300,5509351800,-8109361100
4,2017-10-16,현대건설,건설,39200,39700,38600,39550,325083,0.000000,8.98,...,4403,56944,1.26,500,4404120505750,111355765,3461068350,-198450600,-423978200,-2838639550
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
39979,2021-02-22,계양전기,자동차부품,5030,5080,4900,4950,631718,204.184200,1237.50,...,4,5425,0.71,35,161370000000,32600000,-4955,0,-83283130,83288085
39980,2021-02-23,계양전기,자동차부품,4895,4895,4710,4710,458610,204.532394,1177.50,...,4,5425,0.74,35,153546000000,32600000,4784025,0,-92952560,88168535
39981,2021-02-24,계양전기,자동차부품,4735,4820,4560,4560,493301,204.231039,1140.00,...,4,5425,0.77,35,148656000000,32600000,325430,0,90131510,-90456940
39982,2021-02-25,계양전기,자동차부품,4655,4680,4555,4610,232616,201.756747,1152.50,...,4,5425,0.76,35,150286000000,32600000,80140,-37240,-26162810,26119910


## 재무비율 산출

dart-fss 라이브러리 사용

사용법 : https://dart-fss.readthedocs.io/en/v0.2.4/welcome.html

- 성장성
    - 총자산 증가율 (ASST_INC) = (당기 자산총계 / 전기 자산총계 - 1) * 100
    - 매출액 증가율 (REV_INC) = (당기 매출액 / 전기 매출액 - 1) * 100
    - 당기순이익 증가율 (PROF_INC) = (당기순이익 / 전기 당기순이익 - 1) * 100
    - 자기자본 증가율 (S_ASST_INC) = (당기 자기자본 / 전기 매출액 - 1) * 100

- 수익성
    - 매출액 영업이익률 (REV_BPR) = (영업이익 / 매출액) * 100
    - 매출액 순이익률 (REV_NPR) = (당기순이익 / 매출액) * 100
    - 총자본 순이익률 (EQ_NPR) = (당기순이익 / 총자본) * 100
    - 경영자산 영업이익률 (RA_BPR) = (영업이익 / 경영자산) * 100 ; 경영자산 = 운전자본 = (유동자산 - 유동부채)

- 안전성
    - 유동비율 (R_RATIO) = (유동자산 / 유동부채) * 100
    - 당좌비율 (D_RATIO) = {(유동자산 - 재고자산) / 유동부채} * 100
    - 고정비율 (F_RATIO) = (비유동자산 / 자기자본) * 100
    - 부채비율 (DEBT_R) = (부채 / 자기자본) * 100

- 활동성
    - 총자본 회전율 (ASST_TO) = 매출액 / 총자본
    - 매출채권 회전율 (SA_C_TO) = 매출액 / 매출채권
    - 재고자산 회전율 (ST_TO) = 매출액 / 재고자산


In [3]:
from QuantativeAnalysis import FinancialStatements

fs = FinancialStatements('./fsdata/')
fs_df = fs.mapping_fsr(df)
fs_df

ncial Ratio creation complete
한국콜마 20180331 Financial Ratio creation complete
한국콜마 20171231 Financial Ratio creation complete
한국콜마 20170930 Financial Ratio creation complete
동일고무벨트 20201231 Financial Ratio creation complete
동일고무벨트 20200930 Financial Ratio creation complete
동일고무벨트 20200630 Financial Ratio creation complete
동일고무벨트 20200331 Financial Ratio creation complete
동일고무벨트 20191231 Financial Ratio creation complete
동일고무벨트 20190930 Financial Ratio creation complete
동일고무벨트 20190630 Financial Ratio creation complete
동일고무벨트 20190331 Financial Ratio creation complete
동일고무벨트 20181231 Financial Ratio creation complete
동일고무벨트 20180930 Financial Ratio creation complete
동일고무벨트 20180630 Financial Ratio creation complete
동일고무벨트 20180331 Financial Ratio creation complete
동일고무벨트 20171231 Financial Ratio creation complete
동일고무벨트 20170930 Financial Ratio creation complete
동아에스티 20201231 Financial Ratio creation complete
동아에스티 20200930 Financial Ratio creation complete
동아에스티 20200630 Financial Rat

Unnamed: 0,DATE,NAME,SECTOR,OPEN,HIGH,LOW,CLOSE,VOLUME,1M_CLOSE_STD,PER,...,REV_BPR,EQ_NPR,RA_BPR,R_RATIO,D_RATIO,F_RATIO,DEBT_R,ASST_TO,SA_C_TO,ST_TO
0,2017-10-10,현대건설,건설,38350,38700,37350,37650,436016,0.000000,8.55,...,,,,,,,,,,
1,2017-10-11,현대건설,건설,37550,37800,37350,37450,396581,0.000000,8.51,...,,,,,,,,,,
2,2017-10-12,현대건설,건설,37650,40150,37650,39900,1101121,0.000000,9.06,...,,,,,,,,,,
3,2017-10-13,현대건설,건설,39900,40250,38900,39050,548941,0.000000,8.87,...,,,,,,,,,,
4,2017-10-16,현대건설,건설,39200,39700,38600,39550,325083,0.000000,8.98,...,,,,,,,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
39979,2021-02-22,계양전기,자동차부품,5030,5080,4900,4950,631718,204.184200,1237.50,...,,,,,,,,,,
39980,2021-02-23,계양전기,자동차부품,4895,4895,4710,4710,458610,204.532394,1177.50,...,,,,,,,,,,
39981,2021-02-24,계양전기,자동차부품,4735,4820,4560,4560,493301,204.231039,1140.00,...,,,,,,,,,,
39982,2021-02-25,계양전기,자동차부품,4655,4680,4555,4610,232616,201.756747,1152.50,...,,,,,,,,,,


## 기술적 분석 지표 산출
TA-Lib 라이브러리 사용

- 추세 지표
    - 5일 이평선 (MA5)
    - 10일 이평선 (MA10)
    - 20일 이평선 (MA20)
    - 50일 이평선 (MA50)

- 모멘텀 지표
    - ADX (ADX)
    - CCO (CCI)
    - WILLIAMS%R (WIILR)

- 시장 강도 지표
    - RSI (RSI)

In [5]:
from QuantativeAnalysis import TechnicalAnalysis

ta = TechnicalAnalysis(fs_df)
ta_df = ta.get_TA()
ta_df

Unnamed: 0,DATE,NAME,SECTOR,OPEN,HIGH,LOW,CLOSE,VOLUME,1M_CLOSE_STD,PER,...,SA_C_TO,ST_TO,MA5,MA10,MA20,MA50,ADX,CCI,WILLR,RSI
0,2017-10-10,현대건설,건설,38350,38700,37350,37650,436016,0.000000,8.55,...,,,,,,,,,,
1,2017-10-11,현대건설,건설,37550,37800,37350,37450,396581,0.000000,8.51,...,,,,,,,,,,
2,2017-10-12,현대건설,건설,37650,40150,37650,39900,1101121,0.000000,9.06,...,,,,,,,,,,
3,2017-10-13,현대건설,건설,39900,40250,38900,39050,548941,0.000000,8.87,...,,,,,,,,,,
4,2017-10-16,현대건설,건설,39200,39700,38600,39550,325083,0.000000,8.98,...,,,38720.0,,,,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
39979,2021-02-22,계양전기,자동차부품,5030,5080,4900,4950,631718,204.184200,1237.50,...,,,4932.0,4882.5,4765.25,4498.7,38.965466,75.540249,-36.000000,56.609056
39980,2021-02-23,계양전기,자동차부품,4895,4895,4710,4710,458610,204.532394,1177.50,...,,,4910.0,4843.5,4763.00,4523.4,38.305748,-24.442703,-68.656716,49.631535
39981,2021-02-24,계양전기,자동차부품,4735,4820,4560,4560,493301,204.231039,1140.00,...,,,4850.0,4822.0,4750.00,4544.3,37.001256,-104.858300,-96.551724,45.829427
39982,2021-02-25,계양전기,자동차부품,4655,4680,4555,4610,232616,201.756747,1152.50,...,,,4770.0,4813.0,4733.00,4565.9,35.767020,-122.981187,-92.941176,47.279240


In [11]:
# 결과를 pickle 파일로 저장
import datetime

now = datetime.datetime.now()
now_str = now.strftime('%m%d%H')

mask = (ta_df.DATE >= '2018-01-01') & (ta_df.DATE <= '2020-12-31')
result_df = ta_df[mask]
result_df.reset_index(drop=True, inplace=True)

result_df.to_pickle('./dataset/quantative_analysis_df_v{}.pkl'.format(now_str))
result_df

Unnamed: 0,DATE,NAME,SECTOR,OPEN,HIGH,LOW,CLOSE,VOLUME,1M_CLOSE_STD,PER,...,SA_C_TO,ST_TO,MA5,MA10,MA20,MA50,ADX,CCI,WILLR,RSI
0,2018-01-02,현대건설,건설,36450,37400,36100,37150,649218,729.692760,8.44,...,1.769322,2.227292,35810.0,35875.0,35622.50,36807.0,12.044274,153.318078,-8.620690,57.307471
1,2018-01-03,현대건설,건설,36650,37000,36200,36300,482518,724.305702,8.24,...,1.769322,2.227292,36090.0,35905.0,35702.50,36745.0,12.183271,92.292089,-37.931034,52.062683
2,2018-01-04,현대건설,건설,36300,38400,36300,37950,1459930,853.650292,8.62,...,1.769322,2.227292,36610.0,36070.0,35832.50,36703.0,13.522327,206.194190,-11.538462,59.761265
3,2018-01-05,현대건설,건설,38200,38600,37300,38050,655891,970.138032,8.64,...,1.769322,2.227292,37150.0,36295.0,35897.50,36663.0,14.910828,188.419405,-13.414634,60.178666
4,2018-01-08,현대건설,건설,38000,38550,37400,38350,577188,1136.080398,8.71,...,1.769322,2.227292,37560.0,36520.0,36012.50,36630.0,16.200150,153.724271,-6.097561,61.469930
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
35419,2020-12-23,계양전기,자동차부품,3935,5090,3795,5070,21751672,397.543140,1267.50,...,1.680578,1.783505,4216.0,3862.5,3646.50,3341.6,48.845956,184.406324,-1.117318,77.888111
35420,2020-12-24,계양전기,자동차부품,4875,4900,4190,4205,6952461,413.160167,1051.25,...,1.680578,1.783505,4352.0,3930.0,3686.25,3359.5,50.136906,110.306029,-49.441341,58.095712
35421,2020-12-28,계양전기,자동차부품,4260,4500,4055,4190,5965059,442.223007,1047.50,...,1.680578,1.783505,4351.0,3995.0,3724.75,3378.2,50.663576,65.764523,-50.991501,57.821317
35422,2020-12-29,계양전기,자동차부품,4150,4275,4110,4170,1157499,441.859219,1042.50,...,1.680578,1.783505,4311.0,4066.5,3763.25,3398.6,51.152627,47.069541,-55.421687,57.431818
