# chap 12

## 12.1.1 openDart API 키 등록

In [29]:
from dotenv import load_dotenv
import os
import keyring

# dotenv로 api 키 불러오기
load_dotenv()
dart_key = os.getenv("DART_API_KEY")

# keyring을 이용해 저장
keyring.set_password('dart_api_key', 'student', f'{dart_key}')

## 12.1.2 고유번호 다운로드

In [None]:
import keyring
import requests as rq
from io import BytesIO
import zipfile

api_key = keyring.get_password('dart_api_key', 'student')
codezip_url = f'https://opendart.fss.or.kr/api/corpCode.xml?crtfc_key={api_key}'
codezip_data = rq.get(codezip_url)
codezip_data.headers

In [None]:
# 위에서 불러온 페이지 헤더 중 'Content-Disposition' 부분만을 확인
# zip 파일이 첨부된 것을 알 수 있음
codezip_data.headers['Content-Disposition']

In [None]:
# zip 파일의 압축을 풀어 첨부된 내용 확인

codezip_file = zipfile.ZipFile(BytesIO(codezip_data.content))   # 바이너리스트림 형태로 만든 후 ZipFile 함수를 통해 압축풀기
codezip_file.namelist()     # 압축을 푼 내용물을 확인

In [None]:
import xmltodict
import json
import pandas as pd

code_data = codezip_file.read('CORPCODE.xml').decode('utf-8')   # CORPCODE.xml 파일을 불러와서 utf-8 형식으로 디코딩
# code_data
data_odict = xmltodict.parse(code_data)     # xml -> dict 변환
# data_odict
data_dict = json.loads(json.dumps(data_odict))  # json.dumps(data_odict): dict -> json 변환 (json은 문자열로 표현됨) / json으로 표현하는 것이 다른 통신 과정에서 수월하므로 한번 해본 것인듯
# data_json=json.dumps(data_odict)

data = data_dict.get('result').get('list')  # get() 함수를 이용해서 result 내에서 list 부분만 불러오기
corp_list = pd.DataFrame(data)

corp_list.head()

In [None]:
# corp_list 데이터의 길이 확인 - 거래소의 상장 종목수보다 훨씬 많은 것을 확인 가능
len(corp_list)

In [None]:
# stock_code 열이 빈 종목, 즉 거래소에 상장되지 않은 종목도 데이터에 포함되어 있음
corp_list[corp_list['stock_code'].isin([None])].head()

In [None]:
# 거래소에 상장되지 않은 종목을 삭제 후 db에 저장

import pymysql
from sqlalchemy import create_engine

corp_list = corp_list[~corp_list.stock_code.isin(
    [None])].reset_index(drop=True)

engine = create_engine('mysql+pymysql://root:1234@127.0.0.1:3306/stock_db')
corp_list.to_sql(name='dart_code', con=engine, index=True, if_exists='replace') # dart_code 라는 이름의 테이블을 생성 후 데이터 저장

---

## 12.1.3 공시 데이터

### 12.1.3.1 전체 종목의 공시 데이터 수집

In [None]:
# https://opendart.fss.or.kr/guide/detail.do?apiGrpCd=DS001&apiId=2019001 : 각 인자에 맞게 생성된 URL을 참고
# 시작일과 종료일을 토대로 최근 공시 100건에 해당하는 URL 생성

from datetime import date
from dateutil.relativedelta import relativedelta

begin_date = (date.today() + relativedelta(days=-7)).strftime('%Y%m%d')     # 일주일 전 날짜
end_date = date.today().strftime('%Y%m%d')

notice_url=f'https://opendart.fss.or.kr/api/list.json?crtfc_key={api_key}&bgn_de={begin_date}&end_de={end_date}&page_no=1&page_count=100'

notice_data=rq.get(notice_url)
notice_data_df = notice_data.json().get('list') # json 데이터를 불러온 후, 'list' 부분을 선택
notice_data_df = pd.DataFrame(notice_data_df)

notice_data_df.tail()

### 12.1.3.2 특정 기업의 공시 데이터 수집

In [None]:
# 고유 번호를 추가하여 원하는 기업의 공시만 받도록 수정
# 삼성전자를 타겟팅

corp_list[corp_list['corp_name'] == '삼성전자']     # 삼성전자의 정보 확인

In [None]:
# https://opendart.fss.or.kr/guide/detail.do?apiGrpCd=DS001&apiId=2019001 : 각 인자에 맞게 생성된 URL을 참고
# 시작일과 종료일을 토대로 최근 공시 100건에 해당하는 URL 생성

from datetime import date
from dateutil.relativedelta import relativedelta

begin_date = (date.today() + relativedelta(days=-30)).strftime('%Y%m%d')     # 일주일 전 날짜
end_date = date.today().strftime('%Y%m%d')
corp_code = '00126380'      # 삼성전자의 고유번호

notice_url_ss=f'https://opendart.fss.or.kr/api/list.json?crtfc_key={api_key}&corp_code={corp_code}&bgn_de={begin_date}&end_de={end_date}&page_no=1&page_count=100'

notice_data_ss=rq.get(notice_url_ss)
notice_data_ss_df = notice_data_ss.json().get('list') # json 데이터를 불러온 후, 'list' 부분을 선택
notice_data_ss_df = pd.DataFrame(notice_data_ss_df)

notice_data_ss_df.tail()

In [None]:
# rcept_no: 공시번호
# 공시번호를 이용해 공시에 해당하는 URL에 접속하여 내역 확인 가능

notice_url_exam = notice_data_ss_df.loc[0, 'rcept_no']  # .loc[행, 열]
notice_dart_url = f'https://dart.fss.or.kr/dsaf001/main.do?rcpNo={notice_url_exam}'

print(notice_dart_url)

## 12.1.4 사업보고서 주요 정보

In [None]:
# https://opendart.fss.or.kr/guide/detail.do?apiGrpCd=DS002&apiId=2019005
# 2021년 삼성전자 사업보고서 내 배당에 관한 사항을 다운로드

corp_code = '00126380'
bsns_year = '2021'
reprt_code = '11011'

url_div = f'https://opendart.fss.or.kr/api/alotMatter.json?crtfc_key={api_key}&corp_code={corp_code}&bsns_year={bsns_year}&reprt_code={reprt_code}'
div_data_ss = rq.get(url_div)
div_data_ss_df = div_data_ss.json().get('list')
div_data_ss_df = pd.DataFrame(div_data_ss_df)

div_data_ss_df.head()

---

# 12.2 FRED 데이터 다운로드

In [1]:
# 10년-2년 장단기 금리차 / 10년-3개월 장단기 금리차 데이터 다운로드

import pandas as pd
import pandas_datareader as web

t10y2y = web.DataReader('T10Y2Y', 'fred', start='1990-01-01')       # FRED API를 통해 데이터 받아오기
t10y3m = web.DataReader('T10Y3M', 'fred', start='1990-01-01')

rate_diff = pd.concat([t10y2y, t10y3m], axis=1)
rate_diff.columns = ['10Y - 2Y', '10Y - 3M']

rate_diff.tail()

Unnamed: 0_level_0,10Y - 2Y,10Y - 3M
DATE,Unnamed: 1_level_1,Unnamed: 2_level_1
2025-01-21,0.28,0.21
2025-01-22,0.31,0.24
2025-01-23,0.36,0.29
2025-01-24,0.36,0.28
2025-01-27,0.36,0.21


In [None]:
import matplotlib.pyplot as plt
import numpy as np

# 주가지수 다운로드
sp = web.DataReader('^GSPC', 'yahoo', start='1990-01-01')

plt.rc('font', family='IBM Plex Sans KR')
plt.rc('axes', unicode_minus=False)

flg, ax1 = plt.subplots(figsize=(10,6))

ax1.plot(t10y2y, color='black', linewidth=0.5, label='10Y-2Y')
ax1.plot(t10y3m, color='gray', linewidth=0.5, label='10Y-3M')
ax1.axhline(y=0, color='r', linestyle='dashed')
ax1.set_ylabel('장단기 금리차')
ax1.legend(loc = 'lower right')

ax2 = ax1.twinx()
ax2.plot(np.log(sp['Close']), label='S&P500')
ax2.set_ylabel('S&P500 지수(로그)')
ax1.legend(loc = 'upper right')