# OpenDartReader - 비상장 기업 데이터 조회와 활용

<img width="40%" src="https://i.imgur.com/NE65l5L.png" >

#### 2019-2020 [FinanceData.KR](http://financedata.kr) | [facebook.com/financedata](http://facebook.com/financedata)

## 요약

```python
import OpenDartReader

api_key = '961aebb762ef44e8f93a36218897eb**********'
dart = OpenDartReader(api_key)

# [비바리퍼블리카] (송금서비스 토스로 유명한), 공시(감사보고서) 목록
df = dart.list('비바리퍼블리카', start='1900') 

# [빅히트엔터테인먼트] (BTS로 유명한), 공시(감사보고서) 목록
df = dart.list('빅히트엔터테인먼트', start='1900')
df = dart.list('01204056', start='1900')

# [쿠팡] "연결감사보고서 (2019.12)" 20200414000766 (삼일회계법인)
# http://dart.fss.or.kr/dsaf001/main.do?rcpNo=20200414000766
html_text = dart.document('20200414000766')
df_list = pd.read_html(html_text)
df_list[15] # 연결포괄손익계산서
```

<img src="https://i.imgur.com/c3t2toM.png" >


## OpenDartReader 설치와 초기화

In [1]:
!pip install -q OpenDartReader # 1회만 설치

In [2]:
import OpenDartReader

# 발급받은 API키를 사용하세요
api_key = '961aebb762ef44e8f93a36218897eb**********'

dart = OpenDartReader(api_key)

## 비상장 회사의 공시보고서 목록

In [3]:
df = dart.list('비바리퍼블리카', start='1900') # 송금서비스 토스
df

Unnamed: 0,corp_code,corp_name,stock_code,corp_cls,report_nm,rcept_no,flr_nm,rcept_dt,rm
0,1212921,비바리퍼블리카,,E,감사보고서 (2019.12),20200410003129,삼일회계법인,20200410,
1,1212921,비바리퍼블리카,,E,감사보고서 (2018.12),20190412002776,삼일회계법인,20190412,
2,1212921,비바리퍼블리카,,E,감사보고서 (2017.12),20180413001411,삼일회계법인,20180413,


In [4]:
# 보고서 링크
for ix, row in df.iterrows():
    rcp_no = row['rcept_no']
    print(f'http://dart.fss.or.kr/dsaf001/main.do?rcpNo={rcp_no}')

http://dart.fss.or.kr/dsaf001/main.do?rcpNo=20200410003129
http://dart.fss.or.kr/dsaf001/main.do?rcpNo=20190412002776
http://dart.fss.or.kr/dsaf001/main.do?rcpNo=20180413001411


## 이름으로 확인 하기

회사 이름으로 식별이 고유하게 식별이 가능한지 확인해야 하는 것을 추천합니다.

예를 들어, BTS로 유명한 '빅히트엔터테인먼트'를 조회하면 정확히 1개 회사가 있지만, '빅히트'로 검색하면 '빅히트'가 포함된 여러 회사가 있을 수 있습니다.

In [5]:
comps = dart.company_by_name('빅히트엔터테인먼트')
len(comps)

1

In [6]:
comps = dart.company_by_name('빅히트')
len(comps)

4

In [7]:
import pandas as pd
pd.DataFrame(comps)

Unnamed: 0,status,message,corp_code,corp_name,corp_name_eng,stock_name,stock_code,ceo_nm,corp_cls,jurir_no,bizr_no,adres,hm_url,ir_url,phn_no,fax_no,induty_code,est_dt,acc_mt
0,0,정상,294858,리젠트빅히트40전환형펀드,RegentBICHIT40ConversionFund,리젠트빅히트40전환형펀드,,김준연,E,1101111846398,1078176246,서울특별시 영등포구 여의도동12,www.regentasset.com,,729-0426,777-5311,64201,20000107,1
1,0,정상,1204056,(주)빅히트엔터테인먼트,"Big Hit Entertainment Co., Ltd.",빅히트엔터테인먼트,,방시혁,E,1101113166546,1208678223,"서울특별시 강남구 도산대로16길 13-20 2층(논현동, 청구빌딩)",www.ibighit.com,,02-3444-0105,,73901,20050201,12
2,0,정상,1449288,주식회사 빅히트아이피,"Big Hit IP Co.,Ltd.",빅히트아이피,,윤석준,E,1101117247798,8528601762,"서울특별시 강남구 테헤란로108길 42 (대치동, 엠디엠타워) 3층",,,02-3444-0105,,46452,20191001,12
3,0,정상,1449367,주식회사 빅히트쓰리식스티,"Big Hit Three Sixty Co., Ltd.",빅히트쓰리식스티,,윤석준,E,1101117247780,3518101721,"서울특별시 강남구 테헤란로108길 42 (대치동, 엠디엠타워)",,,02-3444-0105,,90191,20191001,12


## 공시목록 가져오기

조회를 해보고 정식명칭의 전체 회사명을 사용하십시오. `corp_code`를 쓰는 것이 가장 확실합니다.

In [8]:
bighit = dart.list('빅히트엔터테인먼트', start='1900')
bighit

Unnamed: 0,corp_code,corp_name,stock_code,corp_cls,report_nm,rcept_no,flr_nm,rcept_dt,rm
0,1204056,빅히트엔터테인먼트,,E,증권신고서(지분증권),20200902000244,빅히트엔터테인먼트,20200902,
1,1204056,빅히트엔터테인먼트,,E,연결감사보고서 (2019.12),20200331000038,한영회계법인,20200331,
2,1204056,빅히트엔터테인먼트,,E,감사보고서 (2019.12),20200331000037,한영회계법인,20200331,
3,1204056,빅히트엔터테인먼트,,E,감사보고서 (2018.12),20190319000209,삼일회계법인,20190319,
4,1204056,빅히트엔터테인먼트,,E,감사보고서 (2017.12),20180322000053,삼일회계법인,20180322,


In [9]:
bighit = dart.list('01204056', start='1900')
bighit

Unnamed: 0,corp_code,corp_name,stock_code,corp_cls,report_nm,rcept_no,flr_nm,rcept_dt,rm
0,1204056,빅히트엔터테인먼트,,E,증권신고서(지분증권),20200902000244,빅히트엔터테인먼트,20200902,
1,1204056,빅히트엔터테인먼트,,E,연결감사보고서 (2019.12),20200331000038,한영회계법인,20200331,
2,1204056,빅히트엔터테인먼트,,E,감사보고서 (2019.12),20200331000037,한영회계법인,20200331,
3,1204056,빅히트엔터테인먼트,,E,감사보고서 (2018.12),20190319000209,삼일회계법인,20190319,
4,1204056,빅히트엔터테인먼트,,E,감사보고서 (2017.12),20180322000053,삼일회계법인,20180322,


## 공시 본문가져오기

"연결감사보고서 (2019.12)"의 접수번호(rcept_no) '20200331000038'로 공시보고서 문서 전체를 얻을 수 있습니다. (형식은 XHTML 입니다)

http://dart.fss.or.kr/dsaf001/main.do?rcpNo=20200331000038




In [10]:
html_text = dart.document('20200331000038')
html_text[:1000] # 앞부분

'<?xml version="1.0" encoding="utf-8"?>\n\n\n<DOCUMENT xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="dart3.xsd">\n\n<DOCUMENT-HEADER AEXT-CLASS="Y">\n<DOCUMENT-NAME ACODE="00761">연결감사보고서</DOCUMENT-NAME>\n<FORMULA-VERSION SUBVER="4" ADATE="20190212">3.4</FORMULA-VERSION>\n<COMPANY-NAME AREGCIK="01204056" AACCOUNTTYPE="A">주식회사 빅히트엔터테인먼트</COMPANY-NAME>\n\n<SUMMARY>\n<EXTRACTION ACODE="AUDIT_CIK" AFEATURE="BOTH">00260198</EXTRACTION>\n<EXTRACTION ACODE="SUPV_OPIN" AFEATURE="BOTH">100000000000</EXTRACTION>\n<EXTRACTION ACODE="TOT_ASSETS" AFEATURE="BOTH">362990</EXTRACTION>\n<EXTRACTION ACODE="TOT_DEBTS" AFEATURE="BOTH">189467</EXTRACTION>\n<EXTRACTION ACODE="TOT_SALES" AFEATURE="BOTH">587224</EXTRACTION>\n<EXTRACTION ACODE="TOT_EMPL" AFEATURE="BOTH">228</EXTRACTION>\n<EXTRACTION ACODE="ETC_OTHR_YN" AFEATURE="BOTH">Y</EXTRACTION>\n<EXTRACTION ACODE="POW_OTHR_YN" AFEATURE="BOTH">N</EXTRACTION>\n<EXTRACTION ACODE="ACC_PROF_YN" AFEATURE="BOTH">Y</EXTRACTIO

## 재무데이터를 데이터프레임으로 읽어오기

pandas의 read_html()로 페이지에 포함된 표를 손쉽게 DataFrame으로 읽을 수 있습니다.

In [11]:
df_list = pd.read_html(html_text)

In [12]:
len(df_list)

142

페이지안에 총 142개의 테이블(table)이 있습니다.

몇 번째 표가 `연결재무상태표`인지는 인덱스번호를 넣어가며 찾아야 합니다.  여기서는 15번째(인덱스로는 14)가 연결재무상태표 입니다.

In [13]:
# 연결재무상태표
df = df_list[14]

remove_text = "&cr;(감사받지 아니한 재무제표)"
df.columns = [col.replace(remove_text, '') for col in df.columns]
df

Unnamed: 0,과 목,주 석,제15(당) 기말,제15(당) 기말.1,제14(전) 기말,제14(전) 기말.1,제14(전) 기초,제14(전) 기초.1
0,자산,,,,,,,
1,유동자산,,,294652316,,171707518.0,,55866023
2,현금및현금성자산,33.0,160780830,,58064738,,29504093,
3,당기손익-공정가치 측정 금융자산,43233.0,-,,36817279,,12004106,
4,매출채권,53033.0,94607697,,49201245,,8208888,
5,기타유동금융자산,633.0,5750441,,12450900,,4999066,
6,기타유동자산,7.0,20541758,,9468209,,1115220,
7,재고자산,8.0,12971590,,5705147,,34650,
8,비유동자산,,,68337520,,33821650.0,,10148197
9,당기손익-공정가치 측정 금융자산,43233.0,1572021,,1892865,,1585539,


In [14]:
# 연결포괄손익계산서
df = df_list[18]

remove_text = "&cr;(감사받지 아니한 재무제표)"
df.columns = [col.replace(remove_text, '') for col in df.columns]
df

Unnamed: 0,과 목,주 석,제15기,제15기.1,제14기,제14기.1
0,매출액,2230.0,,587224478,,301371824
1,매출원가,2430.0,,385686888,,189978918
2,매출총이익,,,201537590,,111392906
3,판매비와관리비,2324.0,102795121,,31462308,
4,영업이익,,,98742469,,79930598
5,기타수익,25.0,154231,,97511,
6,기타비용,25.0,510638,,1768914,
7,지분법손실,9.0,907839,,124381,
8,금융수익,2633.0,7490975,,2207145,
9,금융비용,2633.0,6476775,,128791219,


In [15]:
# 연결현금흐름표
df = df_list[24]

remove_text = "&cr;(감사받지 아니한 재무제표)"
df.columns = [col.replace(remove_text, '') for col in df.columns]
df

Unnamed: 0,구 분,주 석,제15기,제15기.1,제14기,제14기.1
0,영업활동으로 인한 현금흐름,,,91713636,,74686749
1,영업으로부터 창출된 현금흐름,28.0,121917870,,88169367,
2,이자의 수취,,175611,,89461,
3,이자의 지급,,"(12,979)",,(117),
4,법인세의 납부,,"(30,366,866)",,"(13,571,962)",
5,투자활동으로 인한 현금흐름,,,12180077,,"(45,068,033)"
6,기타금융자산의 감소,,108939949,,71656309,
7,기타비유동금융자산의 감소,,400019,,86064,
8,유형자산의 처분,,27891,,-,
9,종속기업 취득에 따른 순현금흐름,,"(15,202,551)",,-,


## 쿠팡 손익계산서

In [16]:
coupang = dart.list('쿠팡', start='1900')
coupang

Unnamed: 0,corp_code,corp_name,stock_code,corp_cls,report_nm,rcept_no,flr_nm,rcept_dt,rm
0,1019166,쿠팡,,E,연결감사보고서 (2019.12),20200414000766,삼일회계법인,20200414,
1,1019166,쿠팡,,E,감사보고서 (2019.12),20200414000763,삼일회계법인,20200414,
2,1019166,쿠팡,,E,연결감사보고서 (2018.12),20190415000123,삼일회계법인,20190415,
3,1019166,쿠팡,,E,감사보고서 (2018.12),20190415000121,삼일회계법인,20190415,
4,1019166,쿠팡,,E,연결감사보고서 (2017.12),20180416000061,삼일회계법인,20180416,
5,1019166,쿠팡,,E,감사보고서 (2017.12),20180416000060,삼일회계법인,20180416,
6,1019166,쿠팡,,E,연결감사보고서 (2016.12),20170414001794,삼일회계법인,20170414,
7,1019166,쿠팡,,E,감사보고서 (2016.12),20170414001793,삼일회계법인,20170414,
8,1019166,쿠팡,,E,감사보고서 (2015.12),20160414001921,삼일회계법인,20160414,
9,1019166,쿠팡,,E,감사보고서 (2014.12),20150414002045,삼일회계법인,20150414,


In [17]:
# http://dart.fss.or.kr/dsaf001/main.do?rcpNo=20200414000766
html_text = dart.document('20200414000766')

df_list = pd.read_html(html_text)
len(df_list)

119

In [18]:
# 연결포괄손익계산서
df_list[15]

Unnamed: 0,과 목,주석,제 7 (당)기,제 6 (전)기
0,Ⅰ. 매출액,182324.0,7153094,4354586
1,매출원가,1924.0,5950017,4142781
2,영업 일반관리비,192324.0,1923606,1339769
3,Ⅱ. 영업손실,,"(720,529)","(1,127,964)"
4,기타수익,,1782,436
5,기타비용,,1481,666
6,금융수익,520.0,50396,19338
7,금융비용,520.0,54155,33450
8,Ⅲ. 법인세비용차감전순손실,,"(723,987)","(1,142,306)"
9,Ⅳ. 법인세비용,14.0,(747),2331


당기(2019년)에 영업손실 -7,205 억원을 기록했습니다. 전기(2018년)에 -1조1279억원에 비하면 많은 개선이 이루어졌습니다.


#### 2019-2020 [FinanceData.KR](http://financedata.kr) | [facebook.com/financedata](http://facebook.com/financedata)