# DART 03 - 개별 보고서 첨부파일

<img src="http://i.imgur.com/SX6ekJk.jpg" >

* 개별 보고서 첨부파일 다운로드
* 보고서 (pdf), 재무제표 (execl), XBRL (zip)

### 2018 FinanceData.KR http://fb.com/financedata

# 첨부 파일 다운로드
http://dart.fss.or.kr/dsaf001/main.do?rcpNo=20170515003806 (분기보고서)
* rcp_no 와 dcm_no를 알면 첨부파일의 URL을 구할 수 있다.
* 보고서 (pdf), 재무제표 (execl), XBRL (zip) 3가지

<img src="https://i.imgur.com/EZOyLNt.png" >

http://dart.fss.or.kr/pdf/download/main.do?rcp_no=20170515003806&dcm_no=5653406

# 보고서 페이지 소스
http://dart.fss.or.kr/dsaf001/main.do?rcpNo=20170515003806 (분기보고서)

```javascript
	var treeRoot = new Tree.TreeNode({
		text: "전체",
		id: "root",
		href: "javascript: viewDoc('20170515003806', '5653406', null, null, null, 'dart3.xsd')"
	});
```
dcm_no(5653406) 추출

# 다운로드 페이지
http://dart.fss.or.kr/pdf/download/main.do?rcp_no=20170515003806&dcm_no=5653406


```HTML
	<td>분기보고서(5653406.pdf)</td>
	<td>
		<a href="/pdf/download/pdf.do?rcp_no=20170515003806&dcm_no=5653406" >
		<img name="downImgPdf" src="/pdf/images/pop/pop_icon_file.gif" width="16" height="16" alt="분기보고서" border="0" /></a>
	</td>
	<tr>
	<td>재무제표(5653406_ko.xls)</td>
	<td>
		<a href="/pdf/download/excel.do?rcp_no=20170515003806&dcm_no=5653406&lang=ko">
		<img name="downImgXbrl" src="/pdf/images/pop/pop_icon_file.gif" width="16" height="16" alt="" border="0" /></a>
	</td>
</tr>
			
<!-- IFRS ZIP 파일 -->
	
<tr>
	<td>IFRS(원문XBRL)(20170515003806_ifrs.zip)</td>
	<td>
		<a href="/pdf/download/ifrs.do?rcp_no=20170515003806&dcm_no=5653406&lang=ko">
		<img name="downImgXbrl" src="/pdf/images/pop/pop_icon_file.gif" width="16" height="16" alt="" border="0" /></a>
	</td>
</tr>
```
파일 링크의 형태 확인 ( /pdf/download/excel.do?rcp_no=20170515003806&dcm_no=5653406&lang=ko )

# 첨부파일 URL 가져오기

In [3]:
import os
import re
import requests

pdf_link_tmpl = "http://dart.fss.or.kr/pdf/download/pdf.do?rcp_no={rcp_no}&dcm_no={dcm_no}"
excel_link_tmpl = "http://dart.fss.or.kr/pdf/download/excel.do?rcp_no={rcp_no}&dcm_no={dcm_no}&lang=ko"
ifrs_link_tmpl = "http://dart.fss.or.kr/pdf/download/ifrs.do?rcp_no={rcp_no}&dcm_no={dcm_no}&lang=ko"

def get_report_attach_urls(rcp_no):
    attach_urls = []

    url = "http://dart.fss.or.kr/dsaf001/main.do?rcpNo=%s" % (rcp_no)
    r = requests.get(url)

    start_str = "javascript: viewDoc\('" + rcp_no + "', '"
    end_str = "', null, null, null,"
    reg = re.compile(start_str + '(.*)' + end_str)
    m = reg.findall(r.text)
    dcm_no = m[0]
    
    attach_urls.append(pdf_link_tmpl.format(rcp_no=rcp_no, dcm_no= dcm_no))
    attach_urls.append(excel_link_tmpl.format(rcp_no=rcp_no, dcm_no= dcm_no))
    attach_urls.append(ifrs_link_tmpl.format(rcp_no=rcp_no, dcm_no= dcm_no))
    return attach_urls

In [4]:
# http://dart.fss.or.kr/dsaf001/main.do?rcpNo=20170515003806
# 2017년 3월 삼성전자 분기보고서

rcp_no = '20170515003806'
attach_urls = get_report_attach_urls(rcp_no)
attach_urls

['http://dart.fss.or.kr/pdf/download/pdf.do?rcp_no=20170515003806&dcm_no=5653406',
 'http://dart.fss.or.kr/pdf/download/excel.do?rcp_no=20170515003806&dcm_no=5653406&lang=ko',
 'http://dart.fss.or.kr/pdf/download/ifrs.do?rcp_no=20170515003806&dcm_no=5653406&lang=ko']

In [5]:
# 보고서 PDF 문서
url = attach_urls[0]
fname = '005930_' + rcp_no + '.pdf'

with open(fname, 'wb') as f:
    f.write(requests.get(url).content)

In [6]:
# 보고서 엑셀 문서 (재무제표)
url = attach_urls[1]
fname = '005930_' + rcp_no + '.xls'

with open(fname, 'wb') as f:
    f.write(requests.get(url).content)

In [7]:
# ZIP 문서(IFRS 문서)
url = attach_urls[2]
fname = '005930_' + rcp_no + '.zip'

with open(fname, 'wb') as f:
    f.write(requests.get(url).content)

In [8]:
ls -al 005930*

-rw-rw-r-- 1 plusjune plusjune 1596666  2월 20 17:37 005930_20170515003806.pdf
-rw-rw-r-- 1 plusjune plusjune   69120  2월 20 17:37 005930_20170515003806.xls
-rw-rw-r-- 1 plusjune plusjune  135569  2월 20 17:37 [0m[01;31m005930_20170515003806.zip[0m


# 재무제표 읽기

In [9]:
# http://dart.fss.or.kr/dsaf001/main.do?rcpNo=20170515003806
# 2017년 3월 삼성전자 분기보고서

import pandas as pd

df = pd.read_excel('005930_20170515003806.xls', sheet_name='연결 재무상태표', index_col=0, skiprows=6)
df

Unnamed: 0,제 49 기 1분기말,제 48 기말,제 47 기말
,,,
자산,,,
유동자산,129284204.0,141429704.0,124814725.0
현금및현금성자산,27562938.0,32111442.0,22636744.0
단기금융상품,41775404.0,52432411.0,44228800.0
단기매도가능금융자산,4063945.0,3638460.0,4627530.0
매출채권,22340688.0,24279211.0,25168026.0
미수금,3557039.0,3521197.0,3352663.0
선급금,1662898.0,1439938.0,1706003.0
선급비용,4149992.0,3502083.0,3170632.0


In [10]:
df = pd.read_excel('005930_20170515003806.xls', sheet_name='연결 손익계산서', index_col=0, skiprows=7)
df

Unnamed: 0,제 49 기 1분기,Unnamed: 2,제 48 기 1분기,Unnamed: 4,제 48 기,제 47 기
,,,,,,
,3개월,누적,3개월,누적,,
수익(매출액),50547526,50547526,49782252,49782252,201866745.0,200653482.0
매출원가,28155597,28155597,30373858,30373858,120277715.0,123482118.0
매출총이익,22391929,22391929,19408394,19408394,81589030.0,77171364.0
판매비와관리비,12493568,12493568,12732582,12732582,52348358.0,50757922.0
영업이익(손실),9898361,9898361,6675812,6675812,29240672.0,26413442.0
기타수익,316423,316423,702593,702593,3238261.0,1685947.0
기타비용,277234,277234,338636,338636,2463814.0,3723434.0
지분법이익,19338,19338,9147,9147,19501.0,1101932.0


In [11]:
df = pd.read_excel('005930_20170515003806.xls', sheet_name='현금흐름표', index_col=0, skiprows=7)
df

Unnamed: 0,제 49 기 1분기,제 48 기 1분기,제 48 기,제 47 기
,,,,
영업활동 현금흐름,7087039.0,4086639.0,23984804.0,19287521.0
영업에서 창출된 현금흐름,8014616.0,4442161.0,24901464.0,19756969.0
당기순이익,4873767.0,2483469.0,11579749.0,12238469.0
조정,3696372.0,3863326.0,14910093.0,13087462.0
영업활동으로 인한 자산부채의 변동,-555523.0,-1904634.0,-1588378.0,-5568962.0
이자의 수취,130077.0,173718.0,622118.0,890456.0
이자의 지급,-51058.0,-51979.0,-208010.0,-153195.0
배당금 수입,504.0,354253.0,903758.0,1914856.0
법인세 납부액,-1007100.0,-831514.0,-2234526.0,-3121565.0


# 재무제표 직접 읽기

In [15]:
url = 'http://dart.fss.or.kr/pdf/download/excel.do?rcp_no=20170515003806&dcm_no=5653406&lang=ko'
df = pd.read_excel(url, sheet_name='현금흐름표', index_col=0, skiprows=7)
df

Unnamed: 0,제 49 기 1분기,제 48 기 1분기,제 48 기,제 47 기
,,,,
영업활동 현금흐름,7087039.0,4086639.0,23984804.0,19287521.0
영업에서 창출된 현금흐름,8014616.0,4442161.0,24901464.0,19756969.0
당기순이익,4873767.0,2483469.0,11579749.0,12238469.0
조정,3696372.0,3863326.0,14910093.0,13087462.0
영업활동으로 인한 자산부채의 변동,-555523.0,-1904634.0,-1588378.0,-5568962.0
이자의 수취,130077.0,173718.0,622118.0,890456.0
이자의 지급,-51058.0,-51979.0,-208010.0,-153195.0
배당금 수입,504.0,354253.0,903758.0,1914856.0
법인세 납부액,-1007100.0,-831514.0,-2234526.0,-3121565.0


# 파일로 다운로드 하기

In [15]:
# 영어
!curl -o DART_SAMSUNG_1Q_REPORT.xls "http://dart.fss.or.kr/pdf/download/excel.do?rcp_no=20170515003806&dcm_no=5653406&lang=en"

# 한국어 
!curl -o DART_삼성전자_1분기_보고서.xls "http://dart.fss.or.kr/pdf/download/excel.do?rcp_no=20170515003806&dcm_no=5653406&lang=ko"

  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100 81920  100 81920    0     0   886k      0 --:--:-- --:--:-- --:--:--  888k
  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100 69120  100 69120    0     0   730k      0 --:--:-- --:--:-- --:--:--  733k


In [16]:
ls DART*.xls

DART_SAMSUNG_1Q_REPORT.xls  DART_삼성전자_1분기_보고서.xls


```
81,920 DART_SAMSUNG_1Q_REPORT.xls
69,120 DART_삼성전자_1분기_보고서.xls
```

# Summary
* 첨부파일 링크 구성하기
* 재무제표 엑셀 파일 저장, 읽기
* wget(): requests stream구현

----
### 2018 FinanceData.KR