# 7. ETF 데이터 수집

## 7.1 ETF란?

> ETF(상장지수펀드)는 기초지수의 성과를 추적하는 것이 목표인 인덱스펀드로, 거래소에 상장되어 있어서 개별주식과 마찬가지로 기존의 주식계좌를 통해 거래를 할 수 있습니다. 그 구성종목과 수량 등 자산구성내역(PDF)이 투명하게 공개되어 있고, 장중에는 실시간으로 순자산가치(NAV)가 제공되어 거래에 참고하실 수 있습니다. ETF는 1좌를 거래할 수 있는 최소한의 금액만으로 분산투자 효과를 누릴 수 있어 효율적인 투자수단이며, 펀드보다 운용보수가 낮고 주식에 적용되는 거래세도 붙지 않습니다.

- [출처 : 네이버 금융](https://finance.naver.com/sise/etf.nhn)

<br>

## 7.2 라이브러리 호출

In [1]:
import pandas as pd
import numpy as np
import requests

<br>

## 7.3 크롬 브라우저의 네트워크 정보를 통한 데이터 수집

### 7.3.1 수집할 URL

In [2]:
url = 'https://finance.naver.com/sise/etf.nhn'
url

'https://finance.naver.com/sise/etf.nhn'

<br>

### 7.3.2 Pandas를 통한 요청

In [3]:
pd.read_html(url)

[]

- 테이블 태그가 존재하지만 다음 url 주소의 response 값이 JSON 형태이다.

<br>

### 7.3.3 `requests`를 통한 HTTP 요청

In [9]:
url = 'https://finance.naver.com/api/sise/etfItemList.nhn?etfType=0&targetColumn=market_sum&sortOrder=desc'
url

'https://finance.naver.com/api/sise/etfItemList.nhn?etfType=0&targetColumn=market_sum&sortOrder=desc'

In [10]:
res = requests.get(url)
res

<Response [200]>

In [17]:
res.text

'{"resultCode":"success","result":{"etfItemList":[{"itemcode":"069500","etfTabCode":1,"itemname":"KODEX 200","nowVal":43130,"risefall":"2","changeVal":355,"changeRate":0.83,"nav":43214.0,"threeMonthEarnRate":39.9522,"quant":8521906,"amonut":366352,"marketSum":62625},{"itemcode":"102110","etfTabCode":1,"itemname":"TIGER 200","nowVal":42970,"risefall":"2","changeVal":360,"changeRate":0.84,"nav":43038.0,"threeMonthEarnRate":39.971,"quant":1650818,"amonut":70651,"marketSum":31347},{"itemcode":"252670","etfTabCode":3,"itemname":"KODEX 200선물인버스2X","nowVal":2055,"risefall":"5","changeVal":-35,"changeRate":-1.67,"nav":2051.0,"threeMonthEarnRate":-51.2821,"quant":642008913,"amonut":1329284,"marketSum":20227},{"itemcode":"122630","etfTabCode":3,"itemname":"KODEX 레버리지","nowVal":27825,"risefall":"2","changeVal":475,"changeRate":1.74,"nav":28022.0,"threeMonthEarnRate":92.0646,"quant":46157932,"amonut":1275107,"marketSum":19088},{"itemcode":"102780","etfTabCode":2,"itemname":"KODEX 삼성그룹","nowVal":10

<br>

### 7.3.4 JSON 타입으로 데이터 받기

In [18]:
etf_json = res.json()
etf_json

{'resultCode': 'success',
 'result': {'etfItemList': [{'itemcode': '069500',
    'etfTabCode': 1,
    'itemname': 'KODEX 200',
    'nowVal': 43130,
    'risefall': '2',
    'changeVal': 355,
    'changeRate': 0.83,
    'nav': 43214.0,
    'threeMonthEarnRate': 39.9522,
    'quant': 8521906,
    'amonut': 366352,
    'marketSum': 62625},
   {'itemcode': '102110',
    'etfTabCode': 1,
    'itemname': 'TIGER 200',
    'nowVal': 42970,
    'risefall': '2',
    'changeVal': 360,
    'changeRate': 0.84,
    'nav': 43038.0,
    'threeMonthEarnRate': 39.971,
    'quant': 1650818,
    'amonut': 70651,
    'marketSum': 31347},
   {'itemcode': '252670',
    'etfTabCode': 3,
    'itemname': 'KODEX 200선물인버스2X',
    'nowVal': 2055,
    'risefall': '5',
    'changeVal': -35,
    'changeRate': -1.67,
    'nav': 2051.0,
    'threeMonthEarnRate': -51.2821,
    'quant': 642008913,
    'amonut': 1329284,
    'marketSum': 20227},
   {'itemcode': '122630',
    'etfTabCode': 3,
    'itemname': 'KODEX 레버리지',


<br>

### 7.3.5 JSON에서 원하는 데이터 찾기

In [19]:
etf_json['resultCode']

'success'

In [22]:
etfItemList = etf_json['result']['etfItemList']
etfItemList

[{'itemcode': '069500',
  'etfTabCode': 1,
  'itemname': 'KODEX 200',
  'nowVal': 43130,
  'risefall': '2',
  'changeVal': 355,
  'changeRate': 0.83,
  'nav': 43214.0,
  'threeMonthEarnRate': 39.9522,
  'quant': 8521906,
  'amonut': 366352,
  'marketSum': 62625},
 {'itemcode': '102110',
  'etfTabCode': 1,
  'itemname': 'TIGER 200',
  'nowVal': 42970,
  'risefall': '2',
  'changeVal': 360,
  'changeRate': 0.84,
  'nav': 43038.0,
  'threeMonthEarnRate': 39.971,
  'quant': 1650818,
  'amonut': 70651,
  'marketSum': 31347},
 {'itemcode': '252670',
  'etfTabCode': 3,
  'itemname': 'KODEX 200선물인버스2X',
  'nowVal': 2055,
  'risefall': '5',
  'changeVal': -35,
  'changeRate': -1.67,
  'nav': 2051.0,
  'threeMonthEarnRate': -51.2821,
  'quant': 642008913,
  'amonut': 1329284,
  'marketSum': 20227},
 {'itemcode': '122630',
  'etfTabCode': 3,
  'itemname': 'KODEX 레버리지',
  'nowVal': 27825,
  'risefall': '2',
  'changeVal': 475,
  'changeRate': 1.74,
  'nav': 28022.0,
  'threeMonthEarnRate': 92.0646

In [23]:
len(etfItemList)

469

<br>

### 7.3.6 JSON 데이터를 pandas의 데이터프레임 형태로 만들기

In [27]:
df = pd.DataFrame(etfItemList)
df.shape

(469, 12)

In [28]:
df.head()

Unnamed: 0,itemcode,etfTabCode,itemname,nowVal,risefall,changeVal,changeRate,nav,threeMonthEarnRate,quant,amonut,marketSum
0,69500,1,KODEX 200,43130,2,355,0.83,43214.0,39.9522,8521906,366352,62625
1,102110,1,TIGER 200,42970,2,360,0.84,43038.0,39.971,1650818,70651,31347
2,252670,3,KODEX 200선물인버스2X,2055,5,-35,-1.67,2051.0,-51.2821,642008913,1329284,20227
3,122630,3,KODEX 레버리지,27825,2,475,1.74,28022.0,92.0646,46157932,1275107,19088
4,102780,2,KODEX 삼성그룹,10530,2,70,0.67,10545.0,37.6315,612363,6415,18522


In [29]:
df.tail()

Unnamed: 0,itemcode,etfTabCode,itemname,nowVal,risefall,changeVal,changeRate,nav,threeMonthEarnRate,quant,amonut,marketSum
464,285010,2,KBSTAR 200중공업,8485,2,20,0.24,8481.0,16.7586,282,2,22
465,334700,5,KBSTAR 팔라듐선물인버스(H),5495,2,30,0.55,,-1.5316,1816,9,22
466,267500,4,KBSTAR 미국장기국채선물인버스2X(합성 H),6030,2,30,0.5,,4.8951,4614,27,18
467,285020,2,KBSTAR 200철강소재,7245,2,25,0.35,7246.0,25.5652,3443,24,17
468,287320,2,KBSTAR 200산업재,10750,2,220,2.09,10776.0,33.1226,47,0,13


<br>

## 7.4 파일 저장

### 7.4.1 파일명 만들기

- 오늘 날짜를 가져오기 위해 `datetime` 사용

In [31]:
import datetime
today = datetime.datetime.today()
today = today.strftime('%Y-%m-%d')
today

'2021-02-03'

- f-string 방식으로 파일 이름 만들기

In [34]:
filename = f'etf_{today}_raw.csv'
filename

'etf_2021-02-03_raw.csv'

<br>

### 7.4.2 파일로 저장하고 불러오기

In [35]:
df.to_csv(filename, index=False)

In [37]:
pd.read_csv(filename, dtype={'itemcode': np.object}) # 종목코드 숫자형 변환 방지

Unnamed: 0,itemcode,etfTabCode,itemname,nowVal,risefall,changeVal,changeRate,nav,threeMonthEarnRate,quant,amonut,marketSum
0,069500,1,KODEX 200,43130,2,355,0.83,43214.0,39.9522,8521906,366352,62625
1,102110,1,TIGER 200,42970,2,360,0.84,43038.0,39.9710,1650818,70651,31347
2,252670,3,KODEX 200선물인버스2X,2055,5,-35,-1.67,2051.0,-51.2821,642008913,1329284,20227
3,122630,3,KODEX 레버리지,27825,2,475,1.74,28022.0,92.0646,46157932,1275107,19088
4,102780,2,KODEX 삼성그룹,10530,2,70,0.67,10545.0,37.6315,612363,6415,18522
...,...,...,...,...,...,...,...,...,...,...,...,...
464,285010,2,KBSTAR 200중공업,8485,2,20,0.24,8481.0,16.7586,282,2,22
465,334700,5,KBSTAR 팔라듐선물인버스(H),5495,2,30,0.55,,-1.5316,1816,9,22
466,267500,4,KBSTAR 미국장기국채선물인버스2X(합성 H),6030,2,30,0.50,,4.8951,4614,27,18
467,285020,2,KBSTAR 200철강소재,7245,2,25,0.35,7246.0,25.5652,3443,24,17
