## ETF란?
* ETF(상장지수펀드)는 기초지수의 성과를 추적하는 것이 목표인 인덱스펀드로, 거래소에 상장되어 있어서 개별주식과 마찬가지로 기존의 주식계좌를 통해 거래를 할 수 있습니다. 그 구성종목과 수량 등 자산구성내역(PDF)이 투명하게 공개되어 있고, 장중에는 실시간으로 순자산가치(NAV)가 제공되어 거래에 참고하실 수 있습니다. ETF는 1좌를 거래할 수 있는 최소한의 금액만으로 분산투자 효과를 누릴 수 있어 효율적인 투자수단이며, 펀드보다 운용보수가 낮고 주식에 적용되는 거래세도 붙지 않습니다. 
    * 출처 : [ETF : 네이버 금융](https://finance.naver.com/sise/etf.nhn)


## 크롬 브라우저의 네트워크 정보를 통한 데이터 수집
* json 데이터 수집과 파일저장 방법

* [ETF : 네이버 금융](https://finance.naver.com/sise/etf.nhn)



In [1]:
import pandas as pd
import numpy as np
import requests

In [2]:
url="https://finance.naver.com/api/sise/etfItemList.nhn"
print(url)

https://finance.naver.com/api/sise/etfItemList.nhn


## Pandas를 통한 요청

In [3]:
pd.read_html(url)
#안된다.

ValueError: No tables found

## JSON 

<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/c/c9/JSON_vector_logo.svg/300px-JSON_vector_logo.svg.png" width="100">

JSON(제이슨, JavaScript Object Notation)은 속성-값 쌍( attribute–value pairs and array data types (or any other serializable value)) 또는 "키-값 쌍"으로 이루어진 데이터 오브젝트를 전달하기 위해 인간이 읽을 수 있는 텍스트를 사용하는 개방형 표준 포맷이다. 비동기 브라우저/서버 통신 (AJAX)을 위해, 넓게는 XML(AJAX가 사용)을 대체하는 주요 데이터 포맷이다. 특히, 인터넷에서 자료를 주고 받을 때 그 자료를 표현하는 방법으로 알려져 있다. 자료의 종류에 큰 제한은 없으며, 특히 컴퓨터 프로그램의 변수값을 표현하는 데 적합하다.
본래는 자바스크립트 언어로부터 파생되어 자바스크립트의 구문 형식을 따르지만 언어 독립형 데이터 포맷이다. 즉, 프로그래밍 언어나 플랫폼에 독립적이므로, 구문 분석 및 JSON 데이터 생성을 위한 코드는 C, C++, C#, 자바, 자바스크립트, 펄, 파이썬 등 수많은 프로그래밍 언어에서 쉽게 이용할 수 있다.

* 출처 : [JSON - 위키백과, 우리 모두의 백과사전](https://ko.wikipedia.org/wiki/JSON)

## requests를 통한 HTTP 요청
* [Requests: HTTP for Humans™ — Requests documentation](https://requests.readthedocs.io/en/master/)

In [4]:
import requests

In [5]:
response=requests.get(url)
response

<Response [200]>

In [6]:
response.text

'{"resultCode":"success","result":{"etfItemList":[{"itemcode":"069500","etfTabCode":1,"itemname":"KODEX 200","nowVal":43955,"risefall":"2","changeVal":220,"changeRate":0.5,"nav":44047.0,"threeMonthEarnRate":7.4517,"quant":2655205,"amonut":116819,"marketSum":39933},{"itemcode":"153130","etfTabCode":6,"itemname":"KODEX 단기채권","nowVal":102805,"risefall":"5","changeVal":-10,"changeRate":-0.01,"nav":102803.0,"threeMonthEarnRate":0.0535,"quant":22011,"amonut":2262,"marketSum":24415},{"itemcode":"252670","etfTabCode":3,"itemname":"KODEX 200선물인버스2X","nowVal":1845,"risefall":"5","changeVal":-15,"changeRate":-0.81,"nav":1844.0,"threeMonthEarnRate":-15.262,"quant":146475126,"amonut":269418,"marketSum":22304},{"itemcode":"102110","etfTabCode":1,"itemname":"TIGER 200","nowVal":43985,"risefall":"2","changeVal":215,"changeRate":0.49,"nav":44081.0,"threeMonthEarnRate":7.4928,"quant":530566,"amonut":23370,"marketSum":22036},{"itemcode":"102780","etfTabCode":2,"itemname":"KODEX 삼성그룹","nowVal":10285,"rise

In [7]:
headers={"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.114 Safari/537.36"}

### JSON 타입으로 데이터 받기

In [8]:
etf_json=response.json()

### JSON 에서 원하는 데이터 찾기

In [9]:
etfItemList=etf_json["result"]["etfItemList"]
etfItemList

[{'itemcode': '069500',
  'etfTabCode': 1,
  'itemname': 'KODEX 200',
  'nowVal': 43955,
  'risefall': '2',
  'changeVal': 220,
  'changeRate': 0.5,
  'nav': 44047.0,
  'threeMonthEarnRate': 7.4517,
  'quant': 2655205,
  'amonut': 116819,
  'marketSum': 39933},
 {'itemcode': '153130',
  'etfTabCode': 6,
  'itemname': 'KODEX 단기채권',
  'nowVal': 102805,
  'risefall': '5',
  'changeVal': -10,
  'changeRate': -0.01,
  'nav': 102803.0,
  'threeMonthEarnRate': 0.0535,
  'quant': 22011,
  'amonut': 2262,
  'marketSum': 24415},
 {'itemcode': '252670',
  'etfTabCode': 3,
  'itemname': 'KODEX 200선물인버스2X',
  'nowVal': 1845,
  'risefall': '5',
  'changeVal': -15,
  'changeRate': -0.81,
  'nav': 1844.0,
  'threeMonthEarnRate': -15.262,
  'quant': 146475126,
  'amonut': 269418,
  'marketSum': 22304},
 {'itemcode': '102110',
  'etfTabCode': 1,
  'itemname': 'TIGER 200',
  'nowVal': 43985,
  'risefall': '2',
  'changeVal': 215,
  'changeRate': 0.49,
  'nav': 44081.0,
  'threeMonthEarnRate': 7.4928,
  '

## 데이터프레임 변환
### JSON 데이터를 pandas 의 데이터프레임 형태로 만들기

In [10]:
df=pd.DataFrame(etfItemList)
df

Unnamed: 0,itemcode,etfTabCode,itemname,nowVal,risefall,changeVal,changeRate,nav,threeMonthEarnRate,quant,amonut,marketSum
0,069500,1,KODEX 200,43955,2,220,0.50,44047.0,7.4517,2655205,116819,39933
1,153130,6,KODEX 단기채권,102805,5,-10,-0.01,102803.0,0.0535,22011,2262,24415
2,252670,3,KODEX 200선물인버스2X,1845,5,-15,-0.81,1844.0,-15.2620,146475126,269418,22304
3,102110,1,TIGER 200,43985,2,215,0.49,44081.0,7.4928,530566,23370,22036
4,102780,2,KODEX 삼성그룹,10285,2,15,0.15,10323.0,7.4492,265587,2741,18852
...,...,...,...,...,...,...,...,...,...,...,...,...
477,306540,6,HANARO 단기통안채,103070,3,0,0.00,103077.0,0.0776,0,0,23
478,267500,4,KBSTAR 미국장기국채선물인버스2X(합성 H),6360,5,-45,-0.70,,-6.1539,5110,32,22
479,287310,2,KBSTAR 200경기소비재,12455,2,40,0.32,12529.0,9.1716,561,6,17
480,287320,2,KBSTAR 200산업재,13415,2,165,1.25,13490.0,16.4630,1585,21,16


### 데이터 확인

In [11]:
df.head()

Unnamed: 0,itemcode,etfTabCode,itemname,nowVal,risefall,changeVal,changeRate,nav,threeMonthEarnRate,quant,amonut,marketSum
0,69500,1,KODEX 200,43955,2,220,0.5,44047.0,7.4517,2655205,116819,39933
1,153130,6,KODEX 단기채권,102805,5,-10,-0.01,102803.0,0.0535,22011,2262,24415
2,252670,3,KODEX 200선물인버스2X,1845,5,-15,-0.81,1844.0,-15.262,146475126,269418,22304
3,102110,1,TIGER 200,43985,2,215,0.49,44081.0,7.4928,530566,23370,22036
4,102780,2,KODEX 삼성그룹,10285,2,15,0.15,10323.0,7.4492,265587,2741,18852


In [12]:
df.tail()

Unnamed: 0,itemcode,etfTabCode,itemname,nowVal,risefall,changeVal,changeRate,nav,threeMonthEarnRate,quant,amonut,marketSum
477,306540,6,HANARO 단기통안채,103070,3,0,0.0,103077.0,0.0776,0,0,23
478,267500,4,KBSTAR 미국장기국채선물인버스2X(합성 H),6360,5,-45,-0.7,,-6.1539,5110,32,22
479,287310,2,KBSTAR 200경기소비재,12455,2,40,0.32,12529.0,9.1716,561,6,17
480,287320,2,KBSTAR 200산업재,13415,2,165,1.25,13490.0,16.463,1585,21,16
481,334700,5,KBSTAR 팔라듐선물인버스(H),4535,5,-25,-0.55,,-3.7975,115,0,14


## 파일 저장
### 파일명 만들기

In [13]:
import datetime

today=datetime.datetime.today().strftime("%Y-%m-%d")
today

'2021-06-26'

In [14]:
file_name=f"etf_{today}_raw.csv"
file_name

'etf_2021-06-26_raw.csv'

### 파일로 저장하고 불러오기

In [15]:
df.to_csv(file_name,index=False)

In [16]:
pd.read_csv("etf_2021-06-26_raw.csv")

Unnamed: 0,itemcode,etfTabCode,itemname,nowVal,risefall,changeVal,changeRate,nav,threeMonthEarnRate,quant,amonut,marketSum
0,69500,1,KODEX 200,43955,2,220,0.50,44047.0,7.4517,2655205,116819,39933
1,153130,6,KODEX 단기채권,102805,5,-10,-0.01,102803.0,0.0535,22011,2262,24415
2,252670,3,KODEX 200선물인버스2X,1845,5,-15,-0.81,1844.0,-15.2620,146475126,269418,22304
3,102110,1,TIGER 200,43985,2,215,0.49,44081.0,7.4928,530566,23370,22036
4,102780,2,KODEX 삼성그룹,10285,2,15,0.15,10323.0,7.4492,265587,2741,18852
...,...,...,...,...,...,...,...,...,...,...,...,...
477,306540,6,HANARO 단기통안채,103070,3,0,0.00,103077.0,0.0776,0,0,23
478,267500,4,KBSTAR 미국장기국채선물인버스2X(합성 H),6360,5,-45,-0.70,,-6.1539,5110,32,22
479,287310,2,KBSTAR 200경기소비재,12455,2,40,0.32,12529.0,9.1716,561,6,17
480,287320,2,KBSTAR 200산업재,13415,2,165,1.25,13490.0,16.4630,1585,21,16
