## 데이터 확인
다음 금융의 삼정전자 페이지로 이동해서 가져오려는 데이터를 확인합니다.
**실행하는 시점에 따라 일봉은 변경될 수 있습니다.**
- https://finance.daum.net/quotes/A005930#home

<img src="image/00.png" width="450" height="300" />

삼성전자 페이지로 get 메서드를 사용해서 HTML을 가져오더라도 과거 일봉 데이터들을 찾을 수 없습니다. 

## 데이터 분석
크롬 개발자 도구를 실행하고 새로고침 (F5)을 눌러 페이지를 다시 로딩합니다. 주고 받은 요청과 응답에 최근 종가 (48,800원)를 검색합니다. 
48,800을 검색하니 아무것도 나오지 않아 48800으로 콤마없이 검색했습니다. A005930, days, ranks, sectors 요청에서 종가가 검색되는 것을 알 수 있습니다. 크롬 개발자 도구에서 각각 Response를 확인해 봅시다.

<img src="image/01.png" width="200" height="250" />

#### A005930
종목 summary로 간단한 가격 정보와 사업 내용 등을 조회합니다. 이는 페이지 상단의 투자 정보를 표현하는데 사용됩니다.

<img src="image/02.png" width="170" height="120" />

#### ranks
10개의 조회 급등 종목의 등락폭을 표현합니다.

<img src="image/03.png" width="180" height="130" />

#### sectors
동일 섹터 정보를 출력합니다. 

<img src="image/04.png" width="500" height="250" />

#### days
일봉 데이터가 들어 있는 것을 알 수 있습니다. Headers Tab을 살펴보면 GET 메서드로 데이터를 요청하는 것을 알 수있습니다. 

<img src="image/05.png" width="500" height="250" />

그 결과 거래량과 종가 등이 JSON(파이썬 딕셔너리 형태의 문자열)으로 전달 됩니다

<img src="image/06.png" width="700" height="70" />

## 데이터 요청
크롬 개발자 도구에서 분석한 요청사항을 파이썬으로 표현합니다. headers 변수에는 개발자 도구의 Requests Headers에 있는 항목을 딕셔너리로 표현하면 됩니다. 이때 HTTP 프로토콜이 지원하지 않는 ":"으로 시작하는 내용은 제외합니다. 아래 코드는 불필요한 값을 하나씩 지워가며 정리한 최종 결과입니다.

In [5]:
import requests

url = "https://finance.daum.net/api/investor/days?perPage=5&symbolCode=A005930"

headers = {
    "referer": "https://finance.daum.net/quotes/A005930?fbclid=IwAR270kGKgrdlmg3x1r7OhmG_ZhMA620Z4bWTIIDw7TH2zuKAzFEZxKWPHXk",
    "user-agent": "Mozilla/5.0"
}
resp = requests.get(url, headers=headers)

result = resp.json()
print(result)

{'data': [{'date': '2020-05-08 00:00:00', 'foreignOwnShares': 3285225824, 'foreignOwnSharesRate': 0.5503, 'foreignStraightPurchaseVolume': -2215231, 'institutionStraightPurchaseVolume': 1042243, 'institutionCumulativeStraightPurchaseVolume': -25718190, 'tradePrice': 48800.0, 'changePrice': 0.0, 'change': 'EVEN', 'accTradeVolume': 15267540, 'accTradePrice': 749723387270}, {'date': '2020-05-07 00:00:00', 'foreignOwnShares': 3287441055, 'foreignOwnSharesRate': 0.5507, 'foreignStraightPurchaseVolume': -1436754, 'institutionStraightPurchaseVolume': 101232, 'institutionCumulativeStraightPurchaseVolume': -26760433, 'tradePrice': 48800.0, 'changePrice': 400.0, 'change': 'FALL', 'accTradeVolume': 13799449, 'accTradePrice': 675508321160}, {'date': '2020-05-06 00:00:00', 'foreignOwnShares': 3288439782, 'foreignOwnSharesRate': 0.5508, 'foreignStraightPurchaseVolume': -1676942, 'institutionStraightPurchaseVolume': 999598, 'institutionCumulativeStraightPurchaseVolume': -26861665, 'tradePrice': 49200

## 데이터 파싱
서버가 반환하는 데이터가 HTML이 아니라 JSON(딕셔너리 형태의 문자열)입니다. 따라서 BeautifulSoup 모듈을 사용할 필요 없이 Response 객체의 json() 메서드로 딕셔너리 변환했습니다. 반복문으로 데이터를 하나씩 출력하면 다음과 같습니다. 

In [6]:
for item in result['data']:
    print(item['date'], item['tradePrice'], item['accTradeVolume'])

2020-05-08 00:00:00 48800.0 15267540
2020-05-07 00:00:00 48800.0 13799449
2020-05-06 00:00:00 49200.0 18008881
2020-05-04 00:00:00 48500.0 26013124
2020-04-29 00:00:00 50000.0 15558753


일자 / 가격 / 거래량이 출렵됩니다.

5일의 데이터가 출력됐습니다. 더 많은 데이터를 조회할 수 없을까? 라는 생각으로 서버로 요청한 내용을 분석해 봅시다.

In [8]:
url = "https://finance.daum.net/api/investor/days?perPage=5&symbolCode=A005930"

url은 다음과 같이 해석 됩니다.  
- https://finance.daum.net/api/investor/days 서버로 데이터를 요청함  
- 이 때 다음 값을 전달 : perPage=5, symbolCode=A005930
여기서 symbolCode는 티커를 의미하며 perPage의 변수가 요청하는 데이터의 갯수임을 알 수 있습니다.

url에서 perPage의 값을 10으로 변경하고 다음 코드를 실행하면 10개의 결과가 출력됩니다.

In [10]:
import requests

url = "https://finance.daum.net/api/investor/days?perPage=10&symbolCode=A005930"

headers = {
    "referer": "https://finance.daum.net/quotes/A005930?fbclid=IwAR270kGKgrdlmg3x1r7OhmG_ZhMA620Z4bWTIIDw7TH2zuKAzFEZxKWPHXk",
    "user-agent": "Mozilla/5.0"
}
resp = requests.get(url, headers=headers)

result = resp.json()

for item in result['data']:
    print(item['date'], item['tradePrice'], item['accTradeVolume'])

2020-05-08 00:00:00 48800.0 15267540
2020-05-07 00:00:00 48800.0 13799449
2020-05-06 00:00:00 49200.0 18008881
2020-05-04 00:00:00 48500.0 26013124
2020-04-29 00:00:00 50000.0 15558753
2020-04-28 00:00:00 50100.0 16062110
2020-04-27 00:00:00 49850.0 14007456
2020-04-24 00:00:00 49350.0 15555003
2020-04-23 00:00:00 49850.0 18651296
2020-04-22 00:00:00 49850.0 18539460


url과 요청하는 데이터를 분리해서 코드를 정리할 수도 있습니다. url의 요청 변수들을 딕셔너리로 변경하고 이를 get 메서드의 params 파라미터로 전달합니다

In [11]:
import requests

url = "https://finance.daum.net/api/investor/days"

params = {
    "perPage": 10,
    "symbolCode": "A005930"
}

headers = {
    "referer": "https://finance.daum.net/quotes/A005930?fbclid=IwAR270kGKgrdlmg3x1r7OhmG_ZhMA620Z4bWTIIDw7TH2zuKAzFEZxKWPHXk",
    "user-agent": "Mozilla/5.0"
}
resp = requests.get(url, headers=headers, params=params)

result = resp.json()

for item in result['data']:
    print(item['date'], item['tradePrice'], item['accTradeVolume'])

2020-05-08 00:00:00 48800.0 15267540
2020-05-07 00:00:00 48800.0 13799449
2020-05-06 00:00:00 49200.0 18008881
2020-05-04 00:00:00 48500.0 26013124
2020-04-29 00:00:00 50000.0 15558753
2020-04-28 00:00:00 50100.0 16062110
2020-04-27 00:00:00 49850.0 14007456
2020-04-24 00:00:00 49350.0 15555003
2020-04-23 00:00:00 49850.0 18651296
2020-04-22 00:00:00 49850.0 18539460
