### Daum Exchange
- `https://finance.daum.net`
- 어떤 내용을 살펴볼 것이냐?
  - 서버에서 어뷰징을 막는 경우 해결 방법 >> 완벽한 해결 방법은 아니지만 이런 방법으로 해결해서 데이터를 크롤링할 수 있다.

다음에서 제공해주는 환율데이터

In [1]:
import warnings
warnings.filterwarnings('ignore')
import pandas as pd
import requests

# 크롤링

## 동적 데이터를 크롤링하는 전체 절차
- 1. 웹 서비스 분석 : URL

- 2. request(URL) > response : json(str)

- 3. json(str) > list, dict > DataFrame

In [11]:
# - 1. 웹 서비스 분석 : URL
url = 'https://finance.daum.net/api/exchanges/summaries'

# - 2. request(URL) > response : json(str)
response = requests.get(url)
response
# - 3. json(str) > list, dict > DataFrame


<Response [403]>

In [12]:
# 403 에러는 200번대가 나오지 않으면 정상적으로 리퀘, 리스폰이 응답하지 않은 거임
# 나는 정상적으로 요청했는데 서버 개발자가 막아놨구나 어뷰징을 막았구나 
# 유저 에이전트를 확인해서 막는 방법? 정상적인 유저 에이전트가 아닌, 파이썬이란 유저 에이전트가 들어간 경우 막아놓는 그런...
# 그래서 유저 에이전트를 추가해서 요청해야해. >> 데이터를 요청할 때 헤더 정보를 출력
response.text

'<html>\r\n<head><title>403 Forbidden</title></head>\r\n<body bgcolor="white">\r\n<center><h1>403 Forbidden</h1></center>\r\n<hr><center>nginx</center>\r\n</body>\r\n</html>\r\n'

In [13]:
# - 1. 웹 서비스 분석 : URL
url = 'https://finance.daum.net/api/exchanges/summaries'
headers = {
  'user-agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/109.0.0.0 Safari/537.36', # 서버쪽에선 유저에이전트만 막아놨다면 이것만 해도 실행됨. 근데 유저에이전트와 레퍼러까지 추가해야 200번이 나옴.
  'referer' : 'https://finance.daum.net/exchanges', # 어 유저에이전트 추가해봤는데 안되네? 아 그럼 레퍼러 추가해보자. 아 다음 서버 개발자들은 유저에이전트와 레퍼러를 막아놨구나 그래서 직접 해봐야 안다. 코드 알려달라 해도 안 알려주잖아? 
}
# - 2. request(URL) > response : json(str)
response = requests.get(url, headers=headers)
# - 3. json(str) > list, dict > DataFrame
df = pd.DataFrame(response.json()['data'])
df.tail(2)

Unnamed: 0,symbolCode,date,currencyCode,currencyName,currencyUnit,country,region,name,recurrenceCount,basePrice,...,changeRate,cashBuyingPrice,cashSellingPrice,ttBuyingPrice,ttSellingPrice,tcBuyingPrice,fcSellingPrice,exchangeCommission,usDollarRate,chartImageUrl
40,FRX.KRWQAR,2023-02-16 15:06:51,QAR,리얄,1,카타르,"{'korName': '중동', 'engName': 'Middle East'}",카타르 (KRW/QAR),521,351.84,...,0.002806,0.0,0.0,0.0,0.0,,,3.355,0.2741,{'day': 'https://t1.daumcdn.net/finance/chart/...
41,FRX.KRWTRY,2023-02-16 15:06:51,TRY,리라,1,터키,"{'korName': '중동', 'engName': 'Middle East'}",터키 (KRW/TRY),521,68.08,...,0.002783,0.0,0.0,67.34,68.82,,,26.4,0.053,{'day': 'https://t1.daumcdn.net/finance/chart/...


In [19]:
# 403 에러는 200번대가 나오지 않으면 정상적으로 리퀘, 리스폰이 응답하지 않은 거임
# 나는 정상적으로 요청했는데 서버 개발자가 막아놨구나 어뷰징을 막았구나 
# 유저 에이전트를 확인해서 막는 방법? 정상적인 유저 에이전트가 아닌, 파이썬이란 유저 에이전트가 들어간 경우 막아놓는 그런...
# 그래서 유저 에이전트를 추가해서 요청해야해. >> 데이터를 요청할 때 헤더 정보를 출력
response.text[:5000]

'{"data":[{"symbolCode":"FRX.KRWUSD","date":"2023-02-16 15:06:51","currencyCode":"USD","currencyName":"달러","currencyUnit":1,"country":"미국","region":{"korName":"아메리카","engName":"America"},"name":"미국 (KRW/USD)","recurrenceCount":521,"basePrice":1283.4,"change":"FALL","changePrice":3.6,"changeRate":0.0027972028,"cashBuyingPrice":1305.85,"cashSellingPrice":1260.95,"ttBuyingPrice":1270.9,"ttSellingPrice":1295.9,"tcBuyingPrice":null,"fcSellingPrice":null,"exchangeCommission":6.4139,"usDollarRate":1.0,"chartImageUrl":{"day":"https://t1.daumcdn.net/finance/chart/kr/daumforex/d/FRX.KRWUSD.png","month":"https://t1.daumcdn.net/finance/chart/kr/daumforex/m/FRX.KRWUSD.png","month3":"https://t1.daumcdn.net/finance/chart/kr/daumforex/m3/FRX.KRWUSD.png","year":"https://t1.daumcdn.net/finance/chart/kr/daumforex/y/FRX.KRWUSD.png"}},{"symbolCode":"FRX.KRWJPY","date":"2023-02-16 15:06:51","currencyCode":"JPY","currencyName":"엔","currencyUnit":100,"country":"일본","region":{"korName":"아시아","engName":"Asia"},

In [14]:
# colums가 22개인데 너무 많아서 ...으로 나온다 전체로 보고 싶으면?
pd.options.display.max_columns = 30

In [15]:
df.tail(2)

Unnamed: 0,symbolCode,date,currencyCode,currencyName,currencyUnit,country,region,name,recurrenceCount,basePrice,change,changePrice,changeRate,cashBuyingPrice,cashSellingPrice,ttBuyingPrice,ttSellingPrice,tcBuyingPrice,fcSellingPrice,exchangeCommission,usDollarRate,chartImageUrl
40,FRX.KRWQAR,2023-02-16 15:06:51,QAR,리얄,1,카타르,"{'korName': '중동', 'engName': 'Middle East'}",카타르 (KRW/QAR),521,351.84,FALL,0.99,0.002806,0.0,0.0,0.0,0.0,,,3.355,0.2741,{'day': 'https://t1.daumcdn.net/finance/chart/...
41,FRX.KRWTRY,2023-02-16 15:06:51,TRY,리라,1,터키,"{'korName': '중동', 'engName': 'Middle East'}",터키 (KRW/TRY),521,68.08,FALL,0.19,0.002783,0.0,0.0,67.34,68.82,,,26.4,0.053,{'day': 'https://t1.daumcdn.net/finance/chart/...


In [16]:
pd.options.display.max_rows = 1000 # 이러면 1000행이 다출력됨 물론 1000개가 넘어가면 ...으로 나온다.