## 비동기호출 + Fake-UserAgent 

- 다음에서 주식의 인기검색어를 1~10위까지 스크랩핑
- 비동기 통신으로 요청정보를 보내야 하는 경우
- 스크랩핑을 하는 과정에서 403오류가 발생하는 경우
- 코드에서 요청하는 것과 브라우져를 통한 요청을 구분하는 경우
- Fake Header 정보(가상으로 User-Agent, referer 생성)
- pip install fake-useragent

In [1]:
import json
import urllib.request as req

In [2]:
# 다음 주식 요청 URL
url = "https://finance.daum.net/"

# 요청
res = req.urlopen(req.Request(url)).read().decode('utf-8')
print(res)

<!DOCTYPE html>
<html lang="ko">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<meta http-equiv="X-UA-Compatible" content="IE=edge" />
<link rel="shortcut icon" href="//finance.daum.net/favicon.ico" type="image/x-icon" />

<title>Daum 금융  </title>

<link rel="stylesheet" type="text/css" href="/dist/common.css?v=1564647773" />
<link rel="stylesheet" type="text/css" href="/dist/custom.ui.css?v=1564647773" />

<script>
    window.REQUEST_URI = '/home';
    window.CURRENT_URL = encodeURIComponent(
        "".concat(
            window.location.protocol,
            "//",
            window.location.host,
            window.location.pathname,
            window.location.search
        )
    );
    window.FINANCE = {};
    window.FINANCE.BASE_URL = '/dist';
    window.FINANCE.VERSION = '1564647773';
    window.FINANCE.API_URL = '';
    window.FINANCE.HOST = '//finance.daum.net';
    window._REALTIME_HOST = 'wss://realtime-front-df.dunamu.com/websocket';
    win

In [3]:
url = "http://finance.daum.net/api/search/ranks?limit=10"

# 요청
res = req.urlopen(req.Request(url)).read().decode('utf-8')

# HTTPError: HTTP Error 403: Forbidden

HTTPError: HTTP Error 403: Forbidden

In [4]:
from fake_useragent import UserAgent

In [5]:
# Fake Header 정보(가상으로 User-Agent 생성)
ua = UserAgent()

# 헤더 선언
headers = {
    'User-Agent': ua.ie,
    'referer': 'https://finance.daum.net/'
}

# 다음 주식 요청 URL
url = "https://finance.daum.net/api/search/ranks?limit=10"

# 요청
res = req.urlopen(req.Request(url, headers=headers)).read().decode('utf-8')

# 응답 데이터 확인(Json Data)
print('res', res)

res {"data":[{"rank":1,"rankChange":0,"symbolCode":"A215600","code":"KR7215600008","name":"신라젠","tradePrice":31200,"change":"LOWER_LIMIT","changePrice":13350,"changeRate":0.2996632997,"chartSlideImage":null,"isNew":true},{"rank":2,"rankChange":-1,"symbolCode":"A005360","code":"KR7005360003","name":"모나미","tradePrice":6270,"change":"RISE","changePrice":740,"changeRate":0.1338155515,"chartSlideImage":null,"isNew":false},{"rank":3,"rankChange":-1,"symbolCode":"A005930","code":"KR7005930003","name":"삼성전자","tradePrice":44700,"change":"FALL","changePrice":500,"changeRate":0.0110619469,"chartSlideImage":null,"isNew":false},{"rank":4,"rankChange":0,"symbolCode":"A002070","code":"KR7002070001","name":"남영비비안","tradePrice":29650,"change":"RISE","changePrice":2000,"changeRate":0.0723327306,"chartSlideImage":null,"isNew":false},{"rank":5,"rankChange":1,"symbolCode":"A078130","code":"KR7078130002","name":"국일제지","tradePrice":5180,"change":"RISE","changePrice":10,"changeRate":0.001934236,"chartSlideIma

In [6]:
# 응답 데이터 str -> json 변환 및 data 값 저장
rank_json = json.loads(res)['data']

# 중간 확인
print('중간 확인 : ', rank_json, '\n')

중간 확인 :  [{'rank': 1, 'rankChange': 0, 'symbolCode': 'A215600', 'code': 'KR7215600008', 'name': '신라젠', 'tradePrice': 31200, 'change': 'LOWER_LIMIT', 'changePrice': 13350, 'changeRate': 0.2996632997, 'chartSlideImage': None, 'isNew': True}, {'rank': 2, 'rankChange': -1, 'symbolCode': 'A005360', 'code': 'KR7005360003', 'name': '모나미', 'tradePrice': 6270, 'change': 'RISE', 'changePrice': 740, 'changeRate': 0.1338155515, 'chartSlideImage': None, 'isNew': False}, {'rank': 3, 'rankChange': -1, 'symbolCode': 'A005930', 'code': 'KR7005930003', 'name': '삼성전자', 'tradePrice': 44700, 'change': 'FALL', 'changePrice': 500, 'changeRate': 0.0110619469, 'chartSlideImage': None, 'isNew': False}, {'rank': 4, 'rankChange': 0, 'symbolCode': 'A002070', 'code': 'KR7002070001', 'name': '남영비비안', 'tradePrice': 29650, 'change': 'RISE', 'changePrice': 2000, 'changeRate': 0.0723327306, 'chartSlideImage': None, 'isNew': False}, {'rank': 5, 'rankChange': 1, 'symbolCode': 'A078130', 'code': 'KR7078130002', 'name': '국일

In [7]:
for elm in rank_json:
    # print(type(elm)) #Type 확인
    print('순위 : {}, 금액 : {}, 회사명 : {}'.format(
    elm['rank'], elm['tradePrice'], elm['name']), )


순위 : 1, 금액 : 31200, 회사명 : 신라젠
순위 : 2, 금액 : 6270, 회사명 : 모나미
순위 : 3, 금액 : 44700, 회사명 : 삼성전자
순위 : 4, 금액 : 29650, 회사명 : 남영비비안
순위 : 5, 금액 : 5180, 회사명 : 국일제지
순위 : 6, 금액 : 167000, 회사명 : 셀트리온
순위 : 7, 금액 : 73200, 회사명 : 솔브레인
순위 : 8, 금액 : 9330, 회사명 : 파미셀
순위 : 9, 금액 : 9310, 회사명 : 램테크놀러지
순위 : 10, 금액 : 9300, 회사명 : 후성
