# requests

requests는 브라우저 없이 파이썬에서 다이렉트로 서버에 http 요청을 넣습니다.

요청을 받은 페이지는 해당 페이지의 소스코드를 파이썬 내부로 전송해줍니다.

단, 버튼 클릭이나 광고 닫기 등의 작업은 애초에 브라우저가 없기때문에 불가능하고

오로지 특정 주소로 접속했을때 최초에 전송되는 페이지 코드만 가져올 수 있습니다.

대신 물리 브라우저를 직접 켜지 않고, 명목상으로 요청만 하기 때문에

속도나 리소스면에서는 훨씬 우월합니다.

- 1. 내가 브자우저로 특정 서버 주소를 쳐서 접속시도를 합니다.
- 2. 서버에 내가 접속한다는 요청이 들어갑니다.
- 3. 서버가 요청에 응답 하면서 response 데이터를 함께 전송합니다.
- 4. 브라우저가 받은 데이터를 해석해서 내 PC에 반영합니다.
     
     ▶웹 사이트 접속이었으면 소스코드를 받아와서
       사람이 볼 수 있도록 자동으로 그려줍니다.( 랜더링 해줍니다.)

     ▶게임이면 해당 명령어가 들어가서 게임 상황에 반영됩니다.

In [1]:
# requests, beautifulsoup, time 임포트
import requests
from bs4 import BeautifulSoup
import time

In [2]:
# 특정 주소에 대한 요청은 requests.get("주소") 로 합니다.
# 요청에 대한 서버의 응답 (response)는 req 변수에 저장했습니다.
req = requests.get("https://www.naver.com")

In [4]:
# http 소스코드 읽어오기 (selenium 의 .text와 문법은 같으나 기능이 다름에 주의)
# req.text를 이용하면 셀레니움의 driver.page_source와 동일한 코드를 받아옵니다.
req.text
source = req.text

In [6]:
# http 헤더 가져오기
# 요청에 따른 상세 정보를 보여줍니다. 지금은 이런게 있다는것만 체크해주세요.
req.headers

{'Server': 'NWS', 'Date': 'Fri, 14 Oct 2022 01:43:28 GMT', 'Content-Type': 'text/html; charset=UTF-8', 'Transfer-Encoding': 'chunked', 'Connection': 'keep-alive', 'Set-Cookie': 'PM_CK_loc=eeb1b259a03c465783af0c5c528ee7b7f75400c8075582247a7d434d73103936; Expires=Sat, 15 Oct 2022 01:43:28 GMT; Path=/; HttpOnly', 'Cache-Control': 'no-cache, no-store, must-revalidate', 'Pragma': 'no-cache', 'P3P': 'CP="CAO DSP CURa ADMa TAIa PSAa OUR LAW STP PHY ONL UNI PUR FIN COM NAV INT DEM STA PRE"', 'X-Frame-Options': 'DENY', 'X-XSS-Protection': '1; mode=block', 'Content-Encoding': 'gzip', 'Strict-Transport-Security': 'max-age=63072000; includeSubdomains', 'Referrer-Policy': 'unsafe-url'}

In [7]:
# http 상태코드 가져오기
# 200은 정상접속을 나타낸다.

req.status_code

200

#### 그림으로 배우는 HTTP & Network basic 책
#### 성공과 실패를 결정하는 1%의 네트워크 원리 책
#### HTTP 완벽 가이드

# 알라딘 베스트셀러 7페이지

1. requests를 이용해서 해 주세요.
2. beautifulsoup 구간부터는 selenium을 활용한 크롤링과 차이가 없습니다.

In [8]:
from bs4 import BeautifulSoup
from selenium import webdriver
import requests
import time

In [9]:
# 요정할 페이지 입력
req = requests.get("https://www.aladin.co.kr/shop/common/wbest.aspx?BestType=Bestseller&BranchType=1&CID=0&page=7&cnt=1000&SortOrder=1")

In [10]:
# reponse 받은 소스를 변수에 저장
source = req.text

In [13]:
# 파싱
parsed_source = BeautifulSoup(source, "html.parser")
# 책에 대한 정보 가져오기
div_books_list= parsed_source.find_all("div", class_="ss_book_box")

# 
for books in div_books_list:
    li_books_list = books.find_all("li")
    
    if(li_books_list[1].text[0] == '['):
        print(li_books_list[1].text)
        print(li_books_list[2].text)
        print(li_books_list[3].text)
    else:
        print(li_books_list[0].text)
        print(li_books_list[1].text)
        print(li_books_list[2].text)
print("------------------------------------------------------")

[국내도서] 세상 쉬운 영문법 
윤여홍 (지은이) | 시간과공간사 | 2022년 10월
19,800원 → 17,820원 (10%할인),  마일리지 990원 (5% 적립)
[국내도서] 어떻게 말해줘야 할까 (60만 부 기념 한정판 리커버) 
오은영 (지은이), 차상미 (그림) | 김영사 | 2022년 7월
17,500원 → 15,750원 (10%할인),  마일리지 870원 (5% 적립)
[국내도서] 브라질에 비가 내리면 스타벅스 주식을 사라 
피터 나바로 (지은이), 이창식 (옮긴이), 윤지호 (감수) | 에프엔미디어 | 2022년 4월
18,000원 → 16,200원 (10%할인),  마일리지 900원 (5% 적립)
[국내도서] 재수사 2  
장강명 (지은이) | 은행나무 | 2022년 8월
16,000원 → 14,400원 (10%할인),  마일리지 800원 (5% 적립)
[국내도서] 뇌, 욕망의 비밀을 풀다  
한스-게오르크 호이젤 (지은이), 강영옥, 김신종, 한윤진 (옮긴이) | 비즈니스북스 | 2019년 10월
18,000원 → 16,200원 (10%할인),  마일리지 900원 (5% 적립)
[국내도서] 임신 출산 육아 대백과 (2022~2023년 개정판) 
삼성출판사 편집부 (엮은이) | 삼성출판사 | 2022년 7월
19,500원 → 17,550원 (10%할인),  마일리지 970원 (5% 적립)
[국내도서] 부동산 경매로 1년 만에 꼬마빌딩주 되다 
김상준 (지은이) | 매일경제신문사 | 2022년 9월
18,000원 → 16,200원 (10%할인),  마일리지 900원 (5% 적립)
[국내도서] 사로잡는 얼굴들 
이사 레슈코 (지은이), 김민주 (옮긴이) | 가망서사 | 2022년 9월
28,000원 → 25,200원 (10%할인),  마일리지 1,400원 (5% 적립)
[국내도서] 부부 이상, 연인 미만. 1~2 합본판 
카나마루 유키 (지은이), 송재희 (옮긴이) | 디앤씨미디어(주)(D&C미디어) | 2022년 10월
12,000원 → 10