# User-Agent 부여하기

In [1]:
import requests

# 무신사 접속해보기
MUSINSA_LIST_URL = "https://www.musinsa.com/categories/item/001002"
response = requests.get(MUSINSA_LIST_URL)
response

<Response [200]>

In [2]:
MUSINSA_DETAIL_URL = "https://www.musinsa.com/app/goods/994588"
response = requests.get(MUSINSA_DETAIL_URL)
response #403 error: 권한 거부 에러

<Response [403]>

fake_useragent: User Agent를 랜덤으로 만들어준다.

In [3]:
from fake_useragent import UserAgent

headers = {'User-agent': UserAgent().chrome}
headers

{'User-agent': 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/532.0 (KHTML, like Gecko) Chrome/4.0.204.0 Safari/532.0'}

In [4]:
response = requests.get(MUSINSA_DETAIL_URL, headers = headers)
response

<Response [200]>

# Selenium 옵션

In [None]:
#크롬브라우저 사용 할 수 있지만 다른 브라우저 처럼 서버 속임
#fake_useragent를 셀레니움에서 하는 것

In [6]:
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from webdriver_manager.chrome import ChromeDriverManager
#이것들 해보기

# usergent를 임의로 설정할 수 있는 driver 생성 함수
def get_chrome_driver_useragent():
    chrome_options = webdriver.ChromeOptions()
    
    chrome_options.add_argument("user-agent={}".format(UserAgent().chrome))
    
    driver = webdriver.Chrome(
        service=Service(ChromeDriverManager().install()),
        options=chrome_options
    )
    
    return driver

In [7]:
driver = get_chrome_driver_useragent()

In [8]:
driver.execute_script("return navigator.userAgent")

'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/534.16 (KHTML, like Gecko) Chrome/10.0.638.0 Safari/534.16'

In [9]:
driver.quit()

Selenium 으로 크롤링을 할 때 중요한 옵션
- Headless: 브라우저를 화면에 띄우지 않고 컴퓨터 내부에서만 돌아가도록 하는 옵션
- Windows, Mac 같은 GUI(Graphic User Interface)환경 OS에서는 화면이 뜬다.
- Linux 같은 경우는 CLI(Command User Interface)환경 OS에서는 명령창만 뜬다.
- 크롬 같은 경우는 메모리를 굉장히 많이 잡아먹는 브라우저라서 메모리를 아끼기 위해 headless 옵션을 쓰기도한다.

In [10]:
def get_chrome_driver_headless():
    chrome_options = webdriver.ChromeOptions()
    
    chrome_options.add_argument("headless")
    
    driver = webdriver.Chrome(
        service=Service(ChromeDriverManager().install()),
        options=chrome_options
    )
    
    return driver

In [11]:
driver = get_chrome_driver_headless()

In [12]:
driver.get("https://naver.com")

In [13]:
driver.title

'NAVER'

In [14]:
driver.quit()

셀레니움을 이용한 크롤링은 GUI환경에서 모든 테스트를 마치고 headless 설정을 하여 CLI 환경으로 돌린다.