### requests. BeautifulSoup 만 사용했을때의 한계
- 자바스크립트로 동적으로 생선된 정보는 가져올 수 없다는 것

### Selenium
 : 동적인 페이지를 제어하고 내용을 가져오기 위한 라이브러리
 : 웹 자동화 테스트 도구
 : 브라우저를 제어할 수 있다 - 키보드 입력, 클릭, 스크롤, 이전페이지 이동 등등
 
#### 셀레니움의 필요성
 - 1. 자바스크림트가 동적으로 만든 데이터를 크롤링하기
 - 2. 사이트의 다양한 html요소에 클릭, 키보드 입력 등 이벤트 주기, 그 안에 있는 데이터도 추출할 수 있음
 
#### 사용하기 위한 환경 구축
 - 1. 셀레니움 라이브러리 설치
 - 2. webdriver 파일 설치 -> 현재 크롤링 폴더에 저장
 - 웹 드라이버를 설치할 때 , 크롬 버전과 동일해야함
 - 버전확인방법 : 크롬 브라우저 설정 > 크롬 정보 메뉴 > 버전확인

In [28]:
!pip install selenium
# 아나콘다 프롬프트에서 작성할때에는 !를 빼고 작성



#### Selenium 사용하기

In [29]:
# 도구 임폴트
# chromedriver.exe 를 제어 및 실행 시켜주는 라이브러리
from selenium import webdriver as wb

# 키보드의 값(enter, space bar, ctrl, a키보드값)을 제어할 수 있는 라이브러리
from selenium.webdriver.common.keys import Keys

# html요소를 접근하는 방식을 제공하는 라이브러리
# css선택자에 접근, 태그이름에 접근, 클래스명기준 접근, 아이디명접근 ,,
from selenium.webdriver.common.by import By

#### 페이지 요청

In [30]:
# wb.Chrome(드라이버 경로 설정)
# driver = wb.Chrome('./chromedriver.exe') 같은 경로에 있으면 생략가능

url = 'https://www.naver.com/'

# 크롬 브라우저 연결 설정
# 제어할 수 있는 브라우저가 실행, 브라우저를 제어하고 접근하기 위해 driver라는 변수에 저장해서 사용한다
driver = wb.Chrome()

# url주소에 해당하는 웹 페이지를 요청하는 함수
driver.get(url)

#### 특정 html요소 접근(1개)
 - find_element(어떤 선택자 종류, value = '벨류값')

In [31]:
# driver.find_element() : 웹 문서에서 특정 html요소 1개에 접근하는 함수
# 검색창(input) 요소 접근하기
driver.find_element(by='id', value = 'query')

<selenium.webdriver.remote.webelement.WebElement (session="54a1da9600a4c06b35d3713d24a7e871", element="c2768f39-2319-4276-ae76-2ac03da1856e")>

In [32]:
# 검색방법 1
# by, value를 활용한 html요소 접근
# 검색창에 키보드입력값 보내기
# enter기능 연결
driver.find_element(by='id', value = 'query').send_keys('치즈돈까스\n')

In [33]:
# 검색방법 2
# By.ID 를 활용한 html요소 접근
driver.find_element(By.ID, value = 'query').send_keys('배고파\n')

ElementNotInteractableException: Message: element not interactable
  (Session info: chrome=108.0.5359.99)
Stacktrace:
Backtrace:
	(No symbol) [0x0099F243]
	(No symbol) [0x00927FD1]
	(No symbol) [0x0081CF10]
	(No symbol) [0x0084795E]
	(No symbol) [0x008470E5]
	(No symbol) [0x0086858C]
	(No symbol) [0x00842BFF]
	(No symbol) [0x00868804]
	(No symbol) [0x0087C9EB]
	(No symbol) [0x00868386]
	(No symbol) [0x0084163C]
	(No symbol) [0x0084269D]
	GetHandleVerifier [0x00C39A22+2655074]
	GetHandleVerifier [0x00C2CA24+2601828]
	GetHandleVerifier [0x00A48C0A+619850]
	GetHandleVerifier [0x00A47830+614768]
	(No symbol) [0x009305FC]
	(No symbol) [0x00935968]
	(No symbol) [0x00935A55]
	(No symbol) [0x0094051B]
	BaseThreadInitThunk [0x760D00F9+25]
	RtlGetAppContainerNamedObjectPath [0x77217BBE+286]
	RtlGetAppContainerNamedObjectPath [0x77217B8E+238]


In [None]:
# 검색방법 3
# By.CSS_SELECTOR --> id값에 접근
driver.find_element(By.CSS_SELECTOR, value = '#query').send_keys('치즈돈까스\n')

In [None]:
# 검색방법 4
driver = wb.Chrome()
driver.get(url)
driver.find_element(By.CSS_SELECTOR, value = '#query').send_keys('치즈돈까스')

# 검색버튼 요소 접근하기
driver.find_element(By.CSS_SELECTOR, value = '#search_btn').click()

#### 해당 태그의 여러 요소를 접근하는 함수(여러개)
- find_elements()

In [34]:
# 치즈돈까스 상품명에 접근해보기
products = driver.find_elements(By.CSS_SELECTOR, value = '.product_info > a.title')
products[0].text # webelement.text : html객체 내의 텍스트 내용을 접근하는 키워드 -> 반환값은 str

'당당한 치즈돈까스 960gx8팩 업소용'

In [35]:
for i in products:
    print(i.text) # i 요소 1개.text

당당한 치즈돈까스 960gx8팩 업소용
진푸드 수제치즈돈까스1.8kgx4개 도매업소용
옥주부 제주돼지 돈까스10팩 등심돈까스 치즈돈까스 특제소스
삼형제고기 돈까스 수제 등심 치즈돈까스 옛날 경양식 냉동
옥주부 치즈 돈까스 14팩[치즈 14개+감귤 7개+토마토 7개]
유혜광 수제돈까스 통 등심 치즈 안심 치킨 생선까스 돈까스소스 매운맛소스 전문점 퀄리티
옥주부 제주돼지 통까스 등심돈까스15개 치즈돈까스5개 소스
풀무원 돈카츠 3봉 통등심 돈카츠 블럭치즈돈카츠










In [48]:
# 페이지 스크롤 내리기 ! --> Keys활용
# 스크롤 내리는 방법 : Arrow Down(조금씩 내리기), PAGE_DOWN(보여지는 페이지에서 다음 페이지로 다운),
#    END(제일 하단까지 스크롤 내리기)
# 스크롤 적용 대상 : body태그에 적용
# 스크롤 적용하는 방법 : send_keys(Keys.스크롤 내리는 방법 설정)
driver.find_element(By.TAG_NAME, value = 'body').send_keys(Keys.ARROW_UP)

In [49]:
# 크롬 브라우저 창 끄기
driver.close()