# Selenium

## 크롤링에서 BeautifulSoup의 한계
- 자바스크립트(JavaScript)와 같이 동적으로 생성되는 웹페이지의 경우 값을 가져올 수 없음
- 예를 들어, 네이버 카페의 경우는 게시글이나 옆의 배너를 아무리 눌러봐도 url이 바뀌지 않음
> https://cafe.naver.com/joonggonara

## Selenium이란?
- Selenium은 BeautifulSoup의 한계를 극복하기 위해, 웹브라우저를 직접 띄운 후에 브라우저에 나타나고 있는 것들을 긁어옴
- 따라서 동적으로 바뀌는 웹페이지의 경우에도 값을 가져올 수 있으며, BeautifulSoup에서 할 수 있던 것들도 당연하 시용이 가능
- 단, 직접 브라우저를 띄워 값을 가져오기 때문에 속도는 느린편

## Selenium을 사용하기 위한 준비
- 크롬 설치
-  크롬드라이버 설치
    1. 크롬 버전 확인
    2. 크롬 버전에 맞는 [드라이버](https://chromedriver.chromium.org/downloads) 설치

    - 참고) [맥에서 크롬드라이버 권한 오류 뜰 경우 해결방법](https://somjang.tistory.com/entry/MAC-OSX-%EA%B0%9C%EB%B0%9C%EC%9E%90%EB%A5%BC-%ED%99%95%EC%9D%B8%ED%95%A0-%EC%88%98-%EC%97%86%EA%B8%B0-%EB%95%8C%EB%AC%B8%EC%97%90-chromedriver%EC%9D%84%EB%A5%BC-%EC%97%B4-%EC%88%98-%EC%97%86%EC%8A%B5%EB%8B%88%EB%8B%A4-%ED%95%B4%EA%B2%B0-%EB%B0%A9%EB%B2%95)

# Selenium을 이용한 크롤링

In [1]:
# 라이브러리 불러오기
from selenium import webdriver

## 1. 크롬 브라우저 띄우기
- `webdriver.Chrome(크롬드라이버_경로)`

In [2]:
# # 윈도우
# driver_path = "../driver/chromedriver.exe"
# 맥
driver_path = "../driver/chromedriver"

driver = webdriver.Chrome(driver_path)

#### 크롬 브라우저가 실행되면서 `"Chrome이 자동화된 테스트 소프트웨어에 의해 제어되고 있습니다."` 라는 문구를 볼 수 있다.

## 2. URL 이동하기
- `driver.get(URL)` : requests 모듈의 `request.get()`과 비슷한 기능 but 실제로 브라우저에서 페이지가 바뀌는 것을 확인할 수 있음

In [3]:
# 페이지 이동해보기
url_page = "https://statkim.github.io/stats-summer-2021/"
driver.get(url_page)

In [4]:
# 페이지 이동해보기
url_page = "https://www.naver.com"
driver.get(url_page)

## 3. 값에 접근하기

1. 값 하나만 가져오기 (`find_element_by_...`)
```python
find_element_by_name('태그_name')
find_element_by_id('태그_id')
find_element_by_xpath('xpath')
find_element_by_css_selector('CSS selector')
find_element_by_class_name('class name')
find_element_by_tag_name('태그명')
```


2. 값 여러개 가져오기 (`find_elements_by_...`) => 리스트로 반환
```python
find_elements_by_name('태그_name')
find_elements_by_id('태그_id')
find_elements_by_xpath('xpath')
find_elements_by_css_selector('CSS selector')
find_elements_by_class_name('class name')
find_elements_by_tag_name('태그명')
```

- 이렇게 값을 가져올 떄에는 많은 삽질(시행착오)이 필요!!
- 항상 처음에는 값을 제대로 가져왔는지 하나하나 확인해야함!!
- 실질적인 활용은 밑의 예시들에서 다루기로함

## 4. 브라우저 종료
- `driver.close()`

In [5]:
# 크롬 창 닫기
driver.close()

# 예제1) 네이버 영화 제목과 평점 가져오기
https://movie.naver.com/movie/sdb/rank/rmovie.nhn?sel=pnt&date=20210704

In [6]:
# 크롬 브라우저 열고 네이버 영화 랭킹 페이지로 이동하기
driver = webdriver.Chrome(driver_path)
driver.get("https://movie.naver.com/movie/sdb/rank/rmovie.nhn?sel=pnt")

# 3초 기다리기
driver.implicitly_wait(3)

## 영화 제목 가져오기

In [7]:
# class name으로 가져오기
driver.find_elements_by_class_name("tit5")

[<selenium.webdriver.remote.webelement.WebElement (session="f8e66b2555f41f273112fda4cbd412a3", element="78b98b50-06ae-46b2-a820-f98f5c0b045a")>,
 <selenium.webdriver.remote.webelement.WebElement (session="f8e66b2555f41f273112fda4cbd412a3", element="2f0400ff-f97e-47a6-a45b-c077f39da1f7")>,
 <selenium.webdriver.remote.webelement.WebElement (session="f8e66b2555f41f273112fda4cbd412a3", element="b340b68c-91f8-4614-bb70-6bb49178a93f")>,
 <selenium.webdriver.remote.webelement.WebElement (session="f8e66b2555f41f273112fda4cbd412a3", element="44b840ba-7768-4c96-a679-af048362b5f8")>,
 <selenium.webdriver.remote.webelement.WebElement (session="f8e66b2555f41f273112fda4cbd412a3", element="42dfd248-1929-459a-839c-edf700c3fcff")>,
 <selenium.webdriver.remote.webelement.WebElement (session="f8e66b2555f41f273112fda4cbd412a3", element="672cd35c-1591-4af4-a107-3ea872b155d2")>,
 <selenium.webdriver.remote.webelement.WebElement (session="f8e66b2555f41f273112fda4cbd412a3", element="8e99bdef-b219-40fd-8636-f4

In [8]:
len(driver.find_elements_by_class_name("tit5"))

50

In [9]:
# 글자만 가져오기
title = [i.text for i in driver.find_elements_by_class_name("tit5")]
title

['그린 북',
 '가버나움',
 '디지몬 어드벤처 라스트 에볼루션 : 인연',
 '먼 훗날 우리',
 '베일리 어게인',
 '원더',
 '아일라',
 '당갈',
 '극장판 바이올렛 에버가든',
 '포드 V 페라리',
 '주전장',
 '그대, 고맙소 : 김호중 생애 첫 팬미팅 무비',
 '쇼생크 탈출',
 '터미네이터 2:오리지널',
 '나 홀로 집에',
 '덕구',
 '라이언 일병 구하기',
 '클래식',
 '월-E',
 '보헤미안 랩소디',
 '사운드 오브 뮤직',
 '포레스트 검프',
 '잭 스나이더의 저스티스 리그',
 '빽 투 더 퓨쳐',
 '글래디에이터',
 '헬프',
 '위대한 쇼맨',
 '매트릭스',
 '가나의 혼인잔치: 언약',
 '인생은 아름다워',
 '타이타닉',
 '살인의 추억',
 '센과 치히로의 행방불명',
 '토이 스토리 3',
 '캐스트 어웨이',
 '헌터 킬러',
 '죽은 시인의 사회',
 '집으로...',
 '반지의 제왕: 왕의 귀환',
 '어벤져스: 엔드게임',
 '알라딘',
 '레옹',
 '히든 피겨스',
 '아이즈 온 미 : 더 무비',
 '동주',
 '아이 캔 스피크',
 '쉰들러 리스트',
 '여인의 향기',
 '클레멘타인',
 '안녕 베일리']

## 평점 가져오기

In [10]:
# class name으로 가져오기
driver.find_elements_by_class_name("point")

[<selenium.webdriver.remote.webelement.WebElement (session="f8e66b2555f41f273112fda4cbd412a3", element="b6ccf526-0c8d-4d71-bfdd-36056f0ed98c")>,
 <selenium.webdriver.remote.webelement.WebElement (session="f8e66b2555f41f273112fda4cbd412a3", element="fc8775bf-3f01-49c1-82b8-7fa5a8f65721")>,
 <selenium.webdriver.remote.webelement.WebElement (session="f8e66b2555f41f273112fda4cbd412a3", element="49386835-9b93-4cdc-8b4e-f51fb3f52547")>,
 <selenium.webdriver.remote.webelement.WebElement (session="f8e66b2555f41f273112fda4cbd412a3", element="43696327-2cc0-4d2b-bf97-6f41d99870d6")>,
 <selenium.webdriver.remote.webelement.WebElement (session="f8e66b2555f41f273112fda4cbd412a3", element="a52136c9-7eac-4a54-94cf-587407cf2153")>,
 <selenium.webdriver.remote.webelement.WebElement (session="f8e66b2555f41f273112fda4cbd412a3", element="556fa9ee-eef1-40c5-9af5-8cbb0e91b406")>,
 <selenium.webdriver.remote.webelement.WebElement (session="f8e66b2555f41f273112fda4cbd412a3", element="ab733e70-ef3c-46d1-b266-90

In [11]:
len(driver.find_elements_by_class_name("point"))

50

In [12]:
# 글자만 가져오기
point = [i.text for i in driver.find_elements_by_class_name("point")]
point

['9.60',
 '9.59',
 '9.54',
 '9.52',
 '9.52',
 '9.52',
 '9.50',
 '9.49',
 '9.49',
 '9.48',
 '9.47',
 '9.46',
 '9.45',
 '9.44',
 '9.43',
 '9.43',
 '9.43',
 '9.42',
 '9.42',
 '9.42',
 '9.41',
 '9.41',
 '9.41',
 '9.41',
 '9.41',
 '9.41',
 '9.41',
 '9.40',
 '9.40',
 '9.40',
 '9.40',
 '9.40',
 '9.39',
 '9.39',
 '9.38',
 '9.38',
 '9.38',
 '9.38',
 '9.38',
 '9.38',
 '9.38',
 '9.37',
 '9.37',
 '9.37',
 '9.37',
 '9.37',
 '9.37',
 '9.37',
 '9.37',
 '9.36']

## 데이터프레임으로 만들기

In [13]:
import pandas as pd

df = pd.DataFrame({
    "영화명": title,
    "평점": point
})
df

Unnamed: 0,영화명,평점
0,그린 북,9.6
1,가버나움,9.59
2,디지몬 어드벤처 라스트 에볼루션 : 인연,9.54
3,먼 훗날 우리,9.52
4,베일리 어게인,9.52
5,원더,9.52
6,아일라,9.5
7,당갈,9.49
8,극장판 바이올렛 에버가든,9.49
9,포드 V 페라리,9.48


In [14]:
# csv 파일로 저장
df.to_csv("data/movie_score.csv", 
          index = False)

In [15]:
# 드라이버 종료
driver.close()

# 예제2) 구글에 검색어 입력해서 검색하기

In [16]:
# 크롬 브라우저 열고 구글로 이동하기
driver = webdriver.Chrome(driver_path)
driver.implicitly_wait(1)

driver.get("https://www.google.co.kr")

# 3초 기다리기
driver.implicitly_wait(3)

### xpath로 검색창에 단어 입력하기

In [17]:
# 검색창의 글씨 쓰는 부분의 xpath 찾기
driver.find_element_by_xpath("/html/body/div[1]/div[3]/form/div[1]/div[1]/div[1]/div/div[2]/input")

<selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="3125109b-b17f-4367-a08f-5286f727f62d")>

In [18]:
# xpath로 구글 검색창에 단어 입력하기
key_word = "파이썬"
driver.find_element_by_xpath("/html/body/div[1]/div[3]/form/div[1]/div[1]/div[1]/div/div[2]/input").send_keys(key_word)

### CSS selector로 검색창에 단어 입력하기

In [19]:
driver.find_element_by_css_selector("body > div.L3eUgb > div.o3j99.ikrT4e.om7nvf > form > div:nth-child(1) > div.A8SBwf.emcav > div.RNNXgb > div > div.a4bIc > input")

<selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="3125109b-b17f-4367-a08f-5286f727f62d")>

In [20]:
driver.find_element_by_css_selector("body > div.L3eUgb > div.o3j99.ikrT4e.om7nvf > form > div:nth-child(1) > div.A8SBwf.emcav > div.RNNXgb > div > div.a4bIc > input").send_keys(key_word)

### 버튼 클릭하기

In [21]:
driver.find_element_by_name("btnK")

<selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="2f5a2b8c-3476-47e0-bc5f-41d351177c5a")>

In [22]:
# 검색 버튼 클릭하기
driver.find_element_by_name("btnK").click()

## 검색결과 제목 가져오기

In [23]:
# 삽질 1 : xpath 그대로 복사해서 가져오기
driver.find_elements_by_xpath('//*[@id="rso"]/div[1]/div/div/div[1]/a/h3')

[<selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="f697456a-d6c1-49ad-bc47-d0eda19270f8")>]

In [24]:
# 삽질 2 : xpath에서 div 넘버 제거
driver.find_elements_by_xpath('//*[@id="rso"]/div/div/div/div/a/h3')

[<selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="f697456a-d6c1-49ad-bc47-d0eda19270f8")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="a374e6d5-3165-4bd5-bf5c-5e14af35f9fc")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="5457a948-5d95-41d4-bf6e-ebdc0424a0a2")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="3a923c0a-69b9-4108-925a-da1c9f58d3e5")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="0abe097a-cfd7-49bf-a0d1-9e317f1d4a97")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="37371521-e230-4c78-8f6e-c38522e01d1d")>]

In [26]:
# 성공! : 태그의 class name으로 가져오기
driver.find_elements_by_class_name('LC20lb.DKV0Md')

[<selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="f697456a-d6c1-49ad-bc47-d0eda19270f8")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="a374e6d5-3165-4bd5-bf5c-5e14af35f9fc")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="5457a948-5d95-41d4-bf6e-ebdc0424a0a2")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="3a923c0a-69b9-4108-925a-da1c9f58d3e5")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="1ae9641a-dbfd-455d-b04c-2ff2e2fc6294")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="0abe097a-cfd7-49bf-a0d1-9e317f1d4a97")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="37371521-e230-4c78-8f6e-c3

In [27]:
# 글자만 뽑기
title = [i.text for i in driver.find_elements_by_class_name('LC20lb.DKV0Md')]
title

['파이썬 - 위키백과, 우리 모두의 백과사전',
 '파이썬 자습서 — Python 3.9.6 문서',
 '1 파이썬 시작하기 - 왕초보를 위한 Python: 쉽게 풀어 쓴 기초 ...',
 'Python - 나무위키',
 'Python - 파이썬이란? - 코딩의 시작, TCP School',
 '모두를 위한 프로그래밍 : 파이썬 강좌소개 : edwith',
 '1 장 파이썬(Python) 입문 | 파이썬 프로그래밍 기초',
 '파이썬 입문 | 프로그래머스']

## 검색결과 링크 가져오기

In [28]:
# 삽질 1 : class name으로 가져오기 (링크의 경우는 a 태그에 있기 때문에 div 태그에만 접근해서는 가져오지 못함)
[i.get_attribute("href") for i in driver.find_elements_by_class_name('yuRUbf')]

[None, None, None, None, None, None, None, None]

In [29]:
# 삽질 2 : xpath로 가져오기 => 뭔가 빠진 링크가 존재
driver.find_elements_by_xpath('//*[@id="rso"]/div/div/div/div/a')

[<selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="a1ba8cbc-2208-404a-a7e4-49f727401bb5")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="1c8d4051-8a13-4305-827c-7cff24d0b2c1")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="bf00222b-bdd9-4a0f-8407-c4583ad6a0c4")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="f3522d27-7779-4971-a3ec-d499ca0ea1cb")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="44ee3199-f7a5-4506-8657-fc008f1daa38")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="20c28284-4029-47dc-989b-3f1705beb667")>]

In [30]:
# 링크 가져오기
[i.get_attribute("href") for i in driver.find_elements_by_xpath('//*[@id="rso"]/div/div/div/div/a')]

['https://ko.wikipedia.org/wiki/%ED%8C%8C%EC%9D%B4%EC%8D%AC',
 'https://docs.python.org/ko/3/tutorial/index.html',
 'https://wikidocs.net/43',
 'https://namu.wiki/w/Python',
 'https://www.edwith.org/pythonforeverybody',
 'http://bigdata.dongguk.ac.kr/lectures/Python/_book/%ED%8C%8C%EC%9D%B4%EC%8D%AC%EC%9E%85%EB%AC%B8.html']

In [31]:
# 삽질 3 : CSS selector로 가져오기 => 여전히 링크 2개를 못가져옴
driver.find_elements_by_css_selector('#rso > div > div > div > div.yuRUbf > a')

[<selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="a1ba8cbc-2208-404a-a7e4-49f727401bb5")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="1c8d4051-8a13-4305-827c-7cff24d0b2c1")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="bf00222b-bdd9-4a0f-8407-c4583ad6a0c4")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="f3522d27-7779-4971-a3ec-d499ca0ea1cb")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="44ee3199-f7a5-4506-8657-fc008f1daa38")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="20c28284-4029-47dc-989b-3f1705beb667")>]

In [32]:
# 성공! : CSS selector에서 앞부분 다 제외하고 div의 class name에서 a태그로 접근하는 부분만 남김
driver.find_elements_by_css_selector('div.yuRUbf > a')

[<selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="a1ba8cbc-2208-404a-a7e4-49f727401bb5")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="1c8d4051-8a13-4305-827c-7cff24d0b2c1")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="bf00222b-bdd9-4a0f-8407-c4583ad6a0c4")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="f3522d27-7779-4971-a3ec-d499ca0ea1cb")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="8692016c-df11-4c18-945d-d6503569dcae")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="44ee3199-f7a5-4506-8657-fc008f1daa38")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="20c28284-4029-47dc-989b-3f

In [33]:
# 링크만 뽑아오기
title_link = [i.get_attribute("href") for i in driver.find_elements_by_css_selector('div.yuRUbf > a')]
title_link

['https://ko.wikipedia.org/wiki/%ED%8C%8C%EC%9D%B4%EC%8D%AC',
 'https://docs.python.org/ko/3/tutorial/index.html',
 'https://wikidocs.net/43',
 'https://namu.wiki/w/Python',
 'http://tcpschool.com/python/intro',
 'https://www.edwith.org/pythonforeverybody',
 'http://bigdata.dongguk.ac.kr/lectures/Python/_book/%ED%8C%8C%EC%9D%B4%EC%8D%AC%EC%9E%85%EB%AC%B8.html',
 'https://programmers.co.kr/learn/courses/2']

## 결과 데이터프레임으로 변환

In [34]:
df = pd.DataFrame({
    "제목": title,
    "링크": title_link
})
df

Unnamed: 0,제목,링크
0,"파이썬 - 위키백과, 우리 모두의 백과사전",https://ko.wikipedia.org/wiki/%ED%8C%8C%EC%9D%...
1,파이썬 자습서 — Python 3.9.6 문서,https://docs.python.org/ko/3/tutorial/index.html
2,1 파이썬 시작하기 - 왕초보를 위한 Python: 쉽게 풀어 쓴 기초 ...,https://wikidocs.net/43
3,Python - 나무위키,https://namu.wiki/w/Python
4,"Python - 파이썬이란? - 코딩의 시작, TCP School",http://tcpschool.com/python/intro
5,모두를 위한 프로그래밍 : 파이썬 강좌소개 : edwith,https://www.edwith.org/pythonforeverybody
6,1 장 파이썬(Python) 입문 | 파이썬 프로그래밍 기초,http://bigdata.dongguk.ac.kr/lectures/Python/_...
7,파이썬 입문 | 프로그래머스,https://programmers.co.kr/learn/courses/2


In [36]:
!conda install openpyxl -y

Collecting package metadata (current_repodata.json): done
Solving environment: done


  current version: 4.10.1
  latest version: 4.10.3

Please update conda by running

    $ conda update -n base -c defaults conda



## Package Plan ##

  environment location: /Users/hyunsung/opt/anaconda3/envs/crawler

  added / updated specs:
    - openpyxl


The following packages will be downloaded:

    package                    |            build
    ---------------------------|-----------------
    ca-certificates-2021.7.5   |       hecd8cb5_1         113 KB
    ------------------------------------------------------------
                                           Total:         113 KB

The following NEW packages will be INSTALLED:

  et_xmlfile         pkgs/main/osx-64::et_xmlfile-1.1.0-py38hecd8cb5_0
  jdcal              pkgs/main/noarch::jdcal-1.4.1-py_0
  openpyxl           pkgs/main/noarch::openpyxl-3.0.7-pyhd3eb1b0_0

The following packages will be UPDATED:

  ca-certificates            

In [37]:
# 엑셀 파일로 저장
df.to_excel("data/google_search.xlsx",
            index = False)

In [38]:
# csv 파일로 저장
df.to_csv("data/google_search.csv",
          index = False)

## 관련 검색어 가져오기 (앞에서 BeautifulSoup으로 했던 예제)

In [39]:
driver.find_elements_by_class_name("s75CSd.OhScic.AB4Wff")

[<selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="acf6734e-b6e8-482d-bd53-2c3ea3e75fb9")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="bc3169f3-b776-4f26-a1c3-3a256728195e")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="4c237c93-8ec0-4839-ad10-702d078c5a37")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="898086bb-2593-4c2a-9873-9040f401209c")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="1ad24e5c-8a4d-4732-8244-b87500c01e8a")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="4cca126f-b19b-474b-acb0-c2484f1788dc")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b4a7b45086d0b1e8596edb53cf699ef8", element="24efddd8-7758-4b06-8b76-bb

In [40]:
[i.text for i in driver.find_elements_by_class_name("s75CSd.OhScic.AB4Wff")]

['파이썬 설치',
 '파이썬 사이트',
 '파이썬 다운',
 '파이썬 코딩',
 '파이썬 // 연산자',
 '파이썬 게임',
 '파이썬 강좌',
 '파이썬 기호']

In [41]:
# 브라우저 종료
driver.close()