# 녹화할 때, chrome driver 설치해서 경로에 넣는 것까지 보여줄 것

# Selenium

## 크롤링에서 BeautifulSoup의 한계
- 자바스크립트(JavaScript)와 같이 동적으로 생성되는 웹페이지의 경우 값을 가져올 수 없음
- 예를 들어, 네이버 카페의 경우는 게시글이나 옆의 배너를 아무리 눌러봐도 url이 바뀌지 않음
> https://cafe.naver.com/joonggonara

## Selenium이란?
- Selenium은 BeautifulSoup의 한계를 극복하기 위해, 웹브라우저를 직접 띄운 후에 브라우저에 나타나고 있는 것들을 긁어옴
- 따라서 동적으로 바뀌는 웹페이지의 경우에도 값을 가져올 수 있으며, BeautifulSoup에서 할 수 있던 것들도 당연하 시용이 가능
- 단, 직접 브라우저를 띄워 값을 가져오기 때문에 속도는 느린편

## Selenium을 사용하기 위한 준비
- 크롬 설치
-  크롬드라이버 설치
    1. 크롬 버전 확인
    2. 크롬 버전에 맞는 [드라이버](https://chromedriver.chromium.org/downloads) 설치

    - 참고) [맥에서 크롬드라이버 권한 오류 뜰 경우 해결방법](https://somjang.tistory.com/entry/MAC-OSX-%EA%B0%9C%EB%B0%9C%EC%9E%90%EB%A5%BC-%ED%99%95%EC%9D%B8%ED%95%A0-%EC%88%98-%EC%97%86%EA%B8%B0-%EB%95%8C%EB%AC%B8%EC%97%90-chromedriver%EC%9D%84%EB%A5%BC-%EC%97%B4-%EC%88%98-%EC%97%86%EC%8A%B5%EB%8B%88%EB%8B%A4-%ED%95%B4%EA%B2%B0-%EB%B0%A9%EB%B2%95)

# Selenium을 이용한 크롤링

In [1]:
# 라이브러리 불러오기
from selenium import webdriver

## 1. 크롬 브라우저 띄우기
- `webdriver.Chrome(크롬드라이버_경로)`

In [5]:
# # 윈도우
# driver_path = "../driver/chromedriver.exe"
# 맥
driver_path = "../driver/chromedriver"

driver = webdriver.Chrome(driver_path)

#### 크롬 브라우저가 실행되면서 `"Chrome이 자동화된 테스트 소프트웨어에 의해 제어되고 있습니다."` 라는 문구를 볼 수 있다.

## 2. URL 이동하기
- `driver.get(URL)` : requests 모듈의 `request.get()`과 비슷한 기능 but 실제로 브라우저에서 페이지가 바뀌는 것을 확인할 수 있음

In [6]:
# 페이지 이동해보기
url_page = "https://statkim.github.io/stats-summer-2021/"
driver.get(url_page)

## 3. 값에 접근하기

1. 값 하나만 가져오기 (`find_element_by_...`)
```python
find_element_by_name('태그_name')
find_element_by_id('태그_id')
find_element_by_xpath('xpath')
find_element_by_css_selector('CSS selector')
find_element_by_class_name('class name')
find_element_by_tag_name('태그명')
```


2. 값 여러개 가져오기 (`find_elements_by_...`) => 리스트로 반환
```python
find_elements_by_name('태그_name')
find_elements_by_id('태그_id')
find_elements_by_xpath('xpath')
find_elements_by_css_selector('CSS selector')
find_elements_by_class_name('class name')
find_elements_by_tag_name('태그명')
```

- 이렇게 값을 가져올 떄에는 많은 삽질(시행착오)이 필요!!
- 항상 처음에는 값을 제대로 가져왔는지 하나하나 확인해야함!!
- 실질적인 활용은 밑의 예시들에서 다루기로함

## 4. 브라우저 종료
- `driver.close()`

In [None]:
# 크롬 창 닫기
driver.close()

## 가상환경에 pandas 설치
- 주피터 노트북에서 `!` 기호를 이용하여 터미널 명령어를 실행할 수 있음
- `!conda install pandas -y`를 입력하면, 현재 실행되고 있는 가상환경에 pandas가 설치됨

In [110]:
# 가상환경에 pandas 설치
# !conda install pandas -y

Collecting package metadata (current_repodata.json): done
Solving environment: done


  current version: 4.10.1
  latest version: 4.10.3

Please update conda by running

    $ conda update -n base -c defaults conda



## Package Plan ##

  environment location: /Users/hyunsung/opt/anaconda3/envs/crawler

  added / updated specs:
    - pandas


The following NEW packages will be INSTALLED:

  blas               pkgs/main/osx-64::blas-1.0-mkl
  intel-openmp       pkgs/main/osx-64::intel-openmp-2021.2.0-hecd8cb5_564
  mkl                pkgs/main/osx-64::mkl-2021.2.0-hecd8cb5_269
  mkl-service        pkgs/main/osx-64::mkl-service-2.3.0-py38h9ed2024_1
  mkl_fft            pkgs/main/osx-64::mkl_fft-1.3.0-py38h4a7008c_2
  mkl_random         pkgs/main/osx-64::mkl_random-1.2.1-py38hb2f4e1b_2
  numpy              pkgs/main/osx-64::numpy-1.20.2-py38h4b4dc7a_0
  numpy-base         pkgs/main/osx-64::numpy-base-1.20.2-py38he0bd621_0
  pandas             pkgs/main/osx-64::pandas-1.2.5-py38h23ab428_0

# 예제1) 네이버 영화 제목과 평점 가져오기
https://movie.naver.com/movie/sdb/rank/rmovie.nhn?sel=pnt&date=20210704

In [191]:
# 크롬 브라우저 열고 네이버 영화 랭킹 페이지로 이동하기
driver = webdriver.Chrome(driver_path)
driver.get("https://movie.naver.com/movie/sdb/rank/rmovie.nhn?sel=pnt")

# 3초 기다리기
driver.implicitly_wait(3)

## 영화 제목 가져오기

In [192]:
# class name으로 가져오기
driver.find_elements_by_class_name("tit5")

[<selenium.webdriver.remote.webelement.WebElement (session="7974e4d8e29135e7c22fd4c86c6050a8", element="e0e99036-f801-4b12-b8ca-46bba913c406")>,
 <selenium.webdriver.remote.webelement.WebElement (session="7974e4d8e29135e7c22fd4c86c6050a8", element="71bb49cb-5be0-4b43-8e6e-9ef723f8c898")>,
 <selenium.webdriver.remote.webelement.WebElement (session="7974e4d8e29135e7c22fd4c86c6050a8", element="ffaa2a77-6d78-456f-80fe-27146a3e878e")>,
 <selenium.webdriver.remote.webelement.WebElement (session="7974e4d8e29135e7c22fd4c86c6050a8", element="1e44d64b-b644-4eb2-bc72-bfd0b70b3082")>,
 <selenium.webdriver.remote.webelement.WebElement (session="7974e4d8e29135e7c22fd4c86c6050a8", element="0b36e235-3202-424f-a376-a6c9b4486c08")>,
 <selenium.webdriver.remote.webelement.WebElement (session="7974e4d8e29135e7c22fd4c86c6050a8", element="fa03f711-aedc-484c-aebc-f5e40c863d10")>,
 <selenium.webdriver.remote.webelement.WebElement (session="7974e4d8e29135e7c22fd4c86c6050a8", element="2de0d287-0053-436d-a3b7-91

In [193]:
# 글자만 가져오기
title = [i.text for i in driver.find_elements_by_class_name("tit5")]
title

['그린 북',
 '가버나움',
 '디지몬 어드벤처 라스트 에볼루션 : 인연',
 '먼 훗날 우리',
 '베일리 어게인',
 '원더',
 '아일라',
 '당갈',
 '극장판 바이올렛 에버가든',
 '포드 V 페라리',
 '주전장',
 '그대, 고맙소 : 김호중 생애 첫 팬미팅 무비',
 '쇼생크 탈출',
 '터미네이터 2:오리지널',
 '나 홀로 집에',
 '덕구',
 '라이언 일병 구하기',
 '클래식',
 '월-E',
 '보헤미안 랩소디',
 '사운드 오브 뮤직',
 '포레스트 검프',
 '빽 투 더 퓨쳐',
 '잭 스나이더의 저스티스 리그',
 '글래디에이터',
 '헬프',
 '위대한 쇼맨',
 '매트릭스',
 '가나의 혼인잔치: 언약',
 '인생은 아름다워',
 '타이타닉',
 '살인의 추억',
 '센과 치히로의 행방불명',
 '토이 스토리 3',
 '캐스트 어웨이',
 '헌터 킬러',
 '죽은 시인의 사회',
 '집으로...',
 '반지의 제왕: 왕의 귀환',
 '알라딘',
 '어벤져스: 엔드게임',
 '레옹',
 '아이즈 온 미 : 더 무비',
 '히든 피겨스',
 '동주',
 '아이 캔 스피크',
 '쉰들러 리스트',
 '여인의 향기',
 '클레멘타인',
 '안녕 베일리']

## 평점 가져오기

In [194]:
# class name으로 가져오기
driver.find_elements_by_class_name("point")

[<selenium.webdriver.remote.webelement.WebElement (session="7974e4d8e29135e7c22fd4c86c6050a8", element="54e517b5-10d8-4d17-9d46-a8b59a3a5115")>,
 <selenium.webdriver.remote.webelement.WebElement (session="7974e4d8e29135e7c22fd4c86c6050a8", element="becb9dad-a610-4e1e-a2d0-87f19addb80d")>,
 <selenium.webdriver.remote.webelement.WebElement (session="7974e4d8e29135e7c22fd4c86c6050a8", element="2a3845e9-9861-46af-8268-20f713fb8b5c")>,
 <selenium.webdriver.remote.webelement.WebElement (session="7974e4d8e29135e7c22fd4c86c6050a8", element="4917da0c-3668-45d0-a187-0cf83b55b488")>,
 <selenium.webdriver.remote.webelement.WebElement (session="7974e4d8e29135e7c22fd4c86c6050a8", element="97025562-bb86-4380-8ffa-8cd84d1b9e6e")>,
 <selenium.webdriver.remote.webelement.WebElement (session="7974e4d8e29135e7c22fd4c86c6050a8", element="728a70e5-91b3-40a5-b66c-785ff159bab6")>,
 <selenium.webdriver.remote.webelement.WebElement (session="7974e4d8e29135e7c22fd4c86c6050a8", element="392df4dd-20e4-4ae2-9514-cf

In [195]:
# 글자만 가져오기
point = [i.text for i in driver.find_elements_by_class_name("point")]
point

['9.59',
 '9.59',
 '9.54',
 '9.52',
 '9.52',
 '9.52',
 '9.50',
 '9.49',
 '9.49',
 '9.48',
 '9.47',
 '9.46',
 '9.45',
 '9.44',
 '9.43',
 '9.43',
 '9.43',
 '9.42',
 '9.42',
 '9.42',
 '9.41',
 '9.41',
 '9.41',
 '9.41',
 '9.41',
 '9.41',
 '9.41',
 '9.40',
 '9.40',
 '9.40',
 '9.40',
 '9.40',
 '9.39',
 '9.39',
 '9.38',
 '9.38',
 '9.38',
 '9.38',
 '9.38',
 '9.38',
 '9.38',
 '9.37',
 '9.37',
 '9.37',
 '9.37',
 '9.37',
 '9.37',
 '9.37',
 '9.37',
 '9.36']

## 데이터프레임으로 만들기

In [197]:
import pandas as pd
df = pd.DataFrame({
    "영화명": title,
    "평점": point
})
df

Unnamed: 0,영화명,평점
0,그린 북,9.59
1,가버나움,9.59
2,디지몬 어드벤처 라스트 에볼루션 : 인연,9.54
3,먼 훗날 우리,9.52
4,베일리 어게인,9.52
5,원더,9.52
6,아일라,9.5
7,당갈,9.49
8,극장판 바이올렛 에버가든,9.49
9,포드 V 페라리,9.48


In [200]:
# csv 파일로 저장
df.to_csv("data/movie_score.csv", 
          index = False)

In [198]:
# 드라이버 종료
driver.close()

# 예제2) 구글에 검색어 입력해서 검색하기

In [201]:
# 크롬 브라우저 열고 구글로 이동하기
driver = webdriver.Chrome(driver_path)
driver.get("https://www.google.co.kr")

# 3초 기다리기
driver.implicitly_wait(3)

In [202]:
# 검색창의 글씨 쓰는 부분의 xpath 찾기
driver.find_element_by_xpath("/html/body/div[1]/div[3]/form/div[1]/div[1]/div[1]/div/div[2]/input")

<selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="48e29cae-f9aa-4591-853d-5f031f406634")>

In [203]:
# xpath로 구글 검색창에 단어 입력하기
key_word = "파이썬"
driver.find_element_by_xpath("/html/body/div[1]/div[3]/form/div[1]/div[1]/div[1]/div/div[2]/input").send_keys(key_word)

In [204]:
# 검색 버튼 클릭하기
driver.find_element_by_name("btnK").click()

## 검색결과 제목 가져오기

In [205]:
# 삽질 1 : xpath 그대로 복사해서 가져오기
driver.find_elements_by_xpath('//*[@id="rso"]/div[8]/div/div/div[1]/a/h3')

[<selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="3fe1e6a6-16ff-4f10-a323-ae93bbd700c4")>]

In [206]:
# 삽질 2 : xpath에서 div 넘버 제거
driver.find_elements_by_xpath('//*[@id="rso"]/div/div/div/div/a/h3')

[<selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="4abcb3b0-b259-47e1-8224-b441f358a5a7")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="14d735a1-11ed-40e8-96f0-13ea93640d30")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="51b9fdc4-33dd-4d5e-8ec4-a4500888e1ca")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="aab8936e-7f15-40c8-8564-4d015b7529bc")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="e824f484-3b63-49f6-a2bf-7eab22d99767")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="3fe1e6a6-16ff-4f10-a323-ae93bbd700c4")>]

In [207]:
# 성공! : 태그의 class name으로 가져오기
driver.find_elements_by_class_name('LC20lb.DKV0Md')

[<selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="4abcb3b0-b259-47e1-8224-b441f358a5a7")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="14d735a1-11ed-40e8-96f0-13ea93640d30")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="51b9fdc4-33dd-4d5e-8ec4-a4500888e1ca")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="aab8936e-7f15-40c8-8564-4d015b7529bc")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="140f3634-8808-4ae7-94d6-8d17d0e79aad")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="e824f484-3b63-49f6-a2bf-7eab22d99767")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="3fe1e6a6-16ff-4f10-a323-ae

In [208]:
# 글자만 뽑기
title = [i.text for i in driver.find_elements_by_class_name('LC20lb.DKV0Md')]
title

['파이썬 자습서 — Python 3.9.6 문서',
 '파이썬 - 위키백과, 우리 모두의 백과사전',
 'Python - 나무위키',
 '1 파이썬 시작하기 - 왕초보를 위한 Python: 쉽게 풀어 쓴 기초 ...',
 '파이썬이란? - 코딩의 시작, TCP School tcpschool.com ...',
 '모두를 위한 프로그래밍 : 파이썬 강좌소개 : edwith',
 '1 장 파이썬(Python) 입문 | 파이썬 프로그래밍 기초',
 '파이썬 입문 | 프로그래머스']

## 검색결과 링크 가져오기

In [209]:
# 삽질 1 : class name으로 가져오기 (링크의 경우는 a 태그에 있기 때문에 div 태그에만 접근해서는 가져오지 못함)
[i.get_attribute("href") for i in driver.find_elements_by_class_name('yuRUbf')]

[None, None, None, None, None, None, None, None]

In [210]:
# 삽질 2 : xpath로 가져오기 => 뭔가 빠진 링크가 존재
driver.find_elements_by_xpath('//*[@id="rso"]/div/div/div/div/a')

[<selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="e7a24a62-ec93-43a7-890b-8de43b057331")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="f4ded048-5501-4bde-9625-e740d4d0e22f")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="1b1efad8-3034-46c7-9c73-9dd26589f347")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="395dcac0-4e2c-4232-b238-03b9851f32a8")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="142bc5b1-3d9a-487b-a033-c2680ba1d7d8")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="29155550-3ebf-4e2c-98a3-8ba6c9063ed8")>]

In [211]:
# 링크 가져오기
[i.get_attribute("href") for i in driver.find_elements_by_xpath('//*[@id="rso"]/div/div/div/div/a')]

['https://docs.python.org/ko/3/tutorial/index.html',
 'https://ko.wikipedia.org/wiki/%ED%8C%8C%EC%9D%B4%EC%8D%AC',
 'https://namu.wiki/w/Python',
 'https://wikidocs.net/43',
 'https://www.edwith.org/pythonforeverybody',
 'http://bigdata.dongguk.ac.kr/lectures/Python/_book/%ED%8C%8C%EC%9D%B4%EC%8D%AC%EC%9E%85%EB%AC%B8.html']

In [212]:
# 삽질 3 : CSS selector로 가져오기 => 여전히 링크 2개를 못가져옴
driver.find_elements_by_css_selector('#rso > div > div > div > div.yuRUbf > a')

[<selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="e7a24a62-ec93-43a7-890b-8de43b057331")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="f4ded048-5501-4bde-9625-e740d4d0e22f")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="1b1efad8-3034-46c7-9c73-9dd26589f347")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="395dcac0-4e2c-4232-b238-03b9851f32a8")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="142bc5b1-3d9a-487b-a033-c2680ba1d7d8")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="29155550-3ebf-4e2c-98a3-8ba6c9063ed8")>]

In [213]:
# 성공! : CSS selector에서 앞부분 다 제외하고 div의 class name에서 a태그로 접근하는 부분만 남김
driver.find_elements_by_css_selector('div.yuRUbf > a')

[<selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="e7a24a62-ec93-43a7-890b-8de43b057331")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="f4ded048-5501-4bde-9625-e740d4d0e22f")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="1b1efad8-3034-46c7-9c73-9dd26589f347")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="395dcac0-4e2c-4232-b238-03b9851f32a8")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="82bdaf76-655d-4949-893e-178fc35360c7")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="142bc5b1-3d9a-487b-a033-c2680ba1d7d8")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="29155550-3ebf-4e2c-98a3-8b

In [214]:
# 링크만 뽑아오기
title_link = [i.get_attribute("href") for i in driver.find_elements_by_css_selector('div.yuRUbf > a')]
title_link

['https://docs.python.org/ko/3/tutorial/index.html',
 'https://ko.wikipedia.org/wiki/%ED%8C%8C%EC%9D%B4%EC%8D%AC',
 'https://namu.wiki/w/Python',
 'https://wikidocs.net/43',
 'http://tcpschool.com/python/intro',
 'https://www.edwith.org/pythonforeverybody',
 'http://bigdata.dongguk.ac.kr/lectures/Python/_book/%ED%8C%8C%EC%9D%B4%EC%8D%AC%EC%9E%85%EB%AC%B8.html',
 'https://programmers.co.kr/learn/courses/2']

## 결과 데이터프레임으로 변환

In [215]:
df = pd.DataFrame({
    "제목": title,
    "링크": title_link
})
df

Unnamed: 0,제목,링크
0,파이썬 자습서 — Python 3.9.6 문서,https://docs.python.org/ko/3/tutorial/index.html
1,"파이썬 - 위키백과, 우리 모두의 백과사전",https://ko.wikipedia.org/wiki/%ED%8C%8C%EC%9D%...
2,Python - 나무위키,https://namu.wiki/w/Python
3,1 파이썬 시작하기 - 왕초보를 위한 Python: 쉽게 풀어 쓴 기초 ...,https://wikidocs.net/43
4,"파이썬이란? - 코딩의 시작, TCP School tcpschool.com ...",http://tcpschool.com/python/intro
5,모두를 위한 프로그래밍 : 파이썬 강좌소개 : edwith,https://www.edwith.org/pythonforeverybody
6,1 장 파이썬(Python) 입문 | 파이썬 프로그래밍 기초,http://bigdata.dongguk.ac.kr/lectures/Python/_...
7,파이썬 입문 | 프로그래머스,https://programmers.co.kr/learn/courses/2


In [227]:
# !conda install openpyxl -y

Collecting package metadata (current_repodata.json): done
Solving environment: done


  current version: 4.10.1
  latest version: 4.10.3

Please update conda by running

    $ conda update -n base -c defaults conda



## Package Plan ##

  environment location: /Users/hyunsung/opt/anaconda3/envs/crawler

  added / updated specs:
    - openpyxl


The following packages will be downloaded:

    package                    |            build
    ---------------------------|-----------------
    et_xmlfile-1.1.0           |   py38hecd8cb5_0          10 KB
    ------------------------------------------------------------
                                           Total:          10 KB

The following NEW packages will be INSTALLED:

  et_xmlfile         pkgs/main/osx-64::et_xmlfile-1.1.0-py38hecd8cb5_0
  jdcal              pkgs/main/noarch::jdcal-1.4.1-py_0
  openpyxl           pkgs/main/noarch::openpyxl-3.0.7-pyhd3eb1b0_0



Downloading and Extracting Packages
et_xmlfile-1.1.0     | 10 KB    

In [228]:
# 엑셀 파일로 저장
df.to_excel("data/google_search.xlsx",
            index = False)

In [217]:
# csv 파일로 저장
df.to_csv("data/google_search.csv",
          index = False)

## 관련 검색어 가져오기 (앞에서 BeautifulSoup으로 했던 예제)

In [218]:
driver.find_elements_by_class_name("s75CSd.OhScic.AB4Wff")

[<selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="717d569f-4f17-4ce2-b3c9-0a6d9ba70bfc")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="542f2931-4b11-4570-92a6-0f65d8802433")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="64570c66-46f9-46d4-a259-6666bec9d0ec")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="68c9c898-dacc-4108-b7b2-9e8dd0a33e2e")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="92115129-0e5d-41ea-b4c7-7bfb345d5a84")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="68359151-540d-4589-9dfe-a093d0dfd25f")>,
 <selenium.webdriver.remote.webelement.WebElement (session="b74f5ba94e3cd743ea63d4cdee35970f", element="e8bc8576-145e-48bf-9bda-8e

In [219]:
[i.text for i in driver.find_elements_by_class_name("s75CSd.OhScic.AB4Wff")]

['파이썬 설치',
 '파이썬 사이트',
 '파이썬 다운',
 '파이썬 게임',
 '파이썬 // 연산자',
 '파이썬 코딩',
 '파이썬 강좌',
 '파이썬 명령어']

In [220]:
# 브라우저 종료
driver.close()