---
# Selenium 연습
+ 참고사이트 : <a href="https://greeksharifa.github.io/references/2020/10/30/python-selenium-usage/">Gorio Learning - Python Selenium 사용법</a>
---

## 0. Install
+ 웹 브라우저 별 selenium webdriver를 다운로드한다. (웹 브라우저는 크롬을 추천)
+ 크롬 버전 확인 : 브라우저 오른쪽 끝에서 `더보기 > 도움말 > Chrome 정보`
+ 현재 내 컴퓨터 크롬 버전 : `버전 87.0.4280.88(공식 빌드) (64비트)`
+ <a href="https://sites.google.com/a/chromium.org/chromedriver/downloads">ChromeDriver(WebDriver for Chrome) 다운로드</a>
+ 다운받은 드라이버 파일을 워킹 디렉토리로 옮기면 path입력이 간단해진다.

<img src="./selenium_image/appropriate_chrome_driver.png"
     alt="크롬 버전에 맞는 크롬 드라이버">

---

## 1. Import

In [1]:
import selenium
from selenium import webdriver
from selenium.webdriver import ActionChains

from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By

from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.ui import Select
from selenium.webdriver.support.ui import WebDriverWait

import time

---

## 2. 불러오기 (Driver & Web Load)

In [2]:
URL = "https://www.miraeassetdaewoo.com/hki/hki3028/r01.do" # "증권용어사전 | 미래에셋대우"

driver = webdriver.Chrome(executable_path="./chromedriver")
driver.get(url=URL)

1. 먼저 `webdriver.Chrome(executable_path=driver_path)` 함수를 사용하여 드라이버를 로드한다.
2. `get(url)` 함수로 해당 url을 브라우저에 띄운다.

### 2.1. 현재 url 얻기

In [None]:
print(driver.current_url)

### 2.2. 브라우저 닫기

In [None]:
driver.close()

### 2.3. Wait till Load Webpage (로딩 대기)
+ 브라우저에서 해당 웹 페이지의 요소들을 로드하는데 시간이 걸린다.
+ 따라서 element가 존재하지 않는다는 error를 보고 싶지 않다면 해당 요소가 전부 준비가 될 때까지 대기해야 한다.

#### 2.3.1. Implicit Waits (암묵적 대기)

In [4]:
driver.implicitly_wait(time_to_wait=5)

+ 찾으려는 element가 로드될 때까지 지정한 시간만큼 대기할 수 있도록 설정한다.
+ 이는 한 webdriver에 영구적으로 작용한다.
+ 인자는 초 단위이며, default는 0이고 위의 예시는 5초까지 기다려 준다는 의미이다.

#### 2.3.2. Explicit Waits (명시적 대기)
+ 간단하게 `time.sleep(secs)` 함수를 사용하여 무조건 몇 초간 대기하는 방법이 있다.
+ 매우 편리하지만 효율이 낮기 때문에 지양한다.

In [23]:
driver = webdriver.Chrome('./chromedriver')
driver.get(url='https://www.google.com/')
try:
    element = WebDriverWait(driver, 5).until(
        EC.presence_of_element_located((By.TAG_NAME , 'a')) # 조건 : element가 존재하는가?
    )
    print(element.text)
finally:
    driver.quit()

Gmail


+ 위의 코드는 웹페이지에서 class가 gLFyf인 어떤 element를 찾을 수 있는지를 최대 5초 동안 매 0.5초마다 시도한다. 
+ expected_conditions(`EC`)는 만약 element를 찾을 수 있었으면 True를, 아니라면 False를 반환한다.
+ `until(method, message="")` 함수는 method의 반환값이 `False`인 동안 계속 method를 실행한다.
+ 반대로 `until_not(method, message="")` 함수는 method의 반환값이 `True`인 동안 계속 method를 실행한다.
+ 그래서 웹 드라이버에게 최대 5초동안만 기다리게끔 코드를 작성한 것.

+ 조건은 상황에 맞게 아래의 것 중 적절한 것을 선택하여 변경할 수 있다.
    1. title_is
    2. title_contains
    3. presence_of_element_located
    4. visibility_of_element_located
    5. visibility_of
    6. presence_of_all_elements_located
    7. text_to_be_present_in_element
    8. text_to_be_present_in_element_value
    9. frame_to_be_available_and_switch_to_it
    10. invisibility_of_element_located
    11. element_to_be_clickable
    12. staleness_of
    13. element_to_be_selected
    14. element_located_to_be_selected
    15. element_selection_state_to_be
    16. element_located_selection_state_to_be
    17. alert_is_present

---

## 3. 시작하기 전에 ...

In [2]:
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from time import sleep

options = webdriver.ChromeOptions()
options.add_argument("window-size=1920,1080")

driver = webdriver.Chrome("./chromedriver", options=options)
driver.implicitly_wait(5)

driver.get(url="https://www.google.com/") # 드라이버가 서버에 요청을 보냄
try :
    search_box = driver.find_element_by_xpath("//*[@title='검색']")
    search_box.send_keys("github")    # 문자열을 search_box에 전달
    search_box.send_keys(Keys.RETURN) # 엔터
    
    xpath_for_elements = '//*[@id="center_col"]/div[@id="res"]/div[@id="search"]/div[1]/div[1]/div[*]/div[*]/div[@class="yuRUbf"]/a[*]/h3[*]'
    elements = driver.find_elements_by_xpath(xpath_for_elements)
    
    file = open("./gorio.text", 'a', encoding='utf-8')
    for idx, element in enumerate(elements) :
        print("{:d} : {}".format(idx, element.text))
        print(element.text, file=file)
    
except Exception as e :
    print("There is an Exception!")
    print(str(e))
    
finally :
    time.sleep(3)
    driver.close()

0 : GitHub - 나무위키
1 : The GitHub Blog - Updates, ideas, and inspiration from GitHub ...
2 : GitHub - Wikipedia
3 : 깃허브 - 위키백과, 우리 모두의 백과사전
4 : GitHub (@github) | Twitter
5 : Slack용 GitHub | Slack


In [3]:
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from time import sleep

options = webdriver.ChromeOptions()
options.add_argument('window-size=1920,1080')

driver = webdriver.Chrome('./chromedriver', options=options)
driver.implicitly_wait(5)

try :
    driver.get(url='https://www.google.com/') # request
    driver.maximize_window()

    xpath_for_search_box = '//*[@id="tsf"]/div[2]/div[1]/div[1]/div/div[2]/input'
    search_box = driver.find_element_by_xpath(xpath_for_search_box)

    search_box.send_keys('greeksharifa.github.io')
    search_box.send_keys(Keys.RETURN)
    
#     action_chains = ActionChains(driver)
#     action_chains.drag_and_drop().perform()
    
    elements = driver.find_elements_by_xpath('//*[@id="rso"]/div[*]/div/div[1]/a/h3/span')

    file = open('gorio.txt', 'w', encoding='utf-8')
    for element in elements:
        print(element.text)
        print(element.text, file=file)
        
    xpath_for_first_posting = '//*[@id="rso"]/div/div[1]/div/div/div/div[1]/a/h3/span'
    posting = driver.find_element_by_xpath(xpath_for_first_posting)
    posting.click()
    
except Exception as e:
    print(str(e))
finally :
    sleep(3)
    driver.close()

YW & YY's Python, Machine & Deep Learning
sharifa greeksharifa - GitHub
greeksharifa/greeksharifa.github.io - GitHub
Link 수정 · Issue #1 · greeksharifa/greeksharifa.github.io · GitHub
greeksharifa/ps_code - GitHub
Youyoung Jang ocasoyy - GitHub
Top 6 Similar web sites like greeksharifa.github.io and ...
Similar sites like mediagotosa.com
Python 정규표현식 참고 : 네이버 블로그
이태호
Message: no such element: Unable to locate element: {"method":"xpath","selector":"//*[@id="rso"]/div/div[1]/div/div/div/div[1]/a/h3/span"}
  (Session info: chrome=87.0.4280.88)



+ `search_box` 변수에 구글의 검색창 요소가 담겨 있다.
+ 선택한 요로에 키보드 입력을 보내거나 클릭하는 등의 행동을 할 수 있다.

---

## 4. 요소 찾기 (Loading Elements)
+ Selenium은 다양한 요소(element)를 찾는 방법을 지원한다.
+ 먼저 어떤 요소를 찾을지부터 정해야한다. (`ctrl + shift + c` or `F12(개발자도구)`)

1. `find_element(self, by, value)` : 조건에 맞는 요소를 하나만 반환.
    + `find_element_*(self, str)` : 위와 동일하지만 by가 고정된 메서드임.
2. `find_elements(self, by, value)`: 조건에 맞는 요소들을 이터러블로 반환.
    + `find_elements_*(self, value)` : 위와 동일하지만 by가 고정된 메서드임.

### 4.1. XPath로 요소 찾기

|표현식   |설명                                |
|:------:|:---------------------------------:|
|nodename|`nodename`을 name으로 갖는 모든 요소선택|
|/       |root 요소에서 선택                    |
|//      |현재 요소의 자손 요소를 선택             |
|.       |현재 요소를 선택                       |
|..      |현재 요소의 부모 요소를 선택             |
|@       |속성(attibutes)를 선택                |
|*       |모든 요소에 매치됨                     |
|@*      |모든 속성요소에 매치됨                  |
|node()  |모든 종류의 모든 요소에 매치됨            |
|\|      |OR 조건의 기능                        |


|표현식   |설명                                |
|:-----:|:----------------------------------:|
|/div	|root 요소의 div 요소|
|./div	|현재 요소의 자식 요소 중 div 요소|
|/*	|name에 상관없이 root 요소를 선택|
|./* 또는 *	|context 요소의 모든 자식 요소를 선택|
|//div	|현재 웹페이지에서 모든 div 요소를 선택|
|.//div	|현재 요소의 모든 자손 div 요소를 선택|
|//*	|현재 웹페이지의 모든 요소를 선택|
|.//*	|현재 요소의 모든 자손 요소를 선택|
|/div/p[0]	|root > div > p 요소 중 첫 번째 p 요소를 선택|
|/div/p[position()<3]	|root > div > p 요소 중 첫 두 p 요소를 선택|
|/div/p[last()]	|root > div > p 요소 중 마지막 p 요소를 선택|
|/bookstore/book[price>35.00]	|root > bookstore > book 요소 중 price 속성이 35.00 초과인 요소들을 선택|
|//*[@id="tsf"]/div[2]/	|id가 tsf인 모든 요소의 자식 div 요소 중 3번째 요소를 선택|
|//title \| //price	|title 또는 price 요소를 선택|

---

## 5. 텍스트 입력 (키보드 입력)
1. 기본적으로 `send_keys(*value)` 함수는 문자열을 받지만 `enter` 같은 특수 키 입력의 경우(`RETURN='0ue006'`)도 문자열로 처리 가능하다.
    + ex. search_box.send_keys("github")    : search_box에 "github"를 전달한다.
    + ex. search_box.send_keys(Keys.RETURN) : search_box에 엔터를 전달한다.

2. 아래는 입력할 수 있는 Keys의 목록이다.
```
class Keys(object):
    """
    Set of special keys codes.
    """

    NULL = '\ue000'
    CANCEL = '\ue001'  # ^break
    HELP = '\ue002'
    BACKSPACE = '\ue003'
    BACK_SPACE = BACKSPACE
    TAB = '\ue004'
    CLEAR = '\ue005'
    RETURN = '\ue006'
    ENTER = '\ue007'
    SHIFT = '\ue008'
    LEFT_SHIFT = SHIFT
    CONTROL = '\ue009'
    LEFT_CONTROL = CONTROL
    ALT = '\ue00a'
    LEFT_ALT = ALT
    PAUSE = '\ue00b'
    ESCAPE = '\ue00c'
    SPACE = '\ue00d'
    PAGE_UP = '\ue00e'
    PAGE_DOWN = '\ue00f'
    END = '\ue010'
    HOME = '\ue011'
    LEFT = '\ue012'
    ARROW_LEFT = LEFT
    UP = '\ue013'
    ARROW_UP = UP
    RIGHT = '\ue014'
    ARROW_RIGHT = RIGHT
    DOWN = '\ue015'
    ARROW_DOWN = DOWN
    INSERT = '\ue016'
    DELETE = '\ue017'
    SEMICOLON = '\ue018'
    EQUALS = '\ue019'

    NUMPAD0 = '\ue01a'  # number pad keys
    NUMPAD1 = '\ue01b'
    NUMPAD2 = '\ue01c'
    NUMPAD3 = '\ue01d'
    NUMPAD4 = '\ue01e'
    NUMPAD5 = '\ue01f'
    NUMPAD6 = '\ue020'
    NUMPAD7 = '\ue021'
    NUMPAD8 = '\ue022'
    NUMPAD9 = '\ue023'
    MULTIPLY = '\ue024'
    ADD = '\ue025'
    SEPARATOR = '\ue026'
    SUBTRACT = '\ue027'
    DECIMAL = '\ue028'
    DIVIDE = '\ue029'

    F1 = '\ue031'  # function  keys
    F2 = '\ue032'
    F3 = '\ue033'
    F4 = '\ue034'
    F5 = '\ue035'
    F6 = '\ue036'
    F7 = '\ue037'
    F8 = '\ue038'
    F9 = '\ue039'
    F10 = '\ue03a'
    F11 = '\ue03b'
    F12 = '\ue03c'

    META = '\ue03d'
    COMMAND = '\ue03d'
```

### 5.1. 텍스트 입력 지우기
1. `Keys.BACKSPACE` 또는 `Keys.BACK_SPACE`를 사용한다.
2. 전체를 지우려면 `Keys`가 아니라, 선택한 요소에서 `clear()` 함수를 호출한다.
    + ex. search_box.clear()

### 5.2. 파일 업로드
1. 파일을 받는 `<input>`을 선택한 뒤, `send_keys(file_path)`를 호출한다.
```
upload = driver.find_element_by_tag('input')
upload.send_keys(file_path)
```

---

## 6. 상호작용

### 6.1. 클릭하기 (click)
+ 요소 선택후, `click()` 함수를 호출한다.

```
posting = driver.find_element_by_xpath('//*[@id="rso"]/div[1]/div/div[1]/a/h3/span')
posting.click()
```

### 6.2. 옵션 선택 및 제출 (submit)
+ XPath등으로 `select` 요소를 선택한 다음 각 옵션을 선택할 수 있지만, 더 좋은 방법이 있다.

+ selenium.webdriver.support.ui.Select는 select 요소를 선택하여 쉽게 다룰 수 있도록 한다.
+ 위 코드에서 볼 수 있듯이 select 내에서 인덱스로 선택하거나, 옵션의 텍스트, 혹은 어떤 값을 통해 선택이 가능하다.

+ 선택된 옵션 리스트를 얻으려면 `select.all_selected_options`으로 얻을 수 있다. 
+ 첫 번째 선택된 옵션은 `select.first_selected_option`, 가능한 옵션을 모두 보려면 `select.options`를 사용하면 된다.

+ 제출(submit)하려면 요소를 찾은 뒤 `click()`을 수행해도 되지만, 다음과 같이 써도 된다.

+ 만약 선택한 요소가 form 형식이 아니라면 `NoSuchElementException` 오류를 볼 수 있을 것이다.

### 6.3. Drag and Drop
+ 어떤 일련의 동작을 수행하기 위해서는 `ActionChains`를 사용하면 된다. 
+ `source` 요소에서 `target` 요소로 `Drag & Drop`을 수행한다고 하자

### 6.4. Window/Frame 이동
+ 최신 웹 페이지에서는 frame 같은 것을 잘 사용하지 않는다.
+ 그러나 `예전에 만들어진 사이트`라면 `frame`을 사용한 경우가 있다.
+ 이렇게 frame 안에 들어 있는 요소는 find_element 함수를 써도 그냥 찾아지지 않는다. 
+ find_element 함수는 frame 내에 있는 요소를 찾아주지 못한다.
+ 그래서 `특정 frame으로 이동`해야 할 때가 있다.

+ windowName을 알고 싶다면 다음과 같은 링크가 있는지 살펴보자.

+ 혹은 webdriver는 window 목록에 접근할 수 있기 때문에, 다음과 같이 모든 window를 순회하는 것도 가능하다.

+ frame 밖으로 나가려면 다음과 같이 쓰면 기본 frame으로 되돌아간다.

+ 경고창으로 이동할 수도 있다.

---

## 7. JavaScript 코드 실행
+ `driver.execute_script()` 함수를 실행할 수 있다.

+ 아래는 Name이 `search_box`인 요소의 값을 query의 값으로 변경하는 코드이다.

---

## 8. 브라우저 창 다루기

### 8.1. 뒤로가기, 앞으로 가기
+ 브라우저는 뒤로가기(`back`)와 앞으로 가기(`forward`) 기능을 제공한다. 이를 selenium으로 구현이 가능하다.

### 8.2. 화면 이동 (맨 밑으로 내려가기 등)
+ 크롤링을 하다 보면 화면의 끝으로 내려가야 내용이 동적으로 추가되는 경우를 자주 볼 수 있다.
+ 이런 경우에는 웹페이지의 최하단으로 내려가는 코드를 실행할 필요가 있다.

+ 물론 전체를 내려가야 할 필요가 없다면 `document.body.scrollHeight)` 대신 지정된 값만큼 이동해도 된다.

+ 특정 요소까지 계속 찾으려면 `ActionChain`을 써도 된다.

### 8.3. 브라우저 최소화/최대화

### 8.4. 스크린샷 저장

### 8.5. Headless 설정
+ 브라우저 창을 띄우지 않고 수행하는 방법

### 8.6. 브라우저 크기 설정
+ 브라우저의 창 크기, 해당 기기의 정보 등을 설정할 수 있다.
+ 기본적인 사용법은 다음과 같다. 브라우저가 실행될 때 창 크기를 설정할 수 있다.

In [9]:
options = webdriver.ChromeOptions()
options.add_argument('window-size=1500,1000')

driver = webdriver.Chrome('./chromedriver', options=options)

time.sleep(3)
driver.close()

+ 다른 기능들은 여기에 적어 두었다. 코드를 보면 역할을 짐작할 수 있을 것이다.

---

## 9. ActionChains (마우스, 키보드 입력 등 연속 동작 실행)

마우스 클릭, Drag&Drop, 키보드 입력 등을 연속적으로 수행할 수 있다.
+ `on_element` 인자를 받는 함수는, 해당 인자가 주어지지 않으면 현재 마우스 위치를 기준으로 한다.
+ `element` 인자를 받는 함수는, 해당 인자가 주어지지 않으면 현재 선택 되어 있는 요소를 기준으로 한다.
+ `key_down`, `key_up` 함수는 `ctrl`등의 키를 누를 때 쓰면 된다.

|동작 수행 함수                                                |설명                                                                      |
|:---------------------------------------------------------:|:-----------------------------------------------------------------------:|
|click(on_element=None)	            	                    |인자로 주어진 요소를 왼쪽 클릭한다.                                              |
|click_and_hold(on_element=None)		                    |인자로 주어진 요소를 왼쪽 클릭하고 누르고 있는다.                                  |
|release(on_element=None)	                                |마우스를 주어진 요소에서 뗀다.                                                  |
|context_click(on_element=None)		                        |인자로 주어진 요소를 오른쪽 클릭한다.                                            |
|double_click(on_element=None)		                        |인자로 주어진 요소를 왼쪽 더블클릭한다.                                           |
|drag_and_drop(source, target)		                        |source 요소에서 마우스 왼쪽 클릭하여 계속 누른 채로 target까지 이동한 뒤 마우스를 놓는다.|
|drag_and_drop_by_offset(source, xoffset, yoffset)          |위와 비슷하지만 offset만큼 이동하여 마우스를 놓는다.                               |
|key_down(value, element=None)		                        |value로 주어진 키를 누르고 떼지 않는다.                                         |
|key_up(value, element=None)		                        |value로 주어진 키를 뗀다.                                                     |
|move_to_element(to_element)	 	                        |마우스를 해당 요소의 중간 위치로 이동한다.                                        |
|move_to_element_with_offset(to_element, xoffset, yoffset)	|마우스를 해당 요소에서 offset만큼 이동한 위치로 이동한다.                           |
|pause(seconds)	                                            |주어진 시간(초 단위)만큼 입력을 중지한다.                                         |
|perform()                                                  |이미 쌓여 있는(stored) 모든 행동을 수행한다(chaining).                           |
|reset_actions()	                                        |이미 쌓여 있는(stored) 모든 행동을 제거한다.                                     |
|send_keys(*keys_to_send)	                                |키보드 입력을 현재 focused된 요소에 보낸다.                                      |
|send_keys_to_element(element, *keys_to_send)	            |키보드 입력을 주어진 요소에 보낸다.                                              |

---

## 10. 경고 창 다루기 (alerts)

+ 브라우저를 사용하다보면 상단에 `경고창`이 뜰 때가 있다. (확인/취소 등)
+ 이 경고창을 `무시`하는 등의 처리를 할 수 있는 기능을 제공한다.
+ 아래 코드는 경고창에서 수락/거절을 누르거나, 경고창의 내용을 출력, 혹은 경고창에 특정 키 입력을 보낼 수 있다.

## 11. 기타 기능

1. `Touch Actions` : 마우스/키보드 입력과 비슷하게 chaining이 가능하고 터치와 관련한 여러 기능을 제공
<br>   (`selenium.webdriver.common.touch_actions.TouchActions`) </br>
2. `Proxy` : Proxy 기능을 사용할 수 있다.
<br> (`selenium.webdriver.common.proxy.Proxy`)</br>
3. `쿠키(Cookie)` : 쿠키를 추가하거나 카져올 수 있다.

## 12. References