# Selenium 的使用
## 1. 基本使用

In [None]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.wait import WebDriverWait

# 初始化浏览器对象
browser = webdriver.Chrome()

try:
    browser.get('https://www.baidu.com')
    inp = browser.find_element_by_id('kw')
    # 搜索关键字
    inp.send_keys('Python')
    # 执行确认键，进行搜索
    inp.send_keys(Keys.ENTER)
    wait = WebDriverWait(browser, 10)
    wait.until(EC.presence_of_element_located((By.ID, 'content_left')))
    print(browser.current_url)
    print(browser.get_cookies())
    print(browser.page_source)

finally:
    browser.close()

## 2. 访问页面

## 3. 查找节点
### 3.1 查找单个节点
+ 所有方法
```python
find_element_by_id
find_element_by_name
find_element_by_xpath
find_element_by_link_text
find_element_by_partial_link_text
find_element_by_tag_name
find_element_by_class_name
find_element_by_css_selector
```
+ 通用方法
```
@param By 查找方式
@param val 值
find_element
```

In [7]:
from selenium import webdriver
from selenium.webdriver.common.by import By

# 初始化浏览器对象
browser = webdriver.Chrome()

browser.get('https://www.taobao.com')
input_first = browser.find_element_by_id('q')
input_second = browser.find_element_by_css_selector('#q')
input_third = browser.find_element_by_xpath('//*[@id="q"]')
input_fourth = browser.find_element(By.ID, 'q')
print('{0}\n{1}\n{2}\n{3}\n'.format(input_first, input_second, input_third, input_fourth))
browser.close()

<selenium.webdriver.remote.webelement.WebElement (session="1450fcbff4236bd099674a0441e8bac9", element="dbbd8bcd-9437-4ea6-b9fe-cfd2c0bad573")>
<selenium.webdriver.remote.webelement.WebElement (session="1450fcbff4236bd099674a0441e8bac9", element="dbbd8bcd-9437-4ea6-b9fe-cfd2c0bad573")>
<selenium.webdriver.remote.webelement.WebElement (session="1450fcbff4236bd099674a0441e8bac9", element="dbbd8bcd-9437-4ea6-b9fe-cfd2c0bad573")>
<selenium.webdriver.remote.webelement.WebElement (session="1450fcbff4236bd099674a0441e8bac9", element="dbbd8bcd-9437-4ea6-b9fe-cfd2c0bad573")>



### 3.2 查找多个节点
+ 所有方法
```python
# 返回结果列表类型，列表中的每个节点都是 WebElement 类型
find_elements_by_id
find_elements_by_name
find_elements_by_xpath
find_elements_by_link_text
find_elements_by_partial_link_text
find_elements_by_tag_name
find_elements_by_class_name
find_elements_by_css_selector
```
+ 通用方法
```python
# @param By 查找方式
# @param val 值
find_elements
```

In [9]:
from selenium import webdriver

browser = webdriver.Chrome()

browser.get('https://www.taobao.com')
lis = browser.find_elements_by_css_selector('.service-bd li')
print(lis)
browser.close()

[<selenium.webdriver.remote.webelement.WebElement (session="7b97103599e769d297fdf2030bf512a3", element="663fcf3e-b677-4780-bf16-462adfef7e35")>, <selenium.webdriver.remote.webelement.WebElement (session="7b97103599e769d297fdf2030bf512a3", element="7f23f459-7b84-48e6-8d61-ddfaf97119c0")>, <selenium.webdriver.remote.webelement.WebElement (session="7b97103599e769d297fdf2030bf512a3", element="501664d1-0f44-41c0-be61-da26f1b1dab1")>, <selenium.webdriver.remote.webelement.WebElement (session="7b97103599e769d297fdf2030bf512a3", element="217c0496-cd64-4e8a-960c-328058f8c35a")>, <selenium.webdriver.remote.webelement.WebElement (session="7b97103599e769d297fdf2030bf512a3", element="96a507b8-4243-46c9-a712-b419d48beebb")>, <selenium.webdriver.remote.webelement.WebElement (session="7b97103599e769d297fdf2030bf512a3", element="238d9c33-18ca-4328-8daf-0f10778674f7")>, <selenium.webdriver.remote.webelement.WebElement (session="7b97103599e769d297fdf2030bf512a3", element="c3eb473b-a475-4401-9362-d66bc7bb

## 4.节点交互
> selenium 可以让浏览器模拟执行一些操作。

**常见节点的动作操作**
+ 输入文字时用 `send_keys()` 方法
+ 清空文字时用 `clear()` 方法
+ 点击按钮时用 `click()` 方法

In [18]:
from selenium import webdriver
import time

browser = webdriver.Chrome()

browser.get('https://www.taobao.com')
inp = browser.find_element_by_id('q')
inp.send_keys('iPhone')
time.sleep(1)
inp.clear()
inp.send_keys('iPad')
button = browser.find_element_by_class_name('btn-search')
button.click()

## 5. 动作链

In [23]:
# 实现一个节点的拖拽操作
from selenium import webdriver
from selenium.webdriver import ActionChains

browser = webdriver.Chrome()
url = 'http://www.runoob.com/try/try.php?filename=jqueryui-api-droppable'
browser.get(url)
browser.switch_to.frame('iframeResult')

# 选择要拖拽的节点
source = browser.find_element_by_css_selector('#draggable')
# 选择要拖拽到的目标节点
target = browser.find_element_by_css_selector('#droppable')

# 声明 ActionChains 对象
actions = ActionChains(browser)
# 调用 drag_and_drop() 方法，再调用 perform() 方法执行动作
actions.drag_and_drop(source, target)
actions.perform()

## 6. 执行 Javascript
对于某些操作，selenium API 并没有提供。比如，下拉进度条，它可以直接模拟运行 JavaScript，使用 `execute_script()` 方法即可实现

In [25]:
from selenium import webdriver

browser = webdriver.Chrome()

browser.get('https://www.zhihu.com/explore')
browser.execute_script('window.scrollTo(0, document.body.scrollHeight)')
browser.execute_script('alert("To Bottom")')

## 7. 获取节点信息
+ 获取属性：get_attribute()方法

In [31]:
from selenium import webdriver
from selenium.webdriver import ActionChains
browser = webdriver.Chrome()

browser.get('https://www.zhihu.com/explore')
logo = browser.find_element_by_class_name('AppHeader')
print(logo)
print(logo.get_attribute('class'))

<selenium.webdriver.remote.webelement.WebElement (session="e0f87f1f969c1c9b520eeb58e985763d", element="efbd587a-f1f2-4790-aceb-fd30aea69407")>
Sticky AppHeader css-1x8hcdw


+ 获取文本值：直接调用这个属性就可以得到节点内部的文本信息,相当于 Beautiful Soup的 `get_text()` 方法、pyquery 的 `text()` 方法

In [33]:
from selenium import webdriver
from selenium.webdriver import ActionChains
browser = webdriver.Chrome()

browser.get('https://www.zhihu.com/explore')
input = browser.find_element_by_class_name('Input')
print(input.text)
print(input.get_attribute('placeholder'))


哈尔滨新增新冠确诊病例 3 例


+ 获取 id、位置、标签名和大小

In [34]:
from selenium import webdriver
from selenium.webdriver import ActionChains
browser = webdriver.Chrome()

browser.get('https://www.zhihu.com/explore')
input = browser.find_element_by_class_name('Input')
print(input.id)
print(input.location)
print(input.tag_name)
print(input.size)

55742fe3-cffc-46f0-a74e-f6bccb08d32e
{'x': 425, 'y': 14}
input
{'height': 24, 'width': 408}


## 10.切换 Frame
> Selenium 打卡页面后，它默认打开的是在父级 Frame 里的操作。

如果需要获取到子 Frame 里面的节点，需要调用 `switch_to.frame()` 方法来切换 Frame

In [3]:
from selenium import webdriver
from selenium.common.exceptions import NoSuchElementException
import time

browser  = webdriver.Chrome()
url = 'http://www.runoob.com/try/try.php?filename=jqueryui-api-droppable'
browser.get(url)
browser.switch_to.frame('iframeResult')
try:
    logo = browser.find_element_by_class_name('logo')
except NoSuchElementException:
    print('No Logo')
browser.switch_to.parent_frame()
logo = browser.find_element_by_class_name('logo')
print(logo)
print(logo.text)

No Logo
<selenium.webdriver.remote.webelement.WebElement (session="e8aef9cfd52167f87fd444a6c491c6de", element="a9ca5662-d41e-4822-a377-2d6cece7e930")>
RUNOOB.COM


## 11. 延时等待
> get 方法会在**网页框架加载后**结束执行，此时如果获取 page_source，可能并不是浏览器完全加载完成的页面

如果页面存在 Ajax 请求，我们的网页源代码也不一定能成功获取，所以需要延时等待一段事件，确保节点已经加载出来。
+ **隐式等待**
    - **概念** 当使用隐式等待执行测试的时候，如果 Selenium 没有在 DOM 中找到节点，将继续等待，超出设定的时间后，会抛出异常。换句话说，隐式等待将等待一段时间再查找 DOM，默认事件是 0.
    - **缺点**
    页面的加载时间受网络影响，而设置的等待时间是一个固定值，所以不一定能达到目的。

In [5]:
from selenium import webdriver

browser = webdriver.Chrome()
browser.implicitly_wait(10)
browser.get('https://www.zhihu.com/explore')
input = browser.find_element_by_class_name('zu-top-add-question')
print(input)

NoSuchElementException: Message: no such element: Unable to locate element: {"method":"css selector","selector":".zu-top-add-question"}
  (Session info: chrome=93.0.4577.82)


+ **显示等待**
1. 指定要查找的节点，设置一个最长等待时间
2. 在规定时间内加载出来了这个节点，就返回这个节点
3. 如果到了规定时间没有加载出来，则抛出超时异常

In [6]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

browser = webdriver.Chrome()
browser.get('http://www.taobao.com/')
wait = WebDriverWait(browser, 10)
input = wait.until(EC.presence_of_element_located((By.ID, 'q')))
button = wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR, '.btn-search')))
print(input, button)

<selenium.webdriver.remote.webelement.WebElement (session="d1ae110ca6e810336d46c4b91c13b62d", element="c34f840b-323b-4bd7-b515-b4c5b1e85244")> <selenium.webdriver.remote.webelement.WebElement (session="d1ae110ca6e810336d46c4b91c13b62d", element="649f8906-b685-48e0-a23d-6d9f6bce3965")>


## 12.前进和后退
+ 前进: `forward()` 方法
+ 后退：`back()` 方法

## 13. Cookies 
+ 获取：`get_cookies()`
+ 添加：`add_cookie()`
+ 删除：`delete_all_cookies()`

## 14. 选项卡管理
+ 开启新的选项卡
调用 `execute_script()` 方法
    - 传入 Javascript语句 `window.open()` 新开启一个选项卡
+ 获取当前开启的所有选项卡
调用 window_handles 属性：返回的是选项卡的代号列表
+ 切换选项卡
调用 `switch_to_window()` 方法
    - 传入参数 `window_handles[i]`，i 表示第 i+1 个选项卡

In [14]:
from selenium import webdriver
import time

browser = webdriver.Chrome()
browser.get('https://www.baidu.com/')
browser.execute_script('window.open()')
browser.switch_to.window(browser.window_handles[1])
browser.get('https://www.taobao.com/')
time.sleep(1)
browser.switch_to.window(browser.window_handles[0])
browser.get('https://python.org')