# selenium 元素定位

**元素定位**
    
自动化要做的就是模拟鼠标和键盘来操作这些元素，点击、输入等等。操作这些元素前首先要找到他们，WebDriver提供很多定位元素的方法。

`find_element()`

早期的selenium提供了针对id、name、xpath等多种方式的具体方法来定位到具体的元素，比如find_element_by_id()、find_element_by_name()等。
在后续的升级中，这些方法被弃用了，现在统一使用find_element(by=By.ID, value=None)方法，该方法包含了id、name、xpath等定位方式。

| 定位方式               | 描述                                      |
|-----------------------|------------------------------------------|
| By.ID                 | 根据查找标签中的id属性来定位元素              |
| By.NAME               | 根据查找标签中的name属性来定位元素            |
| By.CLASS_NAME         | 根据class属性指定的值来查找元素              |
| By.CSS_SELECTOR       | 根据css选择器的方式来查找元素，同bs4语法       |
| By.XPATH              | 根据XPath语法来查找元素                       |
| By.LINK_TEXT          | 查找文本精确匹配的a标签元素                   |
| By.PARTIAL_LINK_TEXT  | 查找文本模糊匹配的a标签元素                   |
| By.TAG_NAME           | 根据标签名称来查找元素，不太好用，不常用          |



`find_elements()`

返回的是一个列表，包含了所有符合条件的元素，如果没有找到，返回空列表。


In [None]:
# chrome 和 chromedriver 下载下来的位置：
# ~/chrome-linux64/chrome 和 ~/chromedriver-linux64/chromedriver

# 导入selenium
import os.path
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.options import Options

## Setup chrome options
chrome_options = Options()
chrome_options.add_argument("--headless")  # Ensure GUI is off
chrome_options.add_argument("--no-sandbox")

# Set path to chrome and chromedriver as per your configuration
homedir = os.path.expanduser("~")
chrome_options.binary_location = f"{homedir}/chrome-linux64/chrome"
webdriver_service = Service(f"{homedir}/chromedriver-linux64/chromedriver")

# 创建浏览器操作对象
browser = webdriver.Chrome(service=webdriver_service, options=chrome_options)

# Get page
url = "https://www.baidu.com"
browser.get(url)


In [None]:

# 元素定位

# 根据id属性的值来获取对象
button = browser.find_element(By.ID, "su")
print(button)

In [None]:
# 根据name属性的值来获取对象 
# e.g., <input id="kw" name="wd" class="s_ipt" value="" maxlength="255" autocomplete="off">
button = browser.find_element(By.NAME, "wd")
print(button)

In [None]:
# 根据class属性的值来获取对象 
# e.g., <input id="kw" name="wd" class="s_ipt" value="" maxlength="255" autocomplete="off">
button = browser.find_element(By.CLASS_NAME, "s_ipt")
print(button)

In [None]:
# 根据xpath语句来获取对象
button = browser.find_element(By.XPATH, '//input[@id="su"]')
print(button)

In [None]:
# 根据标签的名字来获取对象
button = browser.find_elements(By.TAG_NAME, "input")
print(button)

In [None]:
# 使用bs4的语法来获取对象
button = browser.find_element(By.CSS_SELECTOR, '#su')
print(button)

In [None]:
# 根据链接文本来获取对象
button = browser.find_element(By.LINK_TEXT, '新闻')
print(button)

In [None]:
# 根据链接文本的部分内容来获取对象
button = browser.find_elements(By.PARTIAL_LINK_TEXT, '新')
print(button)

In [None]:

# 关闭浏览器
browser.quit()