# 匯入自動測試工具相關套件

In [6]:
'''
匯入套件
'''
# 操作 browser 的 API
from selenium.webdriver.chrome.service import Service
from selenium import webdriver

# 處理逾時例外的工具
from selenium.common.exceptions import TimeoutException

# 面對動態網頁，等待某個元素出現的工具，通常與 exptected_conditions 搭配
from selenium.webdriver.support.ui import WebDriverWait

# 搭配 WebDriverWait 使用，對元素狀態的一種期待條件，若條件發生，則等待結束，往下一行執行
from selenium.webdriver.support import expected_conditions as EC

# 期待元素出現要透過什麼方式指定，通常與 EC、WebDriverWait 一起使用
from selenium.webdriver.common.by import By

# 強制等待 (執行期間休息一下)
from time import sleep

'''
selenium 啓動 Chrome 的進階配置參數
參考網址：https://stackoverflow.max-everyday.com/2019/12/selenium-chrome-options/
'''
driver_path = 'C:/Users/student/python_web_scraping/chromedriver-win64/chromedriver.exe'
#driver = webdriver.Chrome(executable_path=driver_path)
# 啟動瀏覽器工具的選項
# my_options = webdriver.ChromeOptions()
# # my_options.add_argument("--headless")                #不開啟實體瀏覽器背景執行
# my_options.add_argument("--start-maximized")         #最大化視窗
# my_options.add_argument("--incognito")               #開啟無痕模式
# my_options.add_argument("--disable-popup-blocking") #禁用彈出攔截
# my_options.add_argument("--disable-notifications")  #取消 chrome 推播通知
# my_options.add_argument("--lang=zh-TW")  #設定為正體中文


# 使用 Chrome 的 WebDriver
# my_service = Service(executable_path="./chromedriver.exe")
driver = webdriver.Chrome(
    # options = my_options,
    # executable_path=driver_path
#     service = my_service
)

WebDriverException: Message: 'chromedriver' executable needs to be in PATH. Please see https://sites.google.com/a/chromium.org/chromedriver/home


In [None]:
from selenium import webdriver

# 創建 ChromeOptions 實例
my_options = webdriver.ChromeOptions()

# 添加命令行參數
my_options.add_argument("--headless")  # 無頭模式
my_options.add_argument("--disable-gpu")  # 禁用 GPU
my_options.add_argument("--start-maximized")  # 窗口最大化
my_options.add_argument("--window-size=1920,1080")  # 設置窗口大小

# 添加實驗性選項
my_options.add_experimental_option("excludeSwitches", ["enable-automation"])  # 禁用自動化標籤
my_options.add_experimental_option("prefs", {
    "credentials_enable_service": False,
    "profile.password_manager_enabled": False
})  # 禁用密碼管理彈窗

# 添加擴展程序
# my_options.add_extension("/path/to/extension.crx")

# 指定 Chrome 執行檔路徑
# my_options.binary_location = "/path/to/chrome"

# 設置調試地址
# my_options.debugger_address = "127.0.0.1:9222"

# 創建 WebDriver 實例並應用配置
driver = webdriver.Chrome(options=my_options)

# 打開測試頁面
driver.get("https://www.google.com")
print(driver.title)

# 關閉瀏覽器
driver.quit()


# 在瀏覽器中執行自訂 JavaScript 程式

In [None]:
# 開啟網頁
driver.get("https://crptransfer.moe.gov.tw/")

# 跳出 alert 視窗 (在 chrome 裡面執行 javascript 語法)
driver.execute_script("window.alert('這是我們自訂的彈跳視窗');")

# 等個幾秒
sleep(3)

# 點選彈出裡面的確定按鈕
driver.switch_to.alert.accept()

# 輸入文字，送出表單

In [None]:
# 開啟網頁
driver.get("https://crptransfer.moe.gov.tw/")

# 尋找網頁中的搜尋框
inputElement = driver.find_element(
    By.CSS_SELECTOR, 'input#SN'
)

# 在搜尋框中輸入文字
inputElement.send_keys("人帥真好")

# 睡個幾秒
sleep(2)

# 送出搜尋
inputElement.submit()

# 搜尋結果的 CSS Selector
cssSelector = "body > table > tbody > tr:nth-child(1) > td > main > article > div > table > tbody > tr:nth-child(2) > td"

try:
    # 等待網頁搜尋結果
    WebDriverWait(driver, 10).until(
        EC.presence_of_element_located(
            (By.CSS_SELECTOR, cssSelector)
        )
    )
    
    # 取得第一頁搜尋結果
    element = driver.find_element(
        By.CSS_SELECTOR, cssSelector
    )
    
    # 輸出想要爬取的文字
    print(element.text) 
    print(element.get_attribute('innerText')) # 另一種寫法
except TimeoutException:
    print('等待逾時！')

# 輸入文字，按下送出鈕

In [None]:
# 開啟網頁
driver.get("https://www.104.com.tw/jobs/main/")

# 尋找網頁中的搜尋框
inputElement = driver.find_element(
    By.CSS_SELECTOR, 'input[data-gtm-index^="搜尋欄位"]'
)

# 在搜尋框中輸入文字
inputElement.send_keys("python")

# 睡個幾秒
sleep(3)

# 按鈕選擇器
cssSelectorBtn = 'button.btn[type="submit"][data-gtm-index^="搜尋欄位"]'

try:
    # 等待元素
    WebDriverWait(driver, 10).until(
        EC.presence_of_element_located(
            (By.CSS_SELECTOR, cssSelectorBtn)
        )
    )
    
    # 取得按鈕元素
    btn = driver.find_element(
        By.CSS_SELECTOR, cssSelectorBtn
    )
    
    # 按下按鈕
    btn.click()
except TimeoutException:
    print('等待逾時！')

# 刷新頁面 (類似 F5 或 Ctrl + R)

In [None]:
# 開啟網頁
driver.get("https://reurl.cc/jR725D")

# 睡個幾秒
sleep(3)

# 刷新頁面
driver.refresh()

# 睡個幾秒
sleep(3)

# 刷新頁面
driver.refresh()

# 睡個幾秒
sleep(3)

# 關閉瀏覽器
driver.quit()