In [1]:
# 操作 browser 的 API
from selenium import webdriver
from selenium.webdriver.chrome.service import Service

# ChromeDriver 的下載管理工具
from webdriver_manager.chrome import ChromeDriverManager

# 處理逾時例外的工具
from selenium.common.exceptions import TimeoutException

# 面對動態網頁，等待某個元素出現的工具，通常與 exptected_conditions 搭配
from selenium.webdriver.support.ui import WebDriverWait

# 搭配 WebDriverWait 使用，對元素狀態的一種期待條件，若條件發生，則等待結束，往下一行執行
from selenium.webdriver.support import expected_conditions as EC

# 期待元素出現要透過什麼方式指定，通常與 EC、WebDriverWait 一起使用
from selenium.webdriver.common.by import By


# 啟動瀏覽器工具的選項
my_options = webdriver.ChromeOptions()
# my_options.add_argument("--headless")                #不開啟實體瀏覽器背景執行
my_options.add_argument("--start-maximized")         #最大化視窗
my_options.add_argument("--incognito")               #開啟無痕模式
my_options.add_argument("--disable-popup-blocking") #禁用彈出攔截
my_options.add_argument("--disable-notifications")  #取消 chrome 推播通知
my_options.add_argument("--lang=zh-TW")  #設定為正體中文

# 使用 Chrome 的 WebDriver
driver = webdriver.Chrome(
    options = my_options,
)

# 儲存資料的變數
list_data = []

In [2]:
# 連續開 2 個分頁
for i in range(2):
    driver.execute_script(f'window.open("");')

In [3]:
# 切換到初始分頁 (索引為 0)
driver.switch_to.window( driver.window_handles[0] )

In [4]:
# 將所有 tabs 轉址，以便取得對應列表
for index in range(1, len(driver.window_handles)):
    #切換分頁
    driver.switch_to.window(
        driver.window_handles[index]
    )

    # 使分頁自動連結到指定網址
    driver.get(f"https://web-ch.scu.edu.tw/chinese/file/3423?page={index}")

In [7]:
# 取得分頁列表
for index in range(1, len(driver.window_handles)):
    #切換分頁
    driver.switch_to.window(
        driver.window_handles[index]
    )

    # 取得列表連結與內文
    for a in driver.find_elements(By.CSS_SELECTOR, 'table.table.table-striped.table-border tbody tr a'): 
        list_data.append({
            'title': a.get_attribute('innerText'),
            'link': a.get_attribute('href')
        })

In [9]:
# 讀最後一頁開始，把所有分頁關掉 (初始頁要保留)
while len(driver.window_handles) > 1:
    # 切換分頁
    driver.switch_to.window(
        driver.window_handles[ len(driver.window_handles) - 1 ]
    )

    # 關閉分頁 (與 driver.quit() 不同)
    driver.close()

In [10]:
# 關閉瀏覽器
driver.quit()

In [11]:
list_data

[{'title': '《東吳中文學報》第46期',
  'link': 'https://web-ch.scu.edu.tw/chinese/file/3423/14878'},
 {'title': '《東吳中文學報》第45期',
  'link': 'https://web-ch.scu.edu.tw/chinese/file/3423/14147'},
 {'title': '《東吳中文學報》第44期',
  'link': 'https://web-ch.scu.edu.tw/chinese/file/3423/13608'},
 {'title': '《東吳中文學報》第43期',
  'link': 'https://web-ch.scu.edu.tw/chinese/file/3423/12516'},
 {'title': '《東吳中文學報》第42期',
  'link': 'https://web-ch.scu.edu.tw/chinese/file/3423/11777'},
 {'title': '《東吳中文學報》第41期',
  'link': 'https://web-ch.scu.edu.tw/chinese/file/3423/11013'},
 {'title': '《東吳中文學報》第40期',
  'link': 'https://web-ch.scu.edu.tw/chinese/file/3423/10279'},
 {'title': '《東吳中文學報》第39期',
  'link': 'https://web-ch.scu.edu.tw/chinese/file/3423/9564'},
 {'title': '《東吳中文學報》第38期',
  'link': 'https://web-ch.scu.edu.tw/chinese/file/3423/9004'},
 {'title': '《東吳中文學報》第37期',
  'link': 'https://web-ch.scu.edu.tw/chinese/file/3423/8765'},
 {'title': '《東吳中文學報》第36期',
  'link': 'https://web-ch.scu.edu.tw/chinese/file/3423/7834'},
 {'