# Selenium Basic Examples

In [8]:
from selenium import webdriver
from bs4 import BeautifulSoup

# enable headless mode
options = webdriver.ChromeOptions()
options.add_argument("--headless=new")

## Selenium Basic Connection and Data Retrieval

In [9]:
with webdriver.Chrome(options=options) as driver:
    # 連線
    driver.get("https://www.google.com")

    # 取得網頁內容
    content = driver.page_source  # 取得網頁 HTML 原始碼
    print(content)

<html itemscope="" itemtype="http://schema.org/WebPage" lang="zh-TW"><head><meta charset="UTF-8"><meta content="/images/branding/googleg/1x/googleg_standard_color_128dp.png" itemprop="image"><title>Google</title><script src="https://apis.google.com/_/scs/abc-static/_/js/k=gapi.gapi.en.24R2mrw_td8.O/m=gapi_iframes,googleapis_client/rt=j/sv=1/d=1/ed=1/rs=AHpOoo9vR1rNwOjC3PXOxUlyKiCwNBv2Fg/cb=gapi.loaded_0" nonce="" async=""></script><script nonce="">window._hst=Date.now();</script><script nonce="">(function(){var _g={kEI:'N77gZ9yRL5G4vr0P-bXYsA0',kEXPI:'31',kBL:'akeq',kOPI:89978449};(function(){var a;((a=window.google)==null?0:a.stvsc)?google.kEI=_g.kEI:window.google=_g;}).call(this);})();(function(){google.sn='webhp';google.kHL='zh-TW';})();(function(){
var g=this||self;function k(){return window.google&&window.google.kOPI||null};var l,m=[];function n(a){for(var b;a&&(!a.getAttribute||!(b=a.getAttribute("eid")));)a=a.parentNode;return b||l}function p(a){for(var b=null;a&&(!a.getAttribut

## Selenium with BeautifulSoup for Parsing

In [10]:
with webdriver.Chrome(options=options) as driver:
    # 連線
    driver.get("https://www.google.com")

    # 取得網頁內容
    html = driver.page_source  # 取得網頁 HTML 原始碼
    soup = BeautifulSoup(html, "html.parser")  # 進一步解析 HTML 內容
    print(soup)

<html itemscope="" itemtype="http://schema.org/WebPage" lang="zh-TW"><head><meta charset="utf-8"/><meta content="/images/branding/googleg/1x/googleg_standard_color_128dp.png" itemprop="image"/><title>Google</title><script async="" nonce="" src="https://apis.google.com/_/scs/abc-static/_/js/k=gapi.gapi.en.24R2mrw_td8.O/m=gapi_iframes,googleapis_client/rt=j/sv=1/d=1/ed=1/rs=AHpOoo9vR1rNwOjC3PXOxUlyKiCwNBv2Fg/cb=gapi.loaded_0"></script><script nonce="">window._hst=Date.now();</script><script nonce="">(function(){var _g={kEI:'Qr7gZ-KeIYKKvr0PhuThKA',kEXPI:'31',kBL:'akeq',kOPI:89978449};(function(){var a;((a=window.google)==null?0:a.stvsc)?google.kEI=_g.kEI:window.google=_g;}).call(this);})();(function(){google.sn='webhp';google.kHL='zh-TW';})();(function(){
var g=this||self;function k(){return window.google&&window.google.kOPI||null};var l,m=[];function n(a){for(var b;a&&(!a.getAttribute||!(b=a.getAttribute("eid")));)a=a.parentNode;return b||l}function p(a){for(var b=null;a&&(!a.getAttribu

## BeautifulSoup - Getting Web Elements

In [11]:
# seleum連線，取得網頁資料, bs4取得網頁元素
with webdriver.Chrome(options=options) as driver:
    # 連線
    driver.get("https://www.google.com")

    # 取得網頁內容
    html = driver.page_source  # 取得網頁 HTML 原始碼
    soup = BeautifulSoup(html, "html.parser")  # 進一步解析 HTML 內容

    # 取得網頁元素
    tag = soup.find("textarea", "gLFyf")
    print(tag)

<textarea aria-autocomplete="both" aria-controls="Alh6id" aria-expanded="false" aria-haspopup="false" aria-label="搜尋" aria-owns="Alh6id" autocapitalize="off" autocomplete="off" autocorrect="off" autofocus="" class="gLFyf" data-ved="0ahUKEwif8ff_0KGMAxVjk68BHSOaJpsQ39UDCAc" id="APjFqb" jsaction="paste:puy29d" maxlength="2048" name="q" placeholder="" role="combobox" rows="1" spellcheck="false" title="Google 搜尋" value=""></textarea>


## Selenium - Finding Elements by NAME

In [13]:
from selenium.webdriver.common.by import (
    By,
)  # 匯入 By 類別，用來指定元素的定位方式（如 ID、類別名稱、XPath 等）

In [14]:
with webdriver.Chrome(options=options) as driver:
    # 連線
    driver.get("https://www.google.com")

    # 取得標籤
    search_box = driver.find_element(By.NAME, "q")
    print(search_box.tag_name)  # 輸出tag_name
    print(search_box.get_attribute("name"))  # 輸出name屬性值

textarea
q


## Selenium - Simulating Input

In [16]:
import time

In [17]:
with webdriver.Chrome(options=options) as driver:
    # 連線
    driver.get("https://www.google.com")

    # 取得標籤
    search_box = driver.find_element(By.NAME, "q")

    # 輸入 "Selenium"
    search_box.send_keys("Selenium")

    # 提交搜尋
    search_box.submit()

    # 等待頁面載入完成
    time.sleep(3)
    
    # 取得頁面標題
    print(driver.title)

https://www.google.com/search?q=Selenium&sca_esv=4ad496d1768baf99&source=hp&ei=lr7gZ8jWFvLZ1e8PuvDbiQ8&iflsig=ACkRmUkAAAAAZ-DMppKns4oSqc9wduOnH2iXONfMCYno&sei=mL7gZ5KGHb-5vr0PlP_kgQ0


## Selenium - Simulating Clicks

In [18]:
with webdriver.Chrome(options=options) as driver:
    # 連線
    driver.get("https://www.ptt.cc/bbs/stock/index.html")

    # 取得標籤--查找 "‹ 上頁" 按鈕
    link = driver.find_element(By.LINK_TEXT, "‹ 上頁")

    # 模擬點擊
    link.click()

    # 等待頁面載入完成
    time.sleep(3)

    # 取得頁面標題
    print(driver.title)

看板 Stock 文章列表 - 批踢踢實業坊


### Exercise 1: Get Link URL Before Clicking

修改以上程式，在模擬點擊前，需先取得"‹ 上頁"的連結網址，並印出來。

In [19]:
with webdriver.Chrome(options=options) as driver:
    # 連線
    driver.get("https://www.ptt.cc/bbs/stock/index.html")

    # 取得標籤--查找 "‹ 上頁" 按鈕
    link = driver.find_element(By.LINK_TEXT, "‹ 上頁")

    # print out the link url
    print(link.get_attribute("href"))

    # 模擬點擊
    link.click()

https://www.ptt.cc/bbs/Stock/index8497.html


## Selenium - Finding Elements by TAG_NAME

In [None]:
from selenium.webdriver.common.by import (
    By,
)  # 匯入 By 類別，用來指定元素的定位方式（如 ID、類別名稱、XPath 等）

In [None]:
with webdriver.Chrome(options=options) as driver:
    # 連線
    driver.get("http://jwlin.github.io/py-scraping-analysis-book/ch2/table/table.html")

    # 取得tbody標籤
    tbody = driver.find_element(By.TAG_NAME, "tbody")

    # 取得 tr 標籤
    tags = tbody.find_elements(By.TAG_NAME, "tr")

    # 印出tr標籤下的所有文字
    for tag in tags:
        print(tag.text)

    # for tag in tags:
    #     print(tag.get_attribute("textContent")) #與上段一樣用法

初心者 - Python入門 初學者 1490
Python 網頁爬蟲入門實戰 有程式基礎的初學者 1890
Python 機器學習入門實戰 (預計) 有程式基礎的初學者 1890
Python 資料科學入門實戰 (預計) 有程式基礎的初學者 1890
Python 資料視覺化入門實戰 (預計) 有程式基礎的初學者 1890
Python 網站架設入門實戰 (預計) 有程式基礎的初學者 1890


### Exercise 2: Extract Book Titles Only

請修改以上程式，只要列出書名就好。提示：driver取得網頁元素(By.TAG_NAME)

In [21]:
with webdriver.Chrome(options=options) as driver:
    # 連線
    driver.get("http://jwlin.github.io/py-scraping-analysis-book/ch2/table/table.html")

    # 取得tbody標籤
    tbody = driver.find_element(By.TAG_NAME, "tbody")

    # 取得 tr 標籤
    tags = tbody.find_elements(By.TAG_NAME, "tr")

    # 取得第一個 td
    for tag in tags:
        print(tag.find_element(By.TAG_NAME, "td").text)

初心者 - Python入門
Python 網頁爬蟲入門實戰
Python 機器學習入門實戰 (預計)
Python 資料科學入門實戰 (預計)
Python 資料視覺化入門實戰 (預計)
Python 網站架設入門實戰 (預計)


### Exercise 3: Extract Book Titles, Prices, and Calculate Average Price

請修改以上程式，列出書名、售價，以及最後一行印出平均價格。提示：driver取得網頁元素(By.TAG_NAME)

In [27]:
import pandas as pd


book_info = {
    "書名": [],
    "售價": [],
}

with webdriver.Chrome(options=options) as driver:
    # 連線
    driver.get("http://jwlin.github.io/py-scraping-analysis-book/ch2/table/table.html")

    # 取得tbody標籤
    tbody = driver.find_element(By.TAG_NAME, "tbody")

    # 取得 tr 標籤
    tags = tbody.find_elements(By.TAG_NAME, "tr")

    # 列出每個tr標籤下的td標籤
    for tag in tags:
        rows = tag.find_elements(By.TAG_NAME, "td")
        book_info["書名"].append(rows[0].text)
        book_info["售價"].append(rows[2].text)

book_info_df = pd.DataFrame(book_info)
book_info_df

Unnamed: 0,書名,售價
0,初心者 - Python入門,1490
1,Python 網頁爬蟲入門實戰,1890
2,Python 機器學習入門實戰 (預計),1890
3,Python 資料科學入門實戰 (預計),1890
4,Python 資料視覺化入門實戰 (預計),1890
5,Python 網站架設入門實戰 (預計),1890


In [28]:
print(book_info_df["售價"].astype(float).mean())

1823.3333333333333


# Scraping News Websites

## Scraping Liberty Times News Headlines

In [29]:
from selenium import webdriver
from selenium.webdriver.common.by import By

In [30]:
with webdriver.Chrome(options=options) as driver:
    # 連線
    driver.get("https://www.ltn.com.tw/")

    # 取得所有新聞標題
    tags = driver.find_elements(By.TAG_NAME, "h3")

    # 顯示所所有標題
    print("所有新聞標題")
    for tag in tags:
        print(tag.text.strip())


所有新聞標題
焦點股》富喬：高階材料需求大增 帶量大漲
23歲純情女喜會男模網友 被索買點數收血腥照
言論自由危機？美移民局擬審查350萬人社群 發言恐成赴美關鍵
幼女罕病夫失業！少婦坐困公園湖畔 警偕善心人接力送暖
朴信惠「肩上超短髮」任韓職棒開球嘉賓！棒球衣穿上身簡直大學生

屏東竹田清晨大火！鐵皮屋燒融變形 4人送醫
MLB》太燙了！洋基新星6轟並列全壘打王 71億王牌左投5.1局送4K
中共9架次軍機擾台 將於26日發射火箭經過我ADIZ
美國欲對中製船舶徵高額港口費 恐引發「貿易末日」
米可白愛犬錢錢罹胃癌 昔被侯友宜叫錯現身打氣
借派出所停車爭議延燒 彰化縣議員賴清美擬告網友騷擾
爆徐巧芯佔場地不用 吳靜怡喊她老公酸：辦德州撲克賽好了
尹錫悅命運風向球！ 代理總統韓悳洙彈劾案被駁回
不會被 Android 吐槽了？傳蘋果 iPhone 17 螢幕要補上這規格
焦點股》穩懋：擠進輝達CPO供應鏈 法人力挺
窮人為何依然貧窮? 羅伯特清崎：主因是因為「它」
獨家》3千病患不再是遊牧民族 骨科名醫黃鐙樂醫院啟用
「來恆春擁抱宇宙」首波成功 還有3週觀星主題活動吸引人潮
重大轉變！日本研擬不依靠美軍 自主發射長程飛彈
館長撂驚語 「女的在健身房被壓死算了，沒人要救」
財經週報〉ETF熱潮輪動 今年市值型ETF當家
中配網紅聞回祖國崩潰　中網友酸桃園機場三結義
TPBL捕捉超兇正妹 核彈級雪乳呼之欲出
50年傳統斷了！日《產經》台灣雙十特輯 因我預算遭砍停刊
健康網》鳳梨釋迦不是鳳梨親戚！
華南銀行響應Earth Hour關燈一小時 串連全臺分行連續關燈3天
米荒！日本米價飆漲8成 民眾恐慌囤米
今暖熱如夏！西半部上看30度 各地早晚溫差大
傳台積寶山2奈米將量產iPhone 18 Pro 季辛格急問這件事
TPBL》夢想家、攻城獅爆揮拳衝突！
憾！玉山男女山友墜380米深谷遭雪埋 23日下切尋獲不幸雙亡吊掛下山（南投縣消防局／玉管處提供）
自由說新聞》史書華赴民眾黨「人民要當家」邀黃國昌連署遭推倒！四叉貓估：現場僅有300人！












飛蚊症不可逆、４症狀要注意！專家教護眼３營養素比葉黃素更好





















鼓吹武統2中配直播互取暖 得知限期離境瞬間臉垮讓網熱議
彰縣議員賴清美借派出所停車遭警轟出 警局長陳明君要查真相

## Exercise 4: Scrape Breaking News Headlines from Liberty Times

In [None]:
# "data-desc": "即時清單" > h3

with webdriver.Chrome(options=options) as driver:
    # 連線
    driver.get("https://www.ltn.com.tw/")

    # 取得所有新聞標題
    tags = driver.find_elements(By.CSS_SELECTOR, "div[data-desc='即時清單'] h3")

    # 顯示即時清單
    print("即時清單")
    for tag in tags:
        print(tag.text.strip())

即時清單
長榮海運3現、前任船員 利用安檢漏洞自泰國走私600萬元毒品
焦點股》富喬：高階材料需求大增 帶量大漲
23歲純情女喜會男模網友 被索買點數收血腥照
言論自由危機？美移民局擬審查350萬人社群 發言恐成赴美關鍵
幼女罕病夫失業！少婦坐困公園湖畔 警偕善心人接力送暖

朴信惠「肩上超短髮」任韓職棒開球嘉賓！棒球衣穿上身簡直大學生
屏東竹田清晨大火！鐵皮屋燒融變形 4人送醫
MLB》太燙了！洋基新星6轟並列全壘打王 71億王牌左投5.1局送4K
中共9架次軍機擾台 將於26日發射火箭經過我ADIZ
美國欲對中製船舶徵高額港口費 恐引發「貿易末日」
米可白愛犬錢錢罹胃癌 昔被侯友宜叫錯現身打氣
借派出所停車爭議延燒 彰化縣議員賴清美擬告網友騷擾
爆徐巧芯佔場地不用 吳靜怡喊她老公酸：辦德州撲克賽好了
尹錫悅命運風向球！ 代理總統韓悳洙彈劾案被駁回
不會被 Android 吐槽了？傳蘋果 iPhone 17 螢幕要補上這規格
焦點股》穩懋：擠進輝達CPO供應鏈 法人力挺
窮人為何依然貧窮? 羅伯特清崎：主因是因為「它」
獨家》3千病患不再是遊牧民族 骨科名醫黃鐙樂醫院啟用
「來恆春擁抱宇宙」首波成功 還有3週觀星主題活動吸引人潮
重大轉變！日本研擬不依靠美軍 自主發射長程飛彈























## Exercise 5: Scrape PTT Headlines

抓取PTT以下網址的標題 - selenium

In [34]:
url = "https://www.ptt.cc/bbs/stock/index.html"

with webdriver.Chrome(options=options) as driver:
    # 連線
    driver.get(url)

    # 取得所有新聞標題
    tags = driver.find_elements(By.CSS_SELECTOR, "div.title")

    # 顯示所有標題
    print("所有標題")
    for tag in tags:
        print(tag.text.strip())


所有標題
[情報] 華爾街大摩計畫裁員2000人以控制成本
Re: [新聞] 馬斯克:特斯拉人形機器人Optimus今年試
[新聞] 移民金卡計畫成功？ 美商務部長喜揭「買
[公告] 股票板板規 v4.7 (2024/10/06 修正)
Fw: [公告] 請留意新註冊帳號使用信件詐騙
[公告] 4-6-1的初犯罰則在三個月內將加重至30天
[閒聊] 2025/03/24 盤中閒聊


## Exercise 6: Scrape Current and Previous PTT Page Headlines

In [35]:
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

In [36]:
# 問題: 續上題， 抓取上題第一頁與"上一頁"標題-selenium

url = "https://www.ptt.cc/bbs/stock/index.html"

with webdriver.Chrome(options=options) as driver:
    # 連線
    driver.get(url)

    # 取得所有新聞標題
    tags = driver.find_elements(By.CSS_SELECTOR, "div.title")

    print("Page 1")
    for tag in tags:
        print(tag.text.strip())

    # 取得"上一頁"按鈕
    link = driver.find_element(By.LINK_TEXT, "‹ 上頁")

    # 模擬點擊
    link.click()

    # 等待頁面載入完成
    WebDriverWait(driver, 10).until(EC.presence_of_element_located((By.CSS_SELECTOR, "div.title")))

    # 取得所有新聞標題
    tags = driver.find_elements(By.CSS_SELECTOR, "div.title")

    print("Page 2")
    for tag in tags:
        print(tag.text.strip())

Page 1
[情報] 華爾街大摩計畫裁員2000人以控制成本
Re: [新聞] 馬斯克:特斯拉人形機器人Optimus今年試
[新聞] 移民金卡計畫成功？ 美商務部長喜揭「買
[公告] 股票板板規 v4.7 (2024/10/06 修正)
Fw: [公告] 請留意新註冊帳號使用信件詐騙
[公告] 4-6-1的初犯罰則在三個月內將加重至30天
[閒聊] 2025/03/24 盤中閒聊
Page 2
[新聞] 雲豹能源 今年開啟高成長元年
Re: [心得] 0050 VS 00713 報酬率比較
Re: [新聞] 馬斯克:特斯拉人形機器人Optimus今年試
[標的] WM.US 美國垃圾太多美股FIRE多
[新聞] 不是合資，英特爾要併購台積電？
Re: [新聞] 馬斯克:特斯拉人形機器人Optimus今年試
Re: [標的] 6725矽科宏晟 高手分點介入.和淞第二 多
[新聞] 川普說話了！破壞特斯拉可判刑20年 恐送
Re: [新聞] 馬斯克:特斯拉人形機器人Optimus今年試
Re: [新聞] 馬斯克:特斯拉人形機器人Optimus今年試
[心得] 03月當沖心得-已畢業
[新聞] 合庫：房價恐修正5%至10%
[新聞] 傳台積寶山2奈米將量產iPhone 18 Pro 季
Re: [新聞] 傳台積寶山2奈米將量產iPhone 18 Pro 季
[新聞] 聯準會維持年內降2碼預估 債市買點浮現
[新聞] 「印度製造」挫敗！3產業難敵陸輾壓...
Re: [新聞] 馬斯克：特斯拉人形機器人Optimus今年試
(本文已被刪除) [greattower]
[標的] 港股推不動 大盤空手
[閒聊] 2025/03/24 盤中閒聊


# Scrolling Web Pages for Dynamic Content

## Liberty Times News with Page Scrolling

In [None]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from bs4 import BeautifulSoup
import time

In [37]:
with webdriver.Chrome(options=options) as driver:
    # 連線自由時報新聞網站
    driver.get("https://news.ltn.com.tw/")

    # 捲動視窗並等待瀏覽器載入更多的內容
    driver.execute_script(
        "window.scrollTo(0,document.body.scrollHeight);"
    )  # 捲動視窗到底部
    time.sleep(3)  # 等待3秒鐘

    # 取得網頁原始碼
    html = driver.page_source
    soup = BeautifulSoup(html, "html.parser")


    ## 取得所有新聞標題
    tags = soup.find_all("h3")  # 找出所有 h3 標籤（一般新聞標題）

    # 顯示所所有標題
    print("所有新聞標題")
    for tag in tags:
        print(tag.text.strip())


    ##取得熱門新聞標題
    titles = soup.find("div", class_="hotnews bg boxTitle boxText").find_all("a")

    # 顯示所所有熱門新聞標題
    print("熱門新聞標題")
    for title in titles:
        print(title.text)


所有新聞標題
MLB》太燙了！洋基新星6轟並列全壘打王 71億王牌左投5.1局送4K
中共9架次軍機擾台 將於26日發射火箭經過我ADIZ
美國欲對中製船舶徵高額港口費 恐引發「貿易末日」
焦點股》富喬：高階材料需求大增 帶量大漲
23歲純情女喜會男模網友 被索買點數收血腥照
言論自由危機？美移民局擬審查350萬人社群 發言恐成赴美關鍵
幼女罕病夫失業！少婦坐困公園湖畔 警偕善心人接力送暖
朴信惠「肩上超短髮」任韓職棒開球嘉賓！棒球衣穿上身簡直大學生
屏東竹田清晨大火！鐵皮屋燒融變形 4人送醫
MLB》太燙了！洋基新星6轟並列全壘打王 71億王牌左投5.1局送4K
中共9架次軍機擾台 將於26日發射火箭經過我ADIZ
美國欲對中製船舶徵高額港口費 恐引發「貿易末日」
焦點股》富喬：高階材料需求大增 帶量大漲
23歲純情女喜會男模網友 被索買點數收血腥照
言論自由危機？美移民局擬審查350萬人社群 發言恐成赴美關鍵
米可白愛犬錢錢罹胃癌 昔被侯友宜叫錯現身打氣
借派出所停車爭議延燒 彰化縣議員賴清美擬告網友騷擾
爆徐巧芯佔場地不用 吳靜怡喊她老公酸：辦德州撲克賽好了
尹錫悅命運風向球！ 代理總統韓悳洙彈劾案被駁回
不會被 Android 吐槽了？傳蘋果 iPhone 17 螢幕要補上這規格
焦點股》穩懋：擠進輝達CPO供應鏈 法人力挺
窮人為何依然貧窮? 羅伯特清崎：主因是因為「它」
獨家》3千病患不再是遊牧民族 骨科名醫黃鐙樂醫院啟用
「來恆春擁抱宇宙」首波成功 還有3週觀星主題活動吸引人潮
重大轉變！日本研擬不依靠美軍 自主發射長程飛彈
館長撂驚語  「女的在健身房被壓死算了，沒人要救」
窮人為何依然貧窮? 羅伯特清崎：主因是因為「它」
獨家》3千病患不再是遊牧民族 骨科名醫黃鐙樂醫院啟用
「來恆春擁抱宇宙」首波成功 還有3週觀星主題活動吸引人潮
重大轉變！日本研擬不依靠美軍 自主發射長程飛彈
館長撂驚語  「女的在健身房被壓死算了，沒人要救」
高溫上看30度熱到星期四 週末北台轉濕涼「冬衣還不能收」
Google 證實搞丟用戶「時間軸」紀錄！搶救方法曝光
自由開講》自己選的自己罷
MLB》菅野智之進入金鶯先發輪值 開幕4連戰對藍鳥迎來大聯盟首秀
MLB》悲情！受傷就被釋出 水手掰了生涯130轟明星外野手
MLB》台美混血好手卡洛爾連6場比賽敲安！「費仔」打擊率持

### Exercise 7: Multiple Page Scrolling

In [38]:
with webdriver.Chrome(options=options) as driver:
    # 連線自由時報新聞網站
    driver.get("https://news.ltn.com.tw/")

    # 使用更可靠的捲動方式，確保動態內容載入
    # 初始捲動位置
    last_height = driver.execute_script("return document.body.scrollHeight")
    
    # 捲動三次，每次捲動後等待新內容載入
    for _ in range(3):
        # 捲動到頁面底部
        driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
        
        # 等待新內容載入
        time.sleep(2)
        
        # 計算新的捲動高度
        new_height = driver.execute_script("return document.body.scrollHeight")
        
        # 如果高度沒有變化，表示已經到底部，不需要再捲動
        if new_height == last_height:
            break
            
        last_height = new_height

    # 取得網頁原始碼
    html = driver.page_source
    soup = BeautifulSoup(html, "html.parser")

    ## 取得所有新聞標題
    tags = soup.find_all("h3")  # 找出所有 h3 標籤（一般新聞標題）

    # 顯示所有標題
    print("所有新聞標題")
    for tag in tags:
        print(tag.text.strip())

    ##取得熱門新聞標題
    hot_news_div = soup.find("div", class_="hotnews bg boxTitle boxText")
    if hot_news_div:
        titles = hot_news_div.find_all("a")
        
        # 顯示所有熱門新聞標題
        print("熱門新聞標題")
        for title in titles:
            print(title.text.strip())
    else:
        print("找不到熱門新聞區塊")


所有新聞標題
焦點股》富喬：高階材料需求大增 帶量大漲
23歲純情女喜會男模網友 被索買點數收血腥照
言論自由危機？美移民局擬審查350萬人社群 發言恐成赴美關鍵
金價3100美元何時到？本週「這件大事」是引爆關鍵
中國製害的！賽格威電動滑板車有摔倒風險 召回22萬台
嘉義長榮文苑五週年優惠！身分證2個5免費入住、5位同行1人免費吃美食
內衣女神周曉涵同框Jisoo  一早急發炫耀文
NBA》3屆MVP約基奇恐連續缺席5場 金塊主帥曝復出時間表
長榮海運3現、前任船員 利用安檢漏洞自泰國走私600萬元毒品
焦點股》富喬：高階材料需求大增 帶量大漲
23歲純情女喜會男模網友 被索買點數收血腥照
言論自由危機？美移民局擬審查350萬人社群 發言恐成赴美關鍵
金價3100美元何時到？本週「這件大事」是引爆關鍵
中國製害的！賽格威電動滑板車有摔倒風險 召回22萬台
嘉義長榮文苑五週年優惠！身分證2個5免費入住、5位同行1人免費吃美食
幼女罕病夫失業！少婦坐困公園湖畔 警偕善心人接力送暖
朴信惠「肩上超短髮」任韓職棒開球嘉賓！棒球衣穿上身簡直大學生
屏東竹田清晨大火！鐵皮屋燒融變形 4人送醫
MLB》太燙了！洋基新星6轟並列全壘打王 71億王牌左投5.1局送4K
中共9架次軍機擾台 將於26日發射火箭經過我ADIZ
美國欲對中製船舶徵高額港口費 恐引發「貿易末日」
米可白愛犬錢錢罹胃癌 昔被侯友宜叫錯現身打氣
借派出所停車爭議延燒 彰化縣議員賴清美擬告網友騷擾
爆徐巧芯佔場地不用 吳靜怡喊她老公酸：辦德州撲克賽好了
尹錫悅命運風向球！ 代理總統韓悳洙彈劾案被駁回
不會被 Android 吐槽了？傳蘋果 iPhone 17 螢幕要補上這規格
窮人為何依然貧窮? 羅伯特清崎：主因是因為「它」
獨家》3千病患不再是遊牧民族 骨科名醫黃鐙樂醫院啟用
「來恆春擁抱宇宙」首波成功 還有3週觀星主題活動吸引人潮
重大轉變！日本研擬不依靠美軍 自主發射長程飛彈
館長撂驚語  「女的在健身房被壓死算了，沒人要救」
高溫上看30度熱到星期四 週末北台轉濕涼「冬衣還不能收」
Google 證實搞丟用戶「時間軸」紀錄！搶救方法曝光
自由開講》自己選的自己罷
MLB》菅野智之進入金鶯先發輪值 開幕4連戰對藍鳥迎來大聯盟首秀
MLB》悲情！受傷就被釋出 水手掰了生涯130轟明星外野手
MLB》台美混血好

# Handling Dynamic Web Content (Dcard Example)

## Scraping Dcard Relationship Forum

In [39]:
with webdriver.Chrome(options=options) as driver:
    # 連線 dcard 感情版
    driver.get("https://www.dcard.tw/f/relationship")

    ## 取得文章標題
    articles = driver.find_elements(By.TAG_NAME, "h2")

    # 顯示標題。最後結果沒有成功，因為網頁資料還沒載入
    for article in articles:
        print(article.text.strip())

You are unable to access dcard.tw
Why have I been blocked?
What can I do to resolve this?


### Exercise 8: Handling Dynamic Content Loading for Dcard

In [44]:
with webdriver.Chrome() as driver:
    # 連線 dcard 感情版
    driver.get("https://www.dcard.tw/f/relationship")

    # 等待動態內容載入
    WebDriverWait(driver, 10).until(
        EC.presence_of_element_located((By.CSS_SELECTOR, "p[style='--5xwyke: var(--color-text-primary);']"))
    )
    
    # 取得文章標題
    articles = driver.find_elements(By.TAG_NAME, "h2")
    
    # 顯示標題
    for article in articles:
        print(article.text.strip())


被老闆喜歡怎麼辦
到底是女友講話太雞掰還是我太敏感
#微微西斯：和相差17歲的ig網美交往，但她居然…
想搶別人男友...請勸退我
男生交往是為了做愛嗎？
不知道是好還是壞
到你家睡一晚
單身的人周末都是怎麼度過的?
因為男友的一句話，我崩潰了
因為遠距離覺得快愛不下去了
GG工程師擇偶標準
老公外遇了，妳會同意他開的以下條件嗎？
五年相識到相愛的初戀感情畫下休止符
女友發脾氣時的行爲
我也想知道我的擇偶條件是否太高
GG工程師擇偶標準
原諒老公外遇後
愛愛
男生交往不是為了做愛！不是！！
男生交往是為了做愛嗎？
交友軟體很快在一起好嗎？認真求建議
婚前腦子進的水，是婚後流的淚
男友一直想做
