# 00 - requests usage

In [1]:
import requests
from bs4 import BeautifulSoup

## 基本 requests 使用

### Success case (2xx)

In [2]:
url = "https://jwlin.github.io/py-scraping-analysis-book/ch1/connect.html"
resp = requests.get(url)
print(resp.status_code)

if resp.status_code == 200:
    print("Request success with status code:", resp.status_code)
else:
    print("Request failed with status code:", resp.status_code)

200
Request success with status code: 200


### Failed Case (not 2xx)

In [3]:
url = "https://jwlin.github.io/py-scraping-analysis-book/ch1/connect.html2"
resp = requests.get(url)
print(resp.status_code)

if resp.status_code == 200:
    print("Request success with status code:", resp.status_code)
else:
    print("Request failed with status code:", resp.status_code)

404
Request failed with status code: 404


## BeautifulSoup - 載入

### Print out the DOM tree

In [4]:
url = "https://jwlin.github.io/py-scraping-analysis-book/ch1/connect.html"  # 設定網頁網址，此為測試網頁
resp = requests.get(url)  # 模擬 get 請求
print(resp.status_code)

soup = BeautifulSoup(resp.text, "html.parser")  # 將網頁格式檔放入 bs4 樹
soup  # 印出 dom 文件樹

200


<!DOCTYPE html>

<html lang="en">
<head>
<meta charset="utf-8"/>
<meta content="IE=edge" http-equiv="X-UA-Compatible"/>
<meta content="width=device-width, initial-scale=1" name="viewport"/>
<!-- The above 3 meta tags *must* come first in the head; any other head content must come *after* these tags -->
<meta content="" name="description"/>
<meta content="" name="author"/>
<title>Pycone 松果城市</title>
<!-- Bootstrap core CSS -->
<link href="bootstrap.min.css" rel="stylesheet"/>
<!-- IE10 viewport hack for Surface/desktop Windows 8 bug -->
<link href="https://getbootstrap.com/assets/css/ie10-viewport-bug-workaround.css" rel="stylesheet"/>
<!-- Custom styles for this template -->
<link href="https://getbootstrap.com/examples/sticky-footer/sticky-footer.css" rel="stylesheet"/>
<!-- Just for debugging purposes. Don't actually copy these 2 lines! -->
<!-- HTML5 shim and Respond.js for IE8 support of HTML5 elements and media queries -->
<!--[if lt IE 9]>
      <script src="https://oss.maxcdn.co

### requests with header

In [5]:
url = "https://jwlin.github.io/py-scraping-analysis-book/ch1/connect.html"  # 設定網頁網址，此為測試網頁
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36"
}
resp = requests.get(url, headers)  # 模擬 get 請求
print(resp.status_code)
soup = BeautifulSoup(resp.text, "html.parser")  # 將網頁格式檔放入 bs4 樹
soup # 印出 dom 文件樹

200


<!DOCTYPE html>

<html lang="en">
<head>
<meta charset="utf-8"/>
<meta content="IE=edge" http-equiv="X-UA-Compatible"/>
<meta content="width=device-width, initial-scale=1" name="viewport"/>
<!-- The above 3 meta tags *must* come first in the head; any other head content must come *after* these tags -->
<meta content="" name="description"/>
<meta content="" name="author"/>
<title>Pycone 松果城市</title>
<!-- Bootstrap core CSS -->
<link href="bootstrap.min.css" rel="stylesheet"/>
<!-- IE10 viewport hack for Surface/desktop Windows 8 bug -->
<link href="https://getbootstrap.com/assets/css/ie10-viewport-bug-workaround.css" rel="stylesheet"/>
<!-- Custom styles for this template -->
<link href="https://getbootstrap.com/examples/sticky-footer/sticky-footer.css" rel="stylesheet"/>
<!-- Just for debugging purposes. Don't actually copy these 2 lines! -->
<!-- HTML5 shim and Respond.js for IE8 support of HTML5 elements and media queries -->
<!--[if lt IE 9]>
      <script src="https://oss.maxcdn.co

### Practice 1

用 requests 抓網頁 (ptt stock 版)，並印出 DOM 文件樹，不要有 header，印出 response code，並判斷是否連線成功。連線成功才印出 DOM 文件樹，否則則印出 "連線失敗"。

In [6]:
url = "https://www.ptt.cc/bbs/stock/index.html"

resp = requests.get(url)
print("Status code:", resp.status_code)

if resp.status_code == 200:
    print("Connection successful")
    soup = BeautifulSoup(resp.text, "html.parser")
    print(soup.prettify())
else:
    print("連線失敗")


Status code: 200
Connection successful
<!DOCTYPE html>
<html>
 <head>
  <meta charset="utf-8"/>
  <meta content="width=device-width, initial-scale=1" name="viewport"/>
  <title>
   看板 Stock 文章列表 - 批踢踢實業坊
  </title>
  <link href="//images.ptt.cc/bbs/v2.27/bbs-common.css" rel="stylesheet" type="text/css"/>
  <link href="//images.ptt.cc/bbs/v2.27/bbs-base.css" media="screen" rel="stylesheet" type="text/css"/>
  <link href="//images.ptt.cc/bbs/v2.27/bbs-custom.css" rel="stylesheet" type="text/css"/>
  <link href="//images.ptt.cc/bbs/v2.27/pushstream.css" media="screen" rel="stylesheet" type="text/css"/>
  <link href="//images.ptt.cc/bbs/v2.27/bbs-print.css" media="print" rel="stylesheet" type="text/css"/>
 </head>
 <body>
  <div id="topbar-container">
   <div class="bbs-content" id="topbar">
    <a href="/bbs/" id="logo">
     批踢踢實業坊
    </a>
    <span>
     ›
    </span>
    <a class="board" href="/bbs/Stock/index.html">
     <span class="board-label">
      看板
     </span>
     Stock
   

### Practice 2

問題：用 requests 抓網頁 (dcard 版) 並印出 DOM 文件樹，要 header: User-Agent，印出 response code，並判斷是否連線成功。連線成功才印出 DOM 文件樹，否則則印出 "連線失敗"。

In [7]:
url = "https://www.dcard.tw/f/relationship" # Dcard 感情版網址
ua = "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/134.0.0.0 Safari/537.36"

resp = requests.get(url, headers={
    "User-Agent": ua
})
print("Status code:", resp.status_code)

if resp.status_code == 200:
    print("Connection successful")
    soup = BeautifulSoup(resp.text, "html.parser")
    print(soup)
else:
    print("連線失敗")


Status code: 403
連線失敗


## BeautifulSoup - 使用

In [8]:
from bs4 import Tag

In [9]:
url = "http://jwlin.github.io/py-scraping-analysis-book/ch2/blog/blog.html"  # 設定網頁網址
resp = requests.get(url)  # 模擬get請求
soup = BeautifulSoup(resp.text, "html.parser")

### 取得第一篇 blog 主標題HTML結構 (h4)

In [10]:
soup.find('h4')

<h4 class="card-title">
<a href="http://www.pycone.com/blogs#pablo">Mac使用者</a>
</h4>

In [11]:
soup.h4

<h4 class="card-title">
<a href="http://www.pycone.com/blogs#pablo">Mac使用者</a>
</h4>

### 取得第一篇 blog 主標題

In [12]:
def get_first_blog_title(soup: BeautifulSoup) -> str:
    h4 = soup.find('h4')
    assert h4 is not None
    a = h4.find('a')
    assert isinstance(a, Tag)
    return a.text

get_first_blog_title(soup)

'Mac使用者'

In [13]:
def get_first_blog_title_method_2(soup: BeautifulSoup) -> str:
    h4 = soup.h4
    assert h4 is not None
    a = h4.a
    assert isinstance(a, Tag)
    return a.text

get_first_blog_title(soup)

'Mac使用者'

### 取得所有 blog 主標題, 使用 tag

In [14]:
def get_all_blog_titles(soup: BeautifulSoup) -> list[str]:
    titles = soup.find_all('h4')
    return [title.find('a').text for title in titles]

get_all_blog_titles(soup)

['Mac使用者',
 '給初學者的 Python 網頁爬蟲與資料分析',
 '給初學者的 Python 網頁爬蟲與資料分析',
 '給初學者的 Python 網頁爬蟲與資料分析',
 '給初學者的 Python 網頁爬蟲與資料分析',
 '給初學者的 Python 網頁爬蟲與資料分析']

In [15]:
def get_all_blog_titles_method_2(soup: BeautifulSoup) -> list[str]:
    titles = soup.find_all('h4')
    return [title.a.text for title in titles]

get_all_blog_titles(soup)

['Mac使用者',
 '給初學者的 Python 網頁爬蟲與資料分析',
 '給初學者的 Python 網頁爬蟲與資料分析',
 '給初學者的 Python 網頁爬蟲與資料分析',
 '給初學者的 Python 網頁爬蟲與資料分析',
 '給初學者的 Python 網頁爬蟲與資料分析']

### 取得各篇 blog 的所有文字

In [16]:
divs = soup.find_all("div", class_="content")
divs[0]

<div class="content">
<h6 class="category text-muted">開發環境設定</h6>
<h4 class="card-title">
<a href="http://www.pycone.com/blogs#pablo">Mac使用者</a>
</h4>
<p class="card-description" id="mac-p">
                                    在Mac環境下安裝Python與Sublime Text3<a data-foo="mac-foo" href="http://www.pycone.com/blogs/mac-python-environment"> <br/>Read More </a>
</p>
</div>

In [17]:
for div in divs:
    print(div.h6.text.strip(), div.h4.a.text.strip(), div.p.text.strip())

開發環境設定 Mac使用者 在Mac環境下安裝Python與Sublime Text3 Read More
資料科學 給初學者的 Python 網頁爬蟲與資料分析 (1) 前言 Read More
資料科學 給初學者的 Python 網頁爬蟲與資料分析 (2) 套件安裝與啟動網頁爬蟲 Read More
資料科學 給初學者的 Python 網頁爬蟲與資料分析 (3) 解構並擷取網頁資料 Read More
資料科學 給初學者的 Python 網頁爬蟲與資料分析 (4) 擷取資料及下載圖片 Read More
資料科學 給初學者的 Python 網頁爬蟲與資料分析 (5) 資料分析及展示 Read More


### 讀取以下網址，逐行輸出書名

In [18]:
resp = requests.get(
    "http://jwlin.github.io/py-scraping-analysis-book/ch2/table/table.html"
)
soup = BeautifulSoup(resp.text, "html.parser")

In [19]:
table_body = soup.tbody

table_body

<tbody>
<tr><td>初心者 - Python入門</td><td>初學者</td><td>1490</td><td><a href="http://www.pycone.com"><img alt="python™" class="python-logo" src="img/python-logo.png"/></a></td></tr>
<tr><td>Python 網頁爬蟲入門實戰</td><td>有程式基礎的初學者</td><td>1890</td><td><a href="http://www.pycone.com"><img alt="python™" class="python-logo" src="img/python-logo.png"/></a></td></tr>
<tr><td>Python 機器學習入門實戰 (預計)</td><td>有程式基礎的初學者</td><td>1890</td><td><a href="http://www.pycone.com"><img alt="python™" class="python-logo" src="img/python-logo.png"/></a></td></tr>
<tr><td>Python 資料科學入門實戰 (預計)</td><td>有程式基礎的初學者</td><td>1890</td><td><a href="http://www.pycone.com"><img alt="python™" class="python-logo" src="img/python-logo.png"/></a></td></tr>
<tr><td>Python 資料視覺化入門實戰 (預計)</td><td>有程式基礎的初學者</td><td>1890</td><td><a href="http://www.pycone.com"><img alt="python™" class="python-logo" src="img/python-logo.png"/></a></td></tr>
<tr><td>Python 網站架設入門實戰 (預計)</td><td>有程式基礎的初學者</td><td>1890</td><td><a><img alt="python™" class="python

In [20]:
assert table_body is not None

rows = table_body.find_all("tr")
rows[0:2]

[<tr><td>初心者 - Python入門</td><td>初學者</td><td>1490</td><td><a href="http://www.pycone.com"><img alt="python™" class="python-logo" src="img/python-logo.png"/></a></td></tr>,
 <tr><td>Python 網頁爬蟲入門實戰</td><td>有程式基礎的初學者</td><td>1890</td><td><a href="http://www.pycone.com"><img alt="python™" class="python-logo" src="img/python-logo.png"/></a></td></tr>]

In [21]:
# 第一種呈現書名的方法
for row in rows:
    td = row.find("td").text
    print(td)

初心者 - Python入門
Python 網頁爬蟲入門實戰
Python 機器學習入門實戰 (預計)
Python 資料科學入門實戰 (預計)
Python 資料視覺化入門實戰 (預計)
Python 網站架設入門實戰 (預計)


In [22]:
# 第二種呈現書名的方法
for row in rows:
    tds = row.find_all("td")[0].text
    print(tds)

初心者 - Python入門
Python 網頁爬蟲入門實戰
Python 機器學習入門實戰 (預計)
Python 資料科學入門實戰 (預計)
Python 資料視覺化入門實戰 (預計)
Python 網站架設入門實戰 (預計)


### Question: 讀取以下網址，逐行輸出書名、售價，以及最後一行印出平均價格

In [23]:
import pandas as pd

In [24]:
resp = requests.get('http://jwlin.github.io/py-scraping-analysis-book/ch2/table/table.html')
soup = BeautifulSoup(resp.text, 'html.parser')

In [25]:
# get table
table = soup.table
assert table is not None

# get table body
table_body = table.tbody
assert table_body is not None

result: dict[str, list[str]] = {
    "書名": [],
    "售價": [],
}

# get rows
rows = table_body.find_all('tr')
for row in rows:
    assert isinstance(row, Tag)

    tds = row.find_all('td')
    result["書名"].append(tds[0].text)
    result["售價"].append(tds[2].text)

result_df = pd.DataFrame(result)

for _, row in result_df.iterrows():
    print(f"書名: {row['書名']}, 售價: {row['售價']}")


書名: 初心者 - Python入門, 售價: 1490
書名: Python 網頁爬蟲入門實戰, 售價: 1890
書名: Python 機器學習入門實戰 (預計), 售價: 1890
書名: Python 資料科學入門實戰 (預計), 售價: 1890
書名: Python 資料視覺化入門實戰 (預計), 售價: 1890
書名: Python 網站架設入門實戰 (預計), 售價: 1890


In [26]:
result_df["售價"].astype(float).mean()

np.float64(1823.3333333333333)

## BeautifulSoup - PTT

### 抓取 PTT 以下網址的標題

In [27]:
url = "https://www.ptt.cc/bbs/stock/index.html"
response = requests.get(url)  # 模擬get請求
soup = BeautifulSoup(response.text, "html.parser")

# 取得文章標題
tags = soup.find_all("div", class_="title")  # 搜尋class屬性是title的所有標籤
tags

[<div class="title">
 <a href="/bbs/Stock/M.1742795217.A.7C6.html">[新聞] 今年通膨又要破二了？主計長：調漲電價 </a>
 </div>,
 <div class="title">
 <a href="/bbs/Stock/M.1742796008.A.EFB.html">[閒聊] 2025/03/24 盤後閒聊</a>
 </div>,
 <div class="title">
 <a href="/bbs/Stock/M.1742796633.A.6F1.html">[新聞] 個股：台積電(2330)嘉義CoWoS廠傳第三季</a>
 </div>,
 <div class="title">
 <a href="/bbs/Stock/M.1742797729.A.D48.html">Re: [新聞] 今年通膨又要破二了？主計長：調漲電價 </a>
 </div>,
 <div class="title">
 <a href="/bbs/Stock/M.1742798040.A.DB7.html">Re: [請益] 清流君不建議重壓00757</a>
 </div>,
 <div class="title">
 <a href="/bbs/Stock/M.1742799484.A.F03.html">[情報] 0324 上市投信買賣超排行</a>
 </div>,
 <div class="title">
 <a href="/bbs/Stock/M.1742799806.A.8F9.html">[情報] 1215 卜蜂 113年股利 4.5 除息日 5/28</a>
 </div>,
 <div class="title">
 <a href="/bbs/Stock/M.1742800414.A.293.html">[情報] 114年03月24日 三大法人買賣金額統計表</a>
 </div>,
 <div class="title">
 <a href="/bbs/Stock/M.1742800566.A.8E5.html">[新聞] 外資圈瘋傳台積電350億美元入股英特爾　</a>
 </div>,
 <div class="title">
 <a href="/bbs/Stock/M.1

In [28]:
for tag in tags:
    print(tag.text.strip())  # 取得標籤文字

[新聞] 今年通膨又要破二了？主計長：調漲電價
[閒聊] 2025/03/24 盤後閒聊
[新聞] 個股：台積電(2330)嘉義CoWoS廠傳第三季
Re: [新聞] 今年通膨又要破二了？主計長：調漲電價
Re: [請益] 清流君不建議重壓00757
[情報] 0324 上市投信買賣超排行
[情報] 1215 卜蜂 113年股利 4.5 除息日 5/28
[情報] 114年03月24日 三大法人買賣金額統計表
[新聞] 外資圈瘋傳台積電350億美元入股英特爾
[公告] 股票板板規 v4.7 (2024/10/06 修正)
Fw: [公告] 請留意新註冊帳號使用信件詐騙
[公告] 4-6-1的初犯罰則在三個月內將加重至30天
[閒聊] 2025/03/24 盤後閒聊


### 問題：續上題， 抓取上題"上一頁"標題

In [29]:
url = "https://www.ptt.cc/bbs/stock/index.html"
response = requests.get(url)
soup = BeautifulSoup(response.text, "html.parser")

# 抓取 innerText 是 '‹ 上頁' 的元素
prev_page_link = soup.find(lambda tag: tag.name == 'a' and tag.text == '‹ 上頁')
assert prev_page_link is not None

prev_page_path = prev_page_link.get('href')
assert prev_page_path is not None

prev_page_path

'/bbs/Stock/index8498.html'

In [30]:
assert isinstance(prev_page_path, str)

# 抓取上頁的標題
response = requests.get("https://www.ptt.cc" + prev_page_path)
soup = BeautifulSoup(response.text, "html.parser")

for tag in soup.find_all("div", class_="title"):
    print(tag.text.strip())

[情報] 華爾街大摩計畫裁員2000人以控制成本
Re: [新聞] 馬斯克:特斯拉人形機器人Optimus今年試
[新聞] 移民金卡計畫成功？ 美商務部長喜揭「買
[心得] PVC 相關指數反彈，全球塑膠上漲
Re: [標的] 長虹5534 屌打美債的物件 分享
[新聞] 漲電價 雲豹能源大受惠？  郭智輝：這應該是不具影響力
Re: [新聞] 移民金卡計畫成功？ 美商務部長喜揭
Re: [標的] 6757台灣虎航-多
Re: [標的] 長虹5534 二十一張更新未實現獲利
Re: [新聞] 移民金卡計畫成功？ 美商務部長喜揭「買
Re: [標的] 2610華航 空運很夯送錢多
Re: [新聞] 馬斯克:特斯拉人形機器人Optimus今年試
Re: [心得] 03月當沖心得-已畢業
Re: [新聞] 馬斯克:特斯拉人形機器人Optimus今年試
[情報] 1612 宏泰 113年股利2.1
Re: [新聞] 馬斯克:特斯拉人形機器人Optimus今年試
[新聞] 彭博：美對等關稅 目標明確
[請益] 清流君不建議重壓00757
[新聞] 台揚第6根跌停！天天「開盤即收盤」已狂4
Re: [標的] 6757.TW 台灣虎航  插翅虎多


## 抓自由時報"所有"新聞標題

In [31]:
url = "https://www.ltn.com.tw/"  # 設定網頁網址
resp = requests.get(url)  # 模擬get請求
soup = BeautifulSoup(resp.text, "html.parser")  # 將網頁格式檔放入bs4中

In [32]:
# 抓取所有新聞標題
tags = soup.find_all("h3")  # 找出所有 h3 標籤（一般新聞標題）
tags

[<h3>
                         解決水上運動與水上遊憩衝突 宜縣冬山河將劃設「慢車道」                                            </h3>,
 <h3>
                         Tesla 爆發拋售潮！不認同馬斯克行為更擔心愛車遭攻擊                                            </h3>,
 <h3>
                         嘉義縣國本學堂赴日交流 創新農業發展                                            </h3>,
 <h3>
                         蔡學良母陳情 總統府：資料交國防部積極處理                                            </h3>,
 <h3>
                         買塔位也能多元支付 苗縣苑裡鎮公所便民服務再升級                                            </h3>,
 <h3>
                         挺台灣遭封殺一年無戲可拍 台派演員陳慕義挺台立場不變                                            </h3>,
 <h3>
                         健康網》小小一粒卻超高纖！ 醫列1食物順「便」好護腸                                            </h3>,
 <h3>
                         5月COMPUTEX登場 輝達黃仁勳、高通艾蒙擔任Keynote講者                                            </h3>,
 <h3>
                         東京櫻花開了！ 氣象廳正式宣布開花 比去年早5天                                            </h3>,
 <h3>
                         自由開

In [33]:
# 顯示標題
for tag in tags:
    print(tag.get_text(strip=True))

解決水上運動與水上遊憩衝突 宜縣冬山河將劃設「慢車道」
Tesla 爆發拋售潮！不認同馬斯克行為更擔心愛車遭攻擊
嘉義縣國本學堂赴日交流 創新農業發展
蔡學良母陳情 總統府：資料交國防部積極處理
買塔位也能多元支付 苗縣苑裡鎮公所便民服務再升級
挺台灣遭封殺一年無戲可拍 台派演員陳慕義挺台立場不變
健康網》小小一粒卻超高纖！ 醫列1食物順「便」好護腸
5月COMPUTEX登場 輝達黃仁勳、高通艾蒙擔任Keynote講者
東京櫻花開了！ 氣象廳正式宣布開花 比去年早5天
自由開講》武統台灣說 「公政公約」言論自由的例外
核三廠3/6火警調查說明會 台電承諾改善恆春在地通報
林口社團貼罷免洪孟楷資訊竟見牛煦庭按讚 洪：要不要去問他？
癌症治療現曙光！科學家找到癌細胞「自毀」密碼
泰國限量版潮牌包太夯「民眾上演大亂鬥 」 品牌方宣布無限期停賣
注意！北市清查房屋稅及地價稅籍 變更土地務必申報
中國民眾求救！戒網癮學校侵害人權卻逍遙法外 影片震撼數百萬人
高雄市國賓飯店危老重建開發案 今通過環評大會審查
MLB》「我的要求比外界期望還要高」 史基斯今年挑戰史上第2人壯舉
軍武新知》「獅鷲」戰機加上AI系統輔助 視距外接戰效率再進化
花蓮罷團高壓水槍洗出「裁傅自由」疑遭刁難 警局長還原現場「依法行政」
再等等！ 能高越嶺步道西段預計10月底全線搶通
美股4月明牌搶先看！投行奧本海默欽點好市多 AI只看好這檔
台中雙桶屍命案主謀徐德益死刑撤銷 發回更審
財富自由》投資大師選股-高科技股策略專家
嘉義縣國本學堂赴日交流 創新農業發展
LTN投票箱》若寵物惡犬攻擊傷人 贊不贊成將牠安樂死？
11-12月統一發票  千萬大獎1張未領、200萬特獎4張未領
挺台灣遭封殺一年無戲可拍 台派演員陳慕義挺台立場不變
日本研擬不依靠美軍 自主發射長程飛彈
尹錫悅命運風向球 代總統韓悳洙彈劾案被駁回
以色列空襲加薩醫院釀5死 包含哈瑪斯政治局委員
日本頻傳諾羅感染！千葉旅館集體上吐下瀉 疑鮑魚釀禍
自由說新聞》賴抗中「藍狂扯戒嚴」挨轟！明居正靈魂拷問打臉：荒唐！
屏東竹田24日清晨大火！鐵皮屋燒融變形 4人送醫（屏東小鎮資訊粉絲／屏東縣消防局提供）
藍委提「還錢於民」常態化 柯建銘轟：違憲、買票若通過將提釋憲
揭國民黨死亡連署高達1748人 民進黨：唯一可能就是抄名冊！
卓榮泰23日台南宣講 對

### 問題：抓自由時報"即時"新聞標題

In [34]:
url = "https://www.ltn.com.tw/"  # 設定網頁網址
resp = requests.get(url)  # 模擬get請求
soup = BeautifulSoup(resp.text, "html.parser")  # 將網頁格式檔放入bs4

In [35]:
# 取得「即時清單」
breaking_news = soup.find("div", attrs={"data-desc": "即時清單"})
assert breaking_news is not None

# 取得「即時清單」中的所有標題
titles = breaking_news.find_all("h3")

for title in titles:
    print(title.get_text(strip=True))


解決水上運動與水上遊憩衝突 宜縣冬山河將劃設「慢車道」
Tesla 爆發拋售潮！不認同馬斯克行為更擔心愛車遭攻擊
嘉義縣國本學堂赴日交流 創新農業發展
蔡學良母陳情 總統府：資料交國防部積極處理
買塔位也能多元支付 苗縣苑裡鎮公所便民服務再升級
挺台灣遭封殺一年無戲可拍 台派演員陳慕義挺台立場不變
健康網》小小一粒卻超高纖！ 醫列1食物順「便」好護腸
5月COMPUTEX登場 輝達黃仁勳、高通艾蒙擔任Keynote講者
東京櫻花開了！ 氣象廳正式宣布開花 比去年早5天
自由開講》武統台灣說 「公政公約」言論自由的例外
核三廠3/6火警調查說明會 台電承諾改善恆春在地通報
林口社團貼罷免洪孟楷資訊竟見牛煦庭按讚 洪：要不要去問他？
癌症治療現曙光！科學家找到癌細胞「自毀」密碼
泰國限量版潮牌包太夯「民眾上演大亂鬥 」 品牌方宣布無限期停賣
注意！北市清查房屋稅及地價稅籍 變更土地務必申報
中國民眾求救！戒網癮學校侵害人權卻逍遙法外 影片震撼數百萬人
高雄市國賓飯店危老重建開發案 今通過環評大會審查
MLB》「我的要求比外界期望還要高」 史基斯今年挑戰史上第2人壯舉
軍武新知》「獅鷲」戰機加上AI系統輔助 視距外接戰效率再進化
花蓮罷團高壓水槍洗出「裁傅自由」疑遭刁難 警局長還原現場「依法行政」
再等等！ 能高越嶺步道西段預計10月底全線搶通
美股4月明牌搶先看！投行奧本海默欽點好市多 AI只看好這檔
