In [25]:
import requests
from bs4 import BeautifulSoup
from tqdm import tqdm

def fetch_faq_and_categories():
    url = 'https://www.cathaybk.com.tw/cathaybk/personal/contact/help/faq/'
    response = requests.get(url)
    response.raise_for_status()  # 檢查請求是否成功

    soup = BeautifulSoup(response.text, 'html.parser')

    # 先提取所有類別的 id 和內容
    categories = {}
    for checkbox in soup.find_all(class_='cubre-a-checkbox__input'):
        category_id = checkbox['id']
        label = soup.find('label', {'for': category_id})
        if label:
            categories[category_id] = label.text.strip()
    
    # 爬取每個 class="cubre-m-collapse__item" 的元素
    for item in tqdm(soup.find_all(class_='cubre-m-collapse__item')):
        data_item_filter = item['data-item-filter'].split(', ')
        
        for categories_name in data_item_filter:
            category_names = [categories.get(category_id, 'Unknown Category')  for category_id in categories_name.split(',')]
            # remove'不限' or ' 不限' or '不限 '
            category_names = [category_name for category_name in category_names if category_name != '不限' and category_name != ' 不限' and category_name != '不限 ']
            # remove the duplicate category name
            categories_name = list(set(category_names))
       
        title = item.find(class_='cubre-m-collapse__title').text.strip()
        text_content = item.find(class_='cubre-o-textContent').text.strip()
        text_content = '\n'.join([line for line in text_content.split('\n') if line.strip()])


        # 匹配輸出每個元素的類別、標題和文本內容
        print(f'Categories: {", ".join(category_names)}')
        print(f'Title: {title}')
        print(f'Text Content: {text_content}')
        print('-' * 50)  # 輸出一個分隔線以區分不同的元素
        
        # save to .csv
        with open('cathaybk_faq.csv', 'a', encoding='utf-8') as f:
            f.write(f'Categories: {", ".join(category_names)}\n')
            f.write(f'Title: {title}\n')
            f.write(f'Text Content: {text_content}\n')
            f.write('-' * 50 + '\n')
if __name__ == "__main__":
    fetch_faq_and_categories()


100%|██████████| 634/634 [00:00<00:00, 27482.88it/s]

Categories: 子帳戶
Title: 子帳戶的申請資格是什麼？
Text Content: 加開子帳戶方式如下：
具備臺幣活期儲蓄存款、綜合活期儲蓄存款、國泰世華數位存款帳戶(3-1類、2類、1-1類)，或KOKO數位存款帳戶(3-1類、2類、1-2類及1-1類)能開啟子帳戶，開啟方式說明：
登入個人網銀App，點選【臺幣總額】 > 選擇母帳戶右方更多功能 >【 新增子帳戶】，每一母帳戶下共可加開５組子帳戶。
--------------------------------------------------
Categories: 子帳戶
Title: 子帳戶可透過什麼管道申請？
Text Content: 開立子帳戶方式如下：
登入網路銀行App，點選【臺幣總額】> 選擇母帳戶右方更多功能 >【新增子帳戶】> 即可依畫面步驟進行操作。
※提醒你，開立通路僅限網路銀行App。
--------------------------------------------------
Categories: 手機/Email共用, 手機/Email共用
Title: 為何我無法與他人共用手機門號/電子郵件？
Text Content: 本行會透過您留存於本行的手機門號/Email，通知您與本行往來之所有個人帳務資訊與個人權益。請勿與其他用戶使用相同的手機門號/Email，以避免您的個人帳務隱私外洩並保障您的帳戶安全。
若您有家戶共用手機門號/電子郵件需求，請備妥您與手機門號/電子郵件共用者的關係證明文件正本(身分證、居留證、戶口名簿/戶籍謄本、法律判決書)，至CUBE網銀或分行臨櫃辦理手機/Email共用註記。目前僅開放申請特定關係對象共用手機門號/電子郵件，包含血親三等親內、姻親二等親內、法定代理人、或監護人之關係。一般客戶共用申請成功後，共用效期為期三年、未成年則至成年。
*CUBE網銀申請路徑：[申請設定]→[資料異動]→[修改個人資料]→共用註記申請/進度查詢
*血親三等親內、姻親二等親內關係說明如下:
--------------------------------------------------
Categories: 臺外幣帳務與轉帳
Title: 我已申請非約定轉帳服務，為何還是無法於CUBE App轉帳？
Text Content: CUBE


