In [3]:
from selenium import webdriver
from bs4 import BeautifulSoup
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.options import Options
from openpyxl import load_workbook
import time

# サイトからデータを抽出。
def fetch_data_from_site(url):
    # ヘッドレスモードで起動するためのオプションを設定。
    chrome_options = webdriver.ChromeOptions()
    chrome_options.add_argument('--headless')
    chrome_options.add_argument('--no-sandbox')
    chrome_options.add_argument('--disable-dev-shm-usage')

    # Chromeを立ち上げる。
    chrome_driver = webdriver.Chrome(options=chrome_options)

    print('ブラウザを起動します。')

    # 読み込みたいページにアクセス。
    chrome_driver.get(url)
    print('指定のページを開きます。')

    # ページのHTMLをBeautifulSoupで解析。
    soup = BeautifulSoup(chrome_driver.page_source, 'html.parser')

    # ページが完全に読み込まれるまで待機。
    time.sleep(5)
    print('待機中です。')
    
    # 空のリストを作成。
    data = []
    items = []

    data.clear()
    items.clear()
    
    try:
        # データ抽出のための適切なセレクタを指定。
        elements = soup.select('h3.fr-ec-title.fr-ec-title--color-primary-dark.fr-ec-title--product-tile-horizontal.fr-ec-text-align-left.fr-ec-text-transform-normal.fr-ec-product-tile__end-product-name')
        items = elements[:8]
        print(items[0])

        for i in range(0, len(items)):
            item = items[i].text
            data.append(item)

            print(data)
            print(len(data))

    finally:
        chrome_driver.quit()
        print('ブラウザを終了します。')

    return data

# Excelファイルにデータを書き込む
def write_to_excel(file_path, sheet_name, start_row, data):
    # Excelファイルを読み込む
    workbook = load_workbook(file_path)
    
    # 指定したシートを選択
    if sheet_name not in workbook.sheetnames:
        raise ValueError(f"Sheet '{sheet_name}' does not exist in the workbook.")
    sheet = workbook[sheet_name]
    
    # データを書き込む
    for i, value in enumerate(data):
        # データを1列目に書き込む
        sheet.cell(row=start_row + i, column=1, value=value)
    
    # ファイルを保存
    workbook.save(file_path)

# 今回開くページのurl。
url = 'https://www.uniqlo.com/jp/ja/men/shirts-and-polo-shirts'
# 既存のExcelファイルパス
file_path = 'Uniqlo.xlsx'
# 書き込み先のシート名
sheet_name = 'Sheet1'
# 書き込み開始行（例: 2行目から）
start_row = 2

data = fetch_data_from_site(url)
write_to_excel(file_path, sheet_name, start_row, data)

print("データの書き込みが完了しました。")


ブラウザを起動します。
指定のページを開きます。
待機中です。
<h3 class="fr-ec-title fr-ec-title--color-primary-dark fr-ec-title--product-tile-horizontal fr-ec-text-align-left fr-ec-text-transform-normal fr-ec-product-tile__end-product-name" data-testid="CoreTitle">ドライカノコボーダーポロシャツ</h3>
['ドライカノコボーダーポロシャツ']
1
['ドライカノコボーダーポロシャツ', 'ドライカノコボーダーポロシャツ']
2
['ドライカノコボーダーポロシャツ', 'ドライカノコボーダーポロシャツ', 'ドライカノコボーダーポロシャツ']
3
['ドライカノコボーダーポロシャツ', 'ドライカノコボーダーポロシャツ', 'ドライカノコボーダーポロシャツ', 'ドライカノコボーダーポロシャツ']
4
['ドライカノコボーダーポロシャツ', 'ドライカノコボーダーポロシャツ', 'ドライカノコボーダーポロシャツ', 'ドライカノコボーダーポロシャツ', 'ドライカノコポロシャツ']
5
['ドライカノコボーダーポロシャツ', 'ドライカノコボーダーポロシャツ', 'ドライカノコボーダーポロシャツ', 'ドライカノコボーダーポロシャツ', 'ドライカノコポロシャツ', 'ドライカノコポロシャツ']
6
['ドライカノコボーダーポロシャツ', 'ドライカノコボーダーポロシャツ', 'ドライカノコボーダーポロシャツ', 'ドライカノコボーダーポロシャツ', 'ドライカノコポロシャツ', 'ドライカノコポロシャツ', 'エアリズムコットンフルオープンポロシャツ']
7
['ドライカノコボーダーポロシャツ', 'ドライカノコボーダーポロシャツ', 'ドライカノコボーダーポロシャツ', 'ドライカノコボーダーポロシャツ', 'ドライカノコポロシャツ', 'ドライカノコポロシャツ', 'エアリズムコットンフルオープンポロシャツ', 'エアリズムコットンオープンカラーポロシャツ']
8
ブラウザを終了します。
データの書き込みが完了しました。
ブラウザを起動します。
指定のページ

['ドライカノコボーダーポロシャツ',
 'ドライカノコボーダーポロシャツ',
 'ドライカノコボーダーポロシャツ',
 'ドライカノコボーダーポロシャツ',
 'ドライカノコポロシャツ',
 'ドライカノコポロシャツ',
 'エアリズムコットンフルオープンポロシャツ',
 'エアリズムコットンオープンカラーポロシャツ']