# Cosmeet 商品情報スクレイピング

このノートブックは [cosmeet.cosme.net](https://cosmeet.cosme.net) から商品情報を取得します。

- 使用技術：Scrapy + Selenium
- 対象：動的ページに対応（JS描画あり）
- 出力：output.csv
- ページ数：10ページ分のデータ取得

In [21]:
!pip install scrapy selenium webdriver-manager pandas



In [22]:
import time
import csv
import pandas as pd
from scrapy.http import HtmlResponse
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from webdriver_manager.chrome import ChromeDriverManager

In [25]:
def scrape_cosmeet(pages=1):
    # Chromeオプション設定（Mac対応）
    chrome_options = Options()
    chrome_options.add_argument("--no-sandbox")
    chrome_options.add_argument("--disable-dev-shm-usage")
    
    # Apple Silicon の場合、headless=new を使用
    if platform.system() == "Darwin":
        chrome_options.add_argument("--headless=new")
    else:
        chrome_options.add_argument("--headless")

    # バージョンを明示（自分のChromeバージョンに合わせて変更してOK）
    CHROME_VERSION = "114.0.5735.90"

    # ドライバ起動
    driver = webdriver.Chrome(
        service=Service(ChromeDriverManager(version=CHROME_VERSION).install()),
        options=chrome_options
    )

    base_url = "https://cosmeet.cosme.net/product/search?page={}"
    results = []

    for page in range(pages):
        url = base_url.format(page)
        print(f"🔗 アクセス: {url}")
        driver.get(url)
        WebDriverWait(driver, 5).until(EC.presence_of_all_elements_located(
            (By.CSS_SELECTOR, "div.mdl-pdt-idv.clearfix"))
        )

        response = HtmlResponse(url=driver.current_url, body=driver.page_source.encode("utf-8"), encoding="utf-8")
        products = response.css("div.mdl-pdt-idv.clearfix")
        print(f"🟢 商品数: {len(products)}")

        for p in products:
            item = {
                "product_url": response.urljoin(p.css("a::attr(href)").get()),
                "name": p.css("img::attr(alt)").get(default="").strip(),
                "brand": "", "rating": "", "category": "", "description": "",
                "size_price": "", "release_date": "", "product_id": "",
                "maker": "", "features": "", "want_count": "", "have_count": ""
            }

            # 詳細ページへ遷移
            driver.get(item["product_url"])
            WebDriverWait(driver, 5).until(EC.presence_of_all_elements_located((By.CSS_SELECTOR, "body")))
            detail = HtmlResponse(url=driver.current_url, body=driver.page_source.encode("utf-8"), encoding="utf-8")

            # 各種情報の抽出
            item["product_id"] = item["product_url"].split("/")[-2]
            item["brand"] = detail.css("span.brd-name a::text").get(default="").strip()
            item["rating"] = detail.css("p.average::text").get(default="").strip()
            item["category"] = " ".join([c.strip() for c in detail.css("dl.item-category a::text").getall()])
            item["description"] = detail.css("dl.item-description.clearfix dd::text").get(default="").strip()
            item["size_price"] = detail.css("p.info-desc::text").get(default="").strip()
            release = detail.xpath('//p[contains(text(), "発売日")]/following-sibling::p[@class="info-desc"]/text()').get()
            item["release_date"] = release.strip() if release else ""
            item["maker"] = detail.css("dl.maker.clearfix a::text").get(default="").strip()
            item["features"] = " ".join([f.strip() for f in detail.css("dl.ingredient a::text").getall()])
            item["want_count"] = detail.xpath('//div[@class="act-counter" and contains(@data-object.class, "product_like")]/text()').get(default="").strip()
            item["have_count"] = detail.xpath('//div[@class="act-counter" and contains(@data-object.class, "product_have")]/text()').get(default="").strip()

            results.append(item)
            #time.sleep(1) #サーバの負荷を避けるための遅延

    driver.quit()
    return results

In [27]:
results = scrape_cosmeet(pages=1)
print(f"✅ 取得件数: {len(results)}")

WebDriverException: Message: Service /Users/yasuimasahiro/.wdm/drivers/chromedriver/mac64/136.0.7103.113/chromedriver-mac-arm64/chromedriver unexpectedly exited. Status code was: -9


In [9]:
df = pd.DataFrame(results)
df.to_csv("output.csv", index=False, encoding="utf-8-sig")
print("✅ CSV出力完了: output.csv")

✅ CSV出力完了: output.csv


In [11]:
df.head(20)

Unnamed: 0,product_url,name,brand,rating,category,description,size_price,release_date,product_id,maker,features,want_count,have_count
0,https://www.cosme.net/products/10271786/,コスメデコルテ ＡＱ 毛穴美容液オイル/コスメデコルテ,コスメデコルテ,5.3,スキンケア・基礎化粧品 クレンジング オイルクレンジング スキンケア・基礎化粧品 洗顔料 そ...,角栓を溶かし崩し、輝きあふれる,"40mL・11,000円",2025/5/16,10271786,コスメデコルテ,? 無鉱物油 アルコールフリー パラベンフリー アレルギーテスト済,8541,3358
1,https://www.cosme.net/products/10263025/,スーパーラメラシャンプー&amp;EXモイストトリートメント ＦＯＲ ＤＡＩＬＹ ＤＡＭＡＧ...,THE ANSWER,5.1,ヘアケア・スタイリング シャンプー・コンディショナー シャンプー・コンディショナー,■一部バラエティストア、,8g / 12ml / 220g / 320ml / 400ml (オープン価格),2024/11/2,10263025,花王,? コラーゲン ヒアルロン酸 AHA(フルーツ酸),13157,17253
2,https://www.cosme.net/products/10234175/,サンシェルター マルチ プロテクション トーンアップCC/コスメデコルテ,コスメデコルテ,5.3,ベースメイク 化粧下地・コンシーラー 化粧下地 日焼け対策・UVケア 日焼け止め・UVケア(顔用),SPF50+・PA++++,"35g・3,300円",2023/2/16,10234175,コスメデコルテ,,79940,123270
3,https://www.cosme.net/products/10268634/,リポピールセラム/リポピール（LIPOPEEL）,リポピール（LIPOPEEL）,5.4,スキンケア・基礎化粧品 化粧水 ブースター・導入液,AHA（古い角質除去・ざらつきを抑える）・BHA（皮脂による,"30ml・2,480円",2025/2/14,10268634,ジーン,? コラーゲン ビタミンC AHA(フルーツ酸) 無着色 無香料,1962,566
4,https://www.cosme.net/products/10267502/,エッセンスリキッド　ＥＸ/マキアージュ,マキアージュ,5.1,ベースメイク ファンデーション リキッドファンデーション,SPF50+・PA++++,"24mL(レフィル)・3,520円 / 24mL・3,740円 (編集部調べ)",2025/2/21,10267502,資生堂,,5500,7601
5,https://www.cosme.net/products/10266281/,ライトリフレクティング　セラムクッションファンデーション/NARS,NARS,5.6,ベースメイク ファンデーション リキッドファンデーション ベースメイク ファンデーション そ...,SPF42 ／PA++,"1個(ケース)・2,640円 / 11g・5,940円",2025/2/14,10266281,ナーズ ジャパン,,12353,4853
6,https://www.cosme.net/products/10170638/,スージング クレンジング オイル(旧)/ボビイ ブラウン,ボビイ ブラウン,5.1,スキンケア・基礎化粧品 クレンジング オイルクレンジング,リニューアル発売,"100ml・3,850円 / 200ml・5,720円",2019/7/5 (2022/5/13追加発売),10170638,ボビイ ブラウン,,2648,1165
7,https://www.cosme.net/products/10188648/,ヴォワールコレクチュールｎ/クレ・ド・ポー ボーテ,クレ・ド・ポー ボーテ,5.7,ベースメイク 化粧下地・コンシーラー 化粧下地,SPF25・PA++,"40g・8,250円",2020/3/21 (2024/8/21追加発売),10188648,資生堂インターナショナル,,123182,170537
8,https://www.cosme.net/products/10206485/,リップモンスター/ケイト,ケイト,5.4,メイクアップ 口紅・グロス・リップライナー 口紅,つけたての色がそのまま持続。保湿・色持ちを兼ね備えた高発色リップです。唇から蒸発する水分を活...,"1,540円 (編集部調べ)",2021/5/1 (2025/5/24追加発売),10206485,カネボウ化粧品,,129189,232254
9,https://www.cosme.net/products/10240900/,エッセンス スキングロウ ファンデーション/SHISEIDO,SHISEIDO,5.4,ベースメイク ファンデーション リキッドファンデーション,SPF30・PA+++,"30ml(レフィル)・7,040円 / 30ml・7,590円",2023/9/1,10240900,資生堂インターナショナル,,57339,52259
