In [23]:

# ===== セル1: セットアップ =====

import sys
import os
import time
from datetime import datetime
import json

# パス設定
current_dir = os.getcwd()  # notebooks/
project_root = os.path.dirname(current_dir)  # ml-analysis/
scraping_path = os.path.join(project_root, 'src', 'scraping')

# パス確認
print(f"📁 現在地: {current_dir}")
print(f"📁 プロジェクトルート: {project_root}")
print(f"📁 スクレイピングパス: {scraping_path}")
print(f"✅ パス存在確認: {os.path.exists(scraping_path)}")

if scraping_path not in sys.path:
    sys.path.append(scraping_path)

# モジュールインポート
from simple_offset_scraper import (
    SimpleOffsetHorseListScraper, 
    CompleteBatchProcessor,
    get_next_100_horses,
    run_complete_100_horses_batch,
    test_offset_scraper
)

print("🚀 モジュール読み込み完了")
print("-" * 50)


📁 現在地: /Users/skdata_mng/Documents/PROJECTS/STALLION/stallion-analytics/packages/ml-analysis/notebooks
📁 プロジェクトルート: /Users/skdata_mng/Documents/PROJECTS/STALLION/stallion-analytics/packages/ml-analysis
📁 スクレイピングパス: /Users/skdata_mng/Documents/PROJECTS/STALLION/stallion-analytics/packages/ml-analysis/src/scraping
✅ パス存在確認: True
🚀 モジュール読み込み完了
--------------------------------------------------


In [32]:
print("🔍 詳細データ処理開始")

# CompleteBatchProcessorを使用
processor = CompleteBatchProcessor()

# 100頭で詳細処理をテスト
batch_results = processor.collect_and_process_horses(
    total_target=200,
    batch_size=25,
    start_offset=500,
    min_birth_year=1800,
    process_details=True,  # 詳細処理有効
    delay_between_horses=2  # n秒間隔
)

print("\n📊 バッチ処理結果:")
print(f"  リスト取得: {batch_results.get('list_count', 0)}頭")
print(f"  詳細成功: {len(batch_results.get('success', []))}頭")
print(f"  詳細失敗: {len(batch_results.get('failed', []))}頭")



🔍 詳細データ処理開始
🏇 完全バッチ処理開始
🎯 目標: 200頭
📦 バッチサイズ: 25頭
📍 開始オフセット: 500
📅 最小生年: 1800年
🔧 詳細処理: 有効

🔍 Step 1: 馬リスト取得
📦 リストバッチ: オフセット500, 25頭取得
🎯 G1馬取得開始:
   オフセット: 500
   最大取得数: 25頭
   最小生年: 1800年
--------------------------------------------------
📄 開始ページ: 6, ページ内位置: 0

📄 ページ6を処理中...
  ✓ [  1] ユウフヨウホウ (1997年)
  ✓ [  2] タップダンスシチー (1997年)
  ✓ [  3] マイネルコンバット (1997年)
  ✓ [  4] ティコティコタック (1997年)
  ✓ [  5] アグネスフライト (1997年)
  ✓ [  6] エアシャカール (1997年)
  ✓ [  7] イーグルカフェ (1997年)
  ✓ [  8] トウカイポイント (1996年)
  ✓ [  9] スティンガー (1996年)
  ✓ [ 10] トーホウエンペラー (1996年)
  ✓ [ 11] トロットスター (1996年)
  ✓ [ 12] ウメノファイバー (1996年)
  ✓ [ 13] リージェントブラフ (1996年)
  ✓ [ 14] タイキヘラクレス (1996年)
  ✓ [ 15] ゴールドティアラ (1996年)
  ✓ [ 16] ブゼンキャンドル (1996年)
  ✓ [ 17] サウスヴィグラス (1996年)
  ✓ [ 18] オリオンザサンクス (1996年)
  ✓ [ 19] アドマイヤコジーン (1996年)
  ✓ [ 20] プリモディーネ (1996年)
  ✓ [ 21] ナリタトップロード (1996年)
  ✓ [ 22] ノボトゥルー (1996年)
  ✓ [ 23] メイショウドトウ (1996年)
  ✓ [ 24] テイエムオペラオー (1996年)
  ✓ [ 25] アドマイヤベガ (1996年)

✅ 合計25頭を取得しました
✅ リストバッチ完了: 25頭追加, 累計25頭
📦 リストバッチ: 