In [7]:
import yfinance as yf
from datetime import datetime
import pandas as pd
from google.colab import drive
import time
import os

# ----------------------
# 1. 挂载谷歌云端硬盘
# ----------------------
def mount_google_drive():
    try:
        drive.mount('/content/drive')
        # 创建保存数据的文件夹（若不存在）
        save_root = "/content/drive/MyDrive/portfolio_sample_data"
        os.makedirs(save_root, exist_ok=True)
        print(f"云端硬盘挂载成功，数据将保存至：{save_root}")
        return save_root
    except Exception as e:
        print(f"云端硬盘挂载失败：{str(e)}")
        return None

# ----------------------
# 2. 定义所有需要抓取的标的（代码+名称）
# ----------------------
ALL_TICKERS = [
    # 公司股票
    {"ticker": "AAPL", "name": "apple"},
    {"ticker": "AMZN", "name": "amazon"},
    {"ticker": "GOOGL", "name": "google"},
    {"ticker": "MSFT", "name": "microsoft"},
    {"ticker": "META", "name": "facebook"},
    {"ticker": "NVDA", "name": "nvidia"},
    {"ticker": "TSLA", "name": "tesla"},
    {"ticker": "BIDU", "name": "baidu"},
    {"ticker": "BABA", "name": "alibaba"},
    {"ticker": "TCEHY", "name": "tencent"},
    {"ticker": "TSM", "name": "tsmc"},
    {"ticker": "SSNLF", "name": "samsung"},
    # 大盘指数
    {"ticker": "^GSPC", "name": "sp500"},
    {"ticker": "^IXIC", "name": "nasdaq"},
    {"ticker": "^DJI", "name": "dowjones"},
    {"ticker": "^RUT", "name": "russell2000"},
    {"ticker": "^HSI", "name": "hangseng"},
    {"ticker": "000300.SS", "name": "csi300"}
]

# ----------------------
# 3. 批量拉取并保存数据
# ----------------------
def fetch_and_save_all(save_root, start_date, end_date):
    # 遍历所有标的
    for item in ALL_TICKERS:
        ticker = item["ticker"]
        name = item["name"]
        print(f"\n===== 开始处理：{name}（{ticker}） =====")

        try:
            # 拉取数据（添加延迟避免触发速率限制）
            time.sleep(3)  # 每次请求间隔3秒
            stock = yf.Ticker(ticker)
            df = stock.history(start=start_date, end=end_date, interval="1d")

            if df.empty:
                print(f"警告：{name} 无数据返回，跳过保存")
                continue

            # 定义保存路径
            file_name = f"{name}_data.csv"
            save_path = os.path.join(save_root, file_name)

            # 保存为CSV
            df.to_csv(save_path)
            print(f"成功保存：{save_path}（{len(df)} 条记录）")

        except Exception as e:
            print(f"处理 {name} 失败：{str(e)}，将重试一次")
            # 失败后重试一次（增加延迟）
            time.sleep(5)
            try:
                stock = yf.Ticker(ticker)
                df = stock.history(start=start_date, end=end_date, interval="1d")
                if not df.empty:
                    df.to_csv(save_path)
                    print(f"重试成功：{save_path}")
                else:
                    print(f"重试后仍无数据：{name}")
            except Exception as e2:
                print(f"重试失败：{str(e2)}")

# ----------------------
# 4. 主函数
# ----------------------
if __name__ == "__main__":
    # 配置时间范围（可根据需要调整）
    start_date = datetime(2020, 1, 1)  # 起始日期：2020年1月1日
    end_date = datetime(2025, 7, 28)   # 结束日期：当前日期

    # 挂载云端硬盘
    save_root = mount_google_drive()
    if not save_root:
        print("程序终止：无法挂载云端硬盘")
    else:
        # 开始批量处理
        fetch_and_save_all(save_root, start_date, end_date)
        print("\n===== 所有标的处理完成 =====")

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).
云端硬盘挂载成功，数据将保存至：/content/drive/MyDrive/portfolio_sample_data

===== 开始处理：apple（AAPL） =====
成功保存：/content/drive/MyDrive/portfolio_sample_data/apple_data.csv（1398 条记录）

===== 开始处理：amazon（AMZN） =====
成功保存：/content/drive/MyDrive/portfolio_sample_data/amazon_data.csv（1398 条记录）

===== 开始处理：google（GOOGL） =====
成功保存：/content/drive/MyDrive/portfolio_sample_data/google_data.csv（1398 条记录）

===== 开始处理：microsoft（MSFT） =====
成功保存：/content/drive/MyDrive/portfolio_sample_data/microsoft_data.csv（1398 条记录）

===== 开始处理：facebook（META） =====
成功保存：/content/drive/MyDrive/portfolio_sample_data/facebook_data.csv（1398 条记录）

===== 开始处理：nvidia（NVDA） =====
成功保存：/content/drive/MyDrive/portfolio_sample_data/nvidia_data.csv（1398 条记录）

===== 开始处理：tesla（TSLA） =====
成功保存：/content/drive/MyDrive/portfolio_sample_data/tesla_data.csv（1398 条记录）

===== 开始处理：baidu（BIDU） =====
成功保存：/content/drive/MyDr