# 练习使用KaggleAPI下载数据集

数据集：https://www.kaggle.com/datasets/ardamavi/sign-language-digits-dataset/data

1. 第一步通过安装Kaggle
%pip install kaggle

2. 第二步：在平台个人Profile设置client Token

3. 使用下面的代码加载Kaggle数据集

可以手动下载数据集：（在Python环境下执行）

#!/bin/bash
kaggle datasets download ardamavi/sign-language-digits-dataset

In [2]:
import os
import zipfile
import pandas as pd
from kaggle.api.kaggle_api_extended import KaggleApi

def download_kaggle_dataset(dataset_name, download_path="./data"):
    """
    使用Kaggle API下载数据集
    
    Args:
        dataset_name (str): 数据集名称，格式为"用户名/数据集名"
        download_path (str): 下载路径
    """
    # 初始化Kaggle API
    api = KaggleApi()
    api.authenticate()
    
    # 创建下载目录
    os.makedirs(download_path, exist_ok=True)
    
    # 下载数据集
    print(f"正在下载数据集: {dataset_name}")
    api.dataset_download_files(dataset_name, path=download_path, unzip=True)
    
    print("下载完成！")

# 使用示例
dataset = "uciml/iris"  # 鸢尾花数据集
# dataset = "ardamavi/sign-language-digits-dataset"
download_path = "./kaggle_data"

# 下载数据集
download_kaggle_dataset(dataset, download_path)

# 加载数据
def load_dataset_from_path(download_path):
    """从下载路径加载CSV文件"""
    csv_files = [f for f in os.listdir(download_path) if f.endswith('.csv')]
    
    datasets = {}
    for file in csv_files:
        file_path = os.path.join(download_path, file)
        df_name = file.replace('.csv', '')
        datasets[df_name] = pd.read_csv(file_path)
        print(f"加载了 {file}: {datasets[df_name].shape}")
    
    return datasets

# 加载数据
data_dict = load_dataset_from_path(download_path)

# 查看第一个数据集
if data_dict:
    first_key = list(data_dict.keys())[0]
    print(f"\n数据集 '{first_key}' 的前5行:")
    print(data_dict[first_key].head())

正在下载数据集: uciml/iris
Dataset URL: https://www.kaggle.com/datasets/uciml/iris
下载完成！
加载了 Iris.csv: (150, 6)

数据集 'Iris' 的前5行:
   Id  SepalLengthCm  SepalWidthCm  PetalLengthCm  PetalWidthCm      Species
0   1            5.1           3.5            1.4           0.2  Iris-setosa
1   2            4.9           3.0            1.4           0.2  Iris-setosa
2   3            4.7           3.2            1.3           0.2  Iris-setosa
3   4            4.6           3.1            1.5           0.2  Iris-setosa
4   5            5.0           3.6            1.4           0.2  Iris-setosa
