# Kaggle

In [1]:
from datetime import datetime
import os
from kaggle.api.kaggle_api_extended import KaggleApi
import time 




In [2]:
def LeituraAPI(folder_name: str, source: str, bucket_name: str = "raw"):
    start = time.time()
    try:
        # 📌 Autenticação Kaggle
        os.environ['KAGGLE_CONFIG_DIR'] = '/home/user/.kaggle'
        api = KaggleApi()
        api.authenticate()
        print("✅ Autenticação Kaggle bem-sucedida")

        # 🗂️ Diretório local de destino com versionamento por mês/ano
        now_str = f"{datetime.now().month}_{datetime.now().year}"
        path = f"/home/user/datasets/{folder_name}/{now_str}"
        print(f"📁 Diretório local de destino: {path}")
        os.makedirs(path, exist_ok=True)

        # 📥 Download do dataset do Kaggle e extração
        print(f"⬇️ Baixando dataset '{source}' para '{path}'...")
        api.dataset_download_files(source, path=path, unzip=True)

        # 📂 Lista os arquivos baixados
        arquivos = os.listdir(path)
        print(f"📄 Arquivos salvos localmente:")
        for arq in arquivos:
            print(f" - {arq}")
        print(f"\nTotal: {len(arquivos)} arquivo(s)\n")
        print(f"💾 Salvo localmente em: {path}")
        end = time.time()
        print(f"⏱️ Processo de acesso a API e salvamento dos dados em diretório local levou {end - start:.2f} segundos.")
    except Exception as e:
        print(f"❌ Erro: {e}")
        import traceback
        traceback.print_exc()


In [3]:
folder_name = 'uber_dataset'
source = 'fivethirtyeight/uber-pickups-in-new-york-city'
# bucket_name = 'raw'
LeituraAPI(folder_name=folder_name, source=source)

✅ Autenticação Kaggle bem-sucedida
📁 Diretório local de destino: /home/user/datasets/uber_dataset/9_2025
⬇️ Baixando dataset 'fivethirtyeight/uber-pickups-in-new-york-city' para '/home/user/datasets/uber_dataset/9_2025'...
Dataset URL: https://www.kaggle.com/datasets/fivethirtyeight/uber-pickups-in-new-york-city
📄 Arquivos salvos localmente:
 - other-American_B01362.csv
 - other-Carmel_B00256.csv
 - other-Dial7_B00887.csv
 - other-Diplo_B01196.csv
 - other-Federal_02216.csv
 - other-FHV-services_jan-aug-2015.csv
 - other-Firstclass_B01536.csv
 - other-Highclass_B01717.csv
 - other-Lyft_B02510.csv
 - other-Prestige_B01338.csv
 - other-Skyline_B00111.csv
 - Uber-Jan-Feb-FOIL.csv
 - uber-raw-data-apr14.csv
 - uber-raw-data-aug14.csv
 - uber-raw-data-janjune-15.csv
 - uber-raw-data-jul14.csv
 - uber-raw-data-jun14.csv
 - uber-raw-data-may14.csv
 - uber-raw-data-sep14.csv

Total: 19 arquivo(s)

💾 Salvo localmente em: /home/user/datasets/uber_dataset/9_2025
⏱️ Leitura + count levou 87.29 seg