## **Instalando Kaggle**

O comando "!pip install kaggle" é utilizado para instalar o pacote Python chamado "kaggle" usando o gerenciador de pacotes pip.

In [None]:
!pip install kaggle

## **Importando chave API Kaggle**

Neste ponto é necessario gerar a chave no perfil do Kaggle. Vai ser feito o dowload de um arquivo .jason.
A partir disso o codigo abaixo seleciona o arquivo e coloca na pasta correta.

#### **Importação de Módulos**
"Tk": É uma classe da biblioteca Tkinter que representa uma janela Tkinter.
"askopenfilename": É uma função do Tkinter que abre um diálogo para selecionar um arquivo.
"os": Fornece funções relacionadas ao sistema operacional.
"shutil": Fornece operações de alto nível para manipulação de arquivos.

#### **Definição da Função 'upload_kaggle_token'**
"Tk().withdraw()": Cria uma janela Tkinter oculta. Isso é feito para que a janela de seleção de arquivo não apareça ao usuário.
"askopenfilename(title="kaggle.json")": Exibe um diálogo de seleção de arquivo e retorna o caminho do arquivo selecionado.

#### **Manipulação de Caminhos**
"os.path.expanduser("~")": Obtém o diretório do usuário.
"os.path.join(user_dir, '.kaggle')": Constrói o caminho para o diretório .kaggle dentro do diretório do usuário.
"os.path.exists(kaggle_dir)": Verifica se o diretório .kaggle já existe.
"os.makedirs(kaggle_dir)": Cria o diretório se ele não existir.
"shutil.copy(file_path, kaggle_dir)": Move o arquivo selecionado para o diretório .kaggle.
"upload_kaggle_token()": É chamada para executar o processo de seleção e movimentação do arquivo.

In [1]:
from tkinter import Tk
from tkinter.filedialog import askopenfilename
import os
import shutil

def upload_kaggle_token():
    Tk().withdraw()  # Mantém uma janela Tkinter oculta
    file_path = askopenfilename(title="kaggle.json")

    # Obtém o diretório do usuário
    user_dir = os.path.expanduser("~")

    # Constrói o caminho para o diretório .kaggle
    kaggle_dir = os.path.join(user_dir, '.kaggle')

    # Cria o diretório se não existir
    if not os.path.exists(kaggle_dir):
        os.makedirs(kaggle_dir)

    # Move o arquivo para o local correto
    shutil.copy(file_path, kaggle_dir)

upload_kaggle_token()

## **Importando Kaggle**

O comando import kaggle em Python é utilizado para importar a biblioteca Kaggle, que fornece uma interface de linha de comando (CLI) para interagir com a plataforma Kaggle diretamente do seu ambiente de desenvolvimento. Ao executar import kaggle, você está basicamente carregando as funcionalidades disponíveis na biblioteca Kaggle no seu script ou ambiente de programação. Isso permite que você utilize as diversas funcionalidades que a biblioteca oferece, como baixar conjuntos de dados, enviar suas soluções para competições, ou realizar outras operações relacionadas à plataforma Kaggle.

In [9]:
import kaggle

## **Importando KaggleApi**

O comando from kaggle.api.kaggle_api_extended import KaggleApi está importando a classe KaggleApi do módulo kaggle_api_extended do pacote kaggle.api no Python. 
A classe KaggleApi fornece métodos que permitem autenticação, upload e download de conjuntos de dados, listagem de conjuntos de dados, competições, entre outras funcionalidades relacionadas ao Kaggle.

In [1]:
from kaggle.api.kaggle_api_extended import KaggleApi

## **Download do conjunto de dados do Kaggle**

Esse código em Python realiza o download de um conjunto de dados do Kaggle usando a Kaggle CLI (Command-Line Interface) por meio do módulo "subprocess".

O módulo subprocess é utilizado para chamar processos externos a partir do seu script Python.

A função download_kaggle_dataset recebe dois argumentos: dataset (o identificador do conjunto de dados no Kaggle) e destination_path (o caminho onde o conjunto de dados será baixado).
Utiliza o subprocess.run para executar o comando kaggle datasets download -d <dataset> -p <destination_path>.

In [1]:
import subprocess

def download_kaggle_dataset(dataset, destination_path='.'):
    subprocess.run(['kaggle', 'datasets', 'download', '-d', dataset, '-p', destination_path])

# Exemplo de uso sem especificar um caminho de destino
download_kaggle_dataset('olistbr/brazilian-ecommerce')


## **Extraindo Arquivos**

O código abaixo extrai o conteúdo de um arquivo ZIP para um diretório específico e, em seguida, remove o próprio arquivo ZIP, mantendo apenas os dados descompactados no diretório 'brazilian_ecommerce'.

A linha de código import "zipfile" em Python importa o módulo zipfile. O módulo zipfile é parte da biblioteca padrão do Python e fornece funcionalidades para trabalhar com arquivos ZIP.

O módulo "os" em Python fornece uma maneira de interagir com o sistema operacional subjacente, permitindo que você execute operações relacionadas ao sistema de arquivos, manipulação de caminhos, variáveis de ambiente, entre outras funcionalidades.

In [2]:
import zipfile
import os

# Caminho para o arquivo ZIP e diretório de extração
zip_file_path = 'brazilian-ecommerce.zip'
extracted_dir = 'brazilian_ecommerce'

# Descompactando o conjunto de dados
with zipfile.ZipFile(zip_file_path, 'r') as zip_ref:
    zip_ref.extractall(extracted_dir)

# Removendo o arquivo ZIP após a extração
os.remove(zip_file_path)