## **Instalando Kaggle**

O comando "!pip install kaggle" é utilizado para instalar o pacote Python chamado "kaggle" usando o gerenciador de pacotes pip.

In [2]:
pip install kaggle

Note: you may need to restart the kernel to use updated packages.


## **Importando chave API Kaggle**

Neste ponto é necessario gerar a chave no perfil do Kaggle. Vai ser feito o dowload de um arquivo .jason.
A partir disso o codigo abaixo seleciona o arquivo e coloca na pasta correta.

#### **Importação de Módulos**
"os": Fornece funções relacionadas ao sistema operacional.  
"shutil": Fornece operações de alto nível para manipulação de arquivos.  
"Path" é uma classe do módulo pathlib usada para manipulação de caminhos de forma mais orientada a objetos.  

#### **Definição da Função 'upload_kaggle_token'**
"notebook_dir = Path().resolve()": Obtém o diretório do notebook atual usando Path().resolve().  
"kaggle_token_dir = notebook_dir / 'Kaggle Token'": Usa a classe Path para construir o caminho para a pasta "Kaggle Token" no diretório do notebook.  
"file_path = kaggle_token_dir / 'kaggle.json'": Constrói o caminho completo para o arquivo kaggle.json dentro da pasta "Kaggle Token".  
"if not file_path.exists()": Verifica se o arquivo kaggle.json existe na pasta "Kaggle Token". Se não existir, imprime uma mensagem e encerra a função.  
"user_dir = Path.home()": Obtém o diretório do usuário usando Path.home().  
"kaggle_dir = user_dir / '.kaggle'": Constrói o caminho para o diretório .kaggle no diretório do usuário.  
"if not kaggle_dir.exists()": Verifica se o diretório .kaggle não existe e, se não existir, cria-o.
"shutil.copy(file_path, kaggle_dir)": Move o arquivo kaggle.json para o diretório .kaggle.  
"print("Arquivo 'kaggle.json' movido com sucesso para o diretório '.kaggle'.")" Imprime uma mensagem indicando que a operação foi bem-sucedida.  
"upload_kaggle_token()": Chama a função upload_kaggle_token para executar todo o processo.

In [3]:
import os
import shutil
from pathlib import Path

def upload_kaggle_token():
    # Obtém o diretório do notebook
    notebook_dir = Path().resolve()

    # Constrói o caminho para a pasta "Kaggle Token"
    kaggle_token_dir = notebook_dir / 'Kaggle Token'

    # Obtém o caminho completo para o arquivo kaggle.json
    file_path = kaggle_token_dir / 'kaggle.json'

    # Verifica se o arquivo existe antes de prosseguir
    if not file_path.exists():
        print("O arquivo 'kaggle.json' não foi encontrado na pasta 'Kaggle Token'.")
        return

    # Obtém o diretório do usuário
    user_dir = Path.home()

    # Constrói o caminho para o diretório .kaggle
    kaggle_dir = user_dir / '.kaggle'

    # Cria o diretório se não existir
    if not kaggle_dir.exists():
        kaggle_dir.mkdir()

    # Move o arquivo para o local correto
    shutil.copy(file_path, kaggle_dir)
    print("Arquivo 'kaggle.json' movido com sucesso para o diretório '.kaggle'.")

upload_kaggle_token()

Arquivo 'kaggle.json' movido com sucesso para o diretório '.kaggle'.


## **Importando Kaggle**

O comando import kaggle em Python é utilizado para importar a biblioteca Kaggle, que fornece uma interface de linha de comando (CLI) para interagir com a plataforma Kaggle diretamente do seu ambiente de desenvolvimento. Ao executar import kaggle, você está basicamente carregando as funcionalidades disponíveis na biblioteca Kaggle no seu script ou ambiente de programação. Isso permite que você utilize as diversas funcionalidades que a biblioteca oferece, como baixar conjuntos de dados, enviar suas soluções para competições, ou realizar outras operações relacionadas à plataforma Kaggle.

In [None]:
import kaggle

## **Importando KaggleApi**

O comando from kaggle.api.kaggle_api_extended import KaggleApi está importando a classe KaggleApi do módulo kaggle_api_extended do pacote kaggle.api no Python.  
A classe KaggleApi fornece métodos que permitem autenticação, upload e download de conjuntos de dados, listagem de conjuntos de dados, competições, entre outras funcionalidades relacionadas ao Kaggle.

In [None]:
from kaggle.api.kaggle_api_extended import KaggleApi

## **Download do conjunto de dados do Kaggle**

Esse código em Python realiza o download de um conjunto de dados do Kaggle usando a Kaggle CLI (Command-Line Interface) por meio do módulo "subprocess".

O módulo subprocess é utilizado para chamar processos externos a partir do seu script Python.

A função download_kaggle_dataset recebe dois argumentos: dataset (o identificador do conjunto de dados no Kaggle) e destination_path (o caminho onde o conjunto de dados será baixado).
Utiliza o subprocess.run para executar o comando kaggle datasets download -d <dataset> -p <destination_path>.

In [None]:
import subprocess

def download_kaggle_dataset(dataset, destination_path='.'):
    subprocess.run(['kaggle', 'datasets', 'download', '-d', dataset, '-p', destination_path])

# Exemplo de uso sem especificar um caminho de destino
download_kaggle_dataset('olistbr/brazilian-ecommerce')


## **Extraindo Arquivos**

O código abaixo extrai o conteúdo de um arquivo ZIP para um diretório específico e, em seguida, remove o próprio arquivo ZIP, mantendo apenas os dados descompactados no diretório 'brazilian_ecommerce'.

A linha de código import "zipfile" em Python importa o módulo zipfile. O módulo zipfile é parte da biblioteca padrão do Python e fornece funcionalidades para trabalhar com arquivos ZIP.

O módulo "os" em Python fornece uma maneira de interagir com o sistema operacional subjacente, permitindo que você execute operações relacionadas ao sistema de arquivos, manipulação de caminhos, variáveis de ambiente, entre outras funcionalidades.

In [None]:
import zipfile
import os

# Caminho para o arquivo ZIP e diretório de extração
zip_file_path = 'brazilian-ecommerce.zip'
extracted_dir = 'brazilian_ecommerce'

# Descompactando o conjunto de dados
with zipfile.ZipFile(zip_file_path, 'r') as zip_ref:
    zip_ref.extractall(extracted_dir)

# Removendo o arquivo ZIP após a extração
os.remove(zip_file_path)