# Criação de Tabelas no BigQuery a partir do Google Cloud Storage

Após a criação do bucket no **Google Cloud Storage**, os arquivos **.parquet** foram carregados. Em seguida, um script em **Python** será utilizado para criar as tabelas automaticamente no **BigQuery**, garantindo a integração eficiente dos dados.

O conjunto de dados **raw** foi criado para o armazenamento dos dados brutos, essa camada mantém os dados na sua forma original, sem transformações ou modificações. Isso garante que os dados completos e não processados estejam disponíveis para auditorias ou recriação de análises.


In [1]:
from google.cloud import bigquery

In [8]:
project_id = "marketplace-challenge-456003"  # substitua pelo seu ID real
conjunto = "staging"
dataset_id = f"{project_id}.{conjunto}"

In [9]:
tabelas = ["associado",
            "categoria",
            "cliente",
            "filial",
            "item",
            "item_venda",
            #"municipio",
            "subcategoria",
            "uf",
            "venda"]  # substitua pelos nomes reais

In [11]:
for table in tabelas:
    # Criar cliente BigQuery
    client = bigquery.Client()

    tabela_id = f"{dataset_id}.{table}"
    uri = f"gs://bucket-jessinha/parquet_files/{table}.parquet"

    # Configuração do job de carga para PARQUET
    job_config = bigquery.LoadJobConfig(
        source_format=bigquery.SourceFormat.PARQUET,
        autodetect=True  # Detectar o schema automaticamente
    )

    # Executar a importação
    job = client.load_table_from_uri(uri, tabela_id, job_config=job_config)
    job.result()  # Aguarda a conclusão

    # Exibir resultado
    tabela = client.get_table(tabela_id)
    print(f"Carga concluída! A tabela {tabela.table_id} tem {tabela.num_rows} linhas.")


Carga concluída! A tabela associado tem 13 linhas.
Carga concluída! A tabela categoria tem 38 linhas.
Carga concluída! A tabela cliente tem 560340 linhas.
Carga concluída! A tabela filial tem 1738 linhas.
Carga concluída! A tabela item tem 103299 linhas.
Carga concluída! A tabela item_venda tem 445244 linhas.
Carga concluída! A tabela subcategoria tem 3295 linhas.
Carga concluída! A tabela uf tem 49 linhas.
Carga concluída! A tabela venda tem 401058 linhas.
