# üìö Aula ‚Äì BigQuery com Python: **Postando dados**


Bem-vind@! Nesta aula voc√™ vai:

- ‚úÖ Autenticar no Google Cloud (Colab)  
- ‚úÖ Criar *dataset* e *table* no BigQuery  
- ‚úÖ Escrever dados a partir de um `pandas.DataFrame`  
- ‚úÖ Verificar o *schema* e executar uma consulta de checagem  
- ‚úÖ Apagar/limpar (opcional)  

> Dica: rode as c√©lulas **na ordem**. Ajuste as vari√°veis `PROJECT_ID`, `DATASET_ID` e `TABLE_ID` üòâ

## üß∞ Pr√©-requisitos
- Ter acesso a um projeto no Google Cloud com BigQuery habilitado.  
- Estar logado(a) numa conta Google.  
- **Permiss√£o** para criar dataset/tabelas no projeto.

> Se voc√™ estiver no **Google Colab**, a autentica√ß√£o √© feita numa c√©lula abaixo.

## üß™ Criar um `DataFrame` de exemplo
Vamos simular algumas vendas ‚ú®

In [2]:
import pandas as pd

In [3]:
df = pd.DataFrame({
    "id": [1,2,3],
    "page": ["posts","posts","posts"],
    "views": [120, 45, 12],
    "dt_ref": pd.to_datetime(["2025-01-10","2025-01-10","2025-01-10"]).date
})

df

Unnamed: 0,id,page,views,dt_ref
0,1,posts,120,2025-01-10
1,2,posts,45,2025-01-10
2,3,posts,12,2025-01-10


## ‚¨áÔ∏è Instalar bibliotecas
Se estiver no Colab, rode a c√©lula abaixo:

In [4]:
# Se estiver no Colab, descomente a linha abaixo:
!pip -q install pandas-gbq google-cloud-bigquery

## üîê Autentica√ß√£o (Colab)
Rode esta c√©lula no **Colab** para autenticar sua conta Google.

In [5]:
try:
    from google.colab import auth  # type: ignore
    auth.authenticate_user()
    print("‚úî Autenticado com sucesso no Colab!")
except Exception as e:
    print("‚ÑπÔ∏è Se n√£o estiver no Colab, ignore. Erro/aviso:", e)

‚úî Autenticado com sucesso no Colab!


## ‚öôÔ∏è Imports e vari√°veis de ambiente
Preencha abaixo seu `PROJECT_ID` e os nomes que deseja para `DATASET_ID` e `TABLE_ID`.

In [7]:
import pandas_gbq
from google.cloud import bigquery

In [8]:
# üîÅ Edite aqui:
PROJECT_ID = "escolap2p"       # ex.: "meu-projeto-123"
DATASET_ID = "cliente_teste"          # ex.: "aula01_demo"
DATASET_LOCATION = "southamerica-east1"  # ou "US", "EU", etc.

client = bigquery.Client(project=PROJECT_ID)
print("Projeto ativo:", client.project)


Projeto ativo: escolap2p


## üóÇÔ∏è Criar dataset (se n√£o existir)

In [9]:
client = bigquery.Client(project=PROJECT_ID)

dataset_ref = bigquery.Dataset(f"{PROJECT_ID}.{DATASET_ID}")
dataset_ref.location = DATASET_LOCATION  # s√≥ vale se o dataset ainda n√£o existir

# cria se n√£o existir; se existir, apenas retorna sem alterar (location n√£o √© trocada)
client.create_dataset(dataset_ref, exists_ok=True)
print(f"‚úî Dataset garantido: {PROJECT_ID}.{DATASET_ID} (alvo: {DATASET_LOCATION})")

‚úî Dataset garantido: escolap2p.cliente_teste (alvo: southamerica-east1)


## üß± Definir schema para criar a tabela (se n√£o existir)

In [10]:
TABLE_ID   = "teste_exemplo"       # ex.: "vendas_exemplo"

In [11]:
DESTINATION = f"{DATASET_ID}.{TABLE_ID}"

In [13]:
schema = [
    {"name": "id", "type": "INT64"},
    {"name": "page", "type": "STRING"},
    {"name": "views", "type": "INT64"},
    {"name": "dt_ref", "type": "DATE"},
]

## üì§ Enviar `DataFrame` ‚Üí BigQuery


In [16]:
pandas_gbq.to_gbq(
    df,
    destination_table=f"{DATASET_ID}.{TABLE_ID}",
    project_id=PROJECT_ID,
    if_exists="replace",  # Especifica o comportamento se a tabela j√° existir: 'fail', 'replace', 'append'
    location=DATASET_LOCATION,
    table_schema=schema
)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:00<00:00, 9576.04it/s]


## üß† Exerc√≠cios (m√£o na massa)

**Append vs Replace üîÅ**
* Envie um DF pequeno com if_exists="append".
* Reenvie o mesmo DF com if_exists="replace".
* Meta: entender quando sobrescrever vs. anexar.

**Schema expl√≠cito üß±**
* Envie um DF especificando table_schema=[...] (inclua DATE, INT64, NUMERIC).
* Depois tente enviar sem schema e compare os tipos criados pelo BigQuery.
* Meta: evitar infer√™ncia errada.

**Regi√£o do job üåé**
* Garanta o dataset em southamerica-east1.
* Envie com to_gbq(..., location="southamerica-east1").
* Em seguida, tente sem location e observe o erro/aviso.
* Meta: gravar sempre na mesma regi√£o do dataset.

## üéØ Conclus√£o
Voc√™ autenticou, criou dataset/tabela, escreveu dados com `pandas` e validou com uma consulta.  
Na **Aula 02**, vamos **adquirir dados do BigQuery com Python**.