# 📚 Aula – BigQuery com Python: **Postando dados**


Bem-vind@! Nesta aula você vai:

- ✅ Autenticar no Google Cloud (Colab)  
- ✅ Criar *dataset* e *table* no BigQuery  
- ✅ Escrever dados a partir de um `pandas.DataFrame`  
- ✅ Verificar o *schema* e executar uma consulta de checagem  
- ✅ Apagar/limpar (opcional)  

> Dica: rode as células **na ordem**. Ajuste as variáveis `PROJECT_ID`, `DATASET_ID` e `TABLE_ID` 😉

## 🧰 Pré-requisitos
- Ter acesso a um projeto no Google Cloud com BigQuery habilitado.  
- Estar logado(a) numa conta Google.  
- **Permissão** para criar dataset/tabelas no projeto.

> Se você estiver no **Google Colab**, a autenticação é feita numa célula abaixo.

## 🧪 Criar um `DataFrame` de exemplo
Vamos simular algumas vendas ✨

In [2]:
import pandas as pd

In [3]:
df = pd.DataFrame({
    "id": [1,2,3],
    "page": ["posts","posts","posts"],
    "views": [120, 45, 12],
    "dt_ref": pd.to_datetime(["2025-01-10","2025-01-10","2025-01-10"]).date
})

df

Unnamed: 0,id,page,views,dt_ref
0,1,posts,120,2025-01-10
1,2,posts,45,2025-01-10
2,3,posts,12,2025-01-10


## ⬇️ Instalar bibliotecas
Se estiver no Colab, rode a célula abaixo:

In [4]:
# Se estiver no Colab, descomente a linha abaixo:
!pip -q install pandas-gbq google-cloud-bigquery

## 🔐 Autenticação (Colab)
Rode esta célula no **Colab** para autenticar sua conta Google.

In [5]:
try:
    from google.colab import auth  # type: ignore
    auth.authenticate_user()
    print("✔ Autenticado com sucesso no Colab!")
except Exception as e:
    print("ℹ️ Se não estiver no Colab, ignore. Erro/aviso:", e)

✔ Autenticado com sucesso no Colab!


## ⚙️ Imports e variáveis de ambiente
Preencha abaixo seu `PROJECT_ID` e os nomes que deseja para `DATASET_ID` e `TABLE_ID`.

In [7]:
import pandas_gbq
from google.cloud import bigquery

In [8]:
# 🔁 Edite aqui:
PROJECT_ID = "escolap2p"       # ex.: "meu-projeto-123"
DATASET_ID = "cliente_teste"          # ex.: "aula01_demo"
DATASET_LOCATION = "southamerica-east1"  # ou "US", "EU", etc.

client = bigquery.Client(project=PROJECT_ID)
print("Projeto ativo:", client.project)


Projeto ativo: escolap2p


## 🗂️ Criar dataset (se não existir)

In [9]:
client = bigquery.Client(project=PROJECT_ID)

dataset_ref = bigquery.Dataset(f"{PROJECT_ID}.{DATASET_ID}")
dataset_ref.location = DATASET_LOCATION  # só vale se o dataset ainda não existir

# cria se não existir; se existir, apenas retorna sem alterar (location não é trocada)
client.create_dataset(dataset_ref, exists_ok=True)
print(f"✔ Dataset garantido: {PROJECT_ID}.{DATASET_ID} (alvo: {DATASET_LOCATION})")

✔ Dataset garantido: escolap2p.cliente_teste (alvo: southamerica-east1)


## 🧱 Definir schema para criar a tabela (se não existir)

In [10]:
TABLE_ID   = "teste_exemplo"       # ex.: "vendas_exemplo"

In [11]:
DESTINATION = f"{DATASET_ID}.{TABLE_ID}"

In [13]:
schema = [
    {"name": "id", "type": "INT64"},
    {"name": "page", "type": "STRING"},
    {"name": "views", "type": "INT64"},
    {"name": "dt_ref", "type": "DATE"},
]

## 📤 Enviar `DataFrame` → BigQuery


In [16]:
pandas_gbq.to_gbq(
    df,
    destination_table=f"{DATASET_ID}.{TABLE_ID}",
    project_id=PROJECT_ID,
    if_exists="replace",  # Especifica o comportamento se a tabela já existir: 'fail', 'replace', 'append'
    location=DATASET_LOCATION,
    table_schema=schema
)

100%|██████████| 1/1 [00:00<00:00, 9576.04it/s]


## 🧠 Exercícios (mão na massa)

**Append vs Replace 🔁**
* Envie um DF pequeno com if_exists="append".
* Reenvie o mesmo DF com if_exists="replace".
* Meta: entender quando sobrescrever vs. anexar.

**Schema explícito 🧱**
* Envie um DF especificando table_schema=[...] (inclua DATE, INT64, NUMERIC).
* Depois tente enviar sem schema e compare os tipos criados pelo BigQuery.
* Meta: evitar inferência errada.

**Região do job 🌎**
* Garanta o dataset em southamerica-east1.
* Envie com to_gbq(..., location="southamerica-east1").
* Em seguida, tente sem location e observe o erro/aviso.
* Meta: gravar sempre na mesma região do dataset.

## 🎯 Conclusão
Você autenticou, criou dataset/tabela, escreveu dados com `pandas` e validou com uma consulta.  
Na **Aula 02**, vamos **adquirir dados do BigQuery com Python**.