### Configuração e conexão entre Python e o Google BigQuery
O Python pode se conectar ao Google BigQuery usando diferentes métodos de autenticação, dependendo do ambiente e das permissões necessárias. Irei apresentar aqui as principais formas apresentadas durante o curso: **Autenticação com Service Account (Conta de Serviço)** e **Application Default Credentials (ADC)**.

#### Autenticação com Service Account (Conta de Serviço)
Durante o curso, realizei a configuração das credenciais dentro do Google Cloud Console, que gerencia as configurações de autenticação para BigQuery e outras APIs do Google Cloud, seguindo os seguintes passos:

**Exemplo de configuração:**

- Acessar a aba APIs e serviços -> Credenciais -> Criar Credenciais -> Conta de serviço (Passar os parâmetros do projeto como: Nome e ID da Conta de Serviço)

- Gerenciar permissões: Atribua o papel de *Propietário*, *BigQuery Admin* e *Agente do BigQuery Data Transfer Service*, dependendo do nível de acesso desejado.

- Após essas configurações, a chave de autenticação será armazenada localmente em um arquivo *.json*.

![teste](credenciais_gbq.jpg)

#### Application Default Credentials (ADC)
As credenciais padrão do Google Cloud (Application Default Credentials - ADC) no ambiente local, permitem que aplicações interajam com APIs do Google Cloud sem precisar de um arquivo JSON de chave de serviço. Elas são úteis para desenvolvimento e testes sem configuração manual de autenticação.

**Como funcionam?**
- São armazenadas automaticamente no computador local após autenticação.

- Permitem acesso a APIs do Google Cloud sem precisar especificar credenciais dentro do código.

- Usam o login da conta Google para gerar um token de autenticação.

**Exemplo de configuração:**

Para configurar credenciais padrão no ambiente local, é necessário executar o seguinte comando no terminal:

``` bash
# Comando
gcloud auth application-default login
```
Isso abrirá uma página no navegador para login na conta do Google. Após a autenticação, as credenciais serão armazenadas e usadas automaticamente quando o Python acessar APIs do Google Cloud.

### Projeto Prático
As linhas de código apresentadas abaixo, permitem configurar a conexão entre o Python e o Google BigQuery de forma segura, permitindo a manipulação de dados dentro do BigQuery diretamente pelo código Python. Irei explicar o passo a passo dessa configuração a seguir!

#### Instalação das bibliotecas - Entendendo os comandos que serão utilizados:
Para acessar, consultar, manipular e enviar dados para o BigQuery diretamente pelo código, é essencial instalar algumas bibliotecas.

- **pip install google-cloud-bigquery:**
Instala o cliente da biblioteca *google-cloud-bigquery*, que permite interagir com o Google BigQuery através do Python.

- **pip install --upgrade google-cloud-bigquery:**
Atualiza o pacote *google-cloud-bigquery* para a versão mais recente disponível.

- **pip install pandas:** 
Instala o Pandas, uma biblioteca essencial para manipulação e análise de dados em Python.

- **pip install pandas pandas-gbq:** 
Instala ambos os pacotes pandas e pandas-gbq. O *pandas-gbq* é um complemento do Pandas que facilita a integração com o Google BigQuery.

``` python
# Comandos executados no terminal
pip install google-cloud-bigquery
pip install --upgrade google-cloud-bigquery
pip install pandas
pip install pandas pandas-gbq
```

- **import pandas as pd:** Importa o Pandas para realizar a manipulação e análise de dados no Python.

- **from google.cloud import bigquery:** Importa o cliente do Google BigQuery, permitindo a interação com o banco de dados.

- **from google.oauth2 import service_account:** Importa o módulo para autenticação via Service Account, que é uma forma segura de acessar o Google BigQuery.

- **from pandas_gbq import to_gbq:** Importa a função to_gbq, usada para enviar DataFrames do Pandas diretamente para o BigQuery.

``` python
# Importar as bibliotecas no código
import pandas as pd
from google.cloud import bigquery
from google.oauth2 import service_account
from pandas_gbq import to_gbq

# Carregar as credenciais do arquivo JSON contendo a chave da Service Account. O argumento scopes define quais permissões serão concedidas, no caso, acesso ao BigQuery.
credencial = service_account.Credentials.from_service_account_file(
    r'C:\caminho\arquivo\pythoncurso-123456-0i0000000f0b.json' # exemplo
    scopes=['https://www.googleapis.com/auth/bigquery']
)
```
Após a execução desse código o ambiente estará pronto para consultar e enviar informações ao BigQuery, onde será possível realizar consultas SQL, enviar DataFrames do Pandas para BigQuery e interagir com os dados na nuvem.

### Teste de conexão 1: Utilizando: *from google.cloud import bigquery*
O comando **from google.cloud import bigquery** em Python é usado para importar o cliente BigQuery do Google Cloud. Com essa importação, podemos interagir com bancos de dados do BigQuery diretamente pelo Python. Isso inclui a execução de consultas, manipulação de tabelas e conjuntos de dados, além da integração com outras ferramentas de análise.

**Exemplo:** O código abaixo realiza uma consulta SQL no Google BigQuery usando Python e armazena os resultados em um DataFrame do Pandas. Vamos entender cada parte:

``` python
from google.cloud import bigquery
import pandas as pd

# Armazena o caminho do arquivo JSON que contêm as credenciais de autenticação para o Google BigQuery
credencial = r"C:\caminho\arquivo\pythoncurso-123456-0i0000000f0b.json" # exemplo

# Cria um cliente do BigQuery autenticado com as credenciais da Service Account, permitindo acessar e manipular dados no BigQuery
client = bigquery.Client.from_service_account_json(credencial)

# Aqui, estamos definindo uma consulta SQL que seleciona todos os registros (SELECT *) da tabela TB_CLIENTE, localizada dentro do dataset Aula_Python no projeto pythoncurso-123456.
query = """

  SELECT * FROM `pythoncurso-123456.Aula_Python.TB_CLIENTE` 

"""

# O client bigquery executa a consulta e retorna os dados. Os resultados ficam armazenados na variável resultado, que é um objeto de consulta, ainda não transformado em um DataFrame.
resultado = client.query(query)

# Aqui, convertemos os dados da consulta para um DataFrame do Pandas, permitindo manipulação e análise dos dados no Python. Agora podemos usar funções do Pandas como df.head() para visualizar os primeiros registros ou df.describe() para estatísticas dos dados.
df = resultado.to_dataframe()
df.head(5)

```
![dataframe.jpg](dataframe.jpg)

Importar uma tabela do Google BigQuery e armazená-la em um DataFrame do Pandas é uma maneira eficiente de acessar, manipular e analisar dados diretamente no Python.

### Teste de conexão 2: Utilizando: *from google.oauth2 import service_account*
O comando **from google.oauth2 import service_account** em Python é usado para importar a funcionalidade de autenticação baseada em contas de serviço do Google. Isso permite a conexão de forma segura aos serviços do Google Cloud sem precisar de autenticação manual toda vez. Com essa importação, podemos criar credenciais e usá-las para autenticar e autorizar as solicitações automaticamente.

**Exemplo:**
```python
import pandas as pd
from google.cloud import bigquery
from google.oauth2 import service_account

# Especifique as informaçoes de credenciais que estão contidas dentro do arquivo JSON (Abra o arquivo e copie e cole as informações aqui). OBS: Essas informções são confidencias. No exemplo anterior, passamos o caminho onde o arquivo JSON está salvo. Agora iremos informar o conteúdo do arquivo.

credencial = {
  "type": "service_account",
  "project_id": "pythoncurso-123456",
  "private_key_id": "00000000000000000ei000000ee000000",
  "private_key": "demais informações**********",
  "client_email": "aulapythoncurso@pythoncurso-123456.iam.gserviceaccount.com",
  "client_id": "1234567890123456789",
  "auth_uri": "https://accounts.google.com/o/oauth2/auth",
  "token_uri": "https://oauth2.googleapis.com/token",
  "auth_provider_x509_cert_url": "https://www.googleapis.com/oauth2/v1/certs",
  "client_x509_cert_url": "https://www.googleapis.com/robot/v1/metadata/x509/aulapythoncurso%40pythoncurso-123456.iam.gserviceaccount.com",
  "universe_domain": "googleapis.com"
}

# Cria um cliente do BigQuery usando credenciais de uma conta de serviço
client = bigquery.Client(credentials=service_account.Credentials.from_service_account_info(credencial))

# Construa sua consulta
query = """ 

  SELECT 
  id
  ,first_name
  ,last_name
  ,email  
  ,state
 FROM `pythoncurso-123456.Aula_Python.TB_CLIENTE` 
 where state in ('Piauí','Alagoas','Amazonas','Maranhão','Rondônia')

"""
# Execute a consulta
resultado = client.query(query)

# Converta os resultados em um DataFrame
df = resultado.to_dataframe()
df.head(30)

```
![dataframe2](dataframe2.jpg)

### Carregando dados para o Google BigQuery utilizando *from pandas_gbq import to_gbq*
Com essa função, podemos salvar um DataFrame diretamente em uma tabela do BigQuery sem precisar escrever SQL manualmente.

**Exemplo 1:**
```python
import pandas as pd
from google.cloud import bigquery
from google.oauth2 import service_account
from pandas_gbq import to_gbq

# Carregue suas credenciais
credencial = service_account.Credentials.from_service_account_file(
    r'C:\caminho\arquivo\pythoncurso-123456-0i0000000f0b.json',
    scopes=['https://www.googleapis.com/auth/bigquery']
)

# Ler o arquivo com os dados e carrega em um dataframe
df = pd.read_excel(r"C:\caminho_do_arquivo\exemplo_excel\Produto.xlsx")
df.head()

# Envie o DataFrame para o BigQuery inserindo o caminho onde os dados serão carregados em uma tabela
df.to_gbq(destination_table='pythoncurso-123456.Aula_Python.TB_PRODUTO',  # caminho da tabela onde os dados serão carregados
          project_id='pythoncurso-123456',
          if_exists='replace', # se a tabela já existir irá subistuir pela nova que está sendo carregada
          credentials=credencial)

# if_exists='replace' = subistui a antiga pela atual 
# if_exists='append' = adiciona dados no fim da tabela

```
**Exemplo 2:**
```python
# Carregue suas credenciais
credencial = service_account.Credentials.from_service_account_file(
    r'C:\caminho\arquivo\pythoncurso-123456-0i0000000f0b.json',
    scopes=['https://www.googleapis.com/auth/bigquery']
)

# Insira os parâmetros do seu projeto no Google BigQuery dentro de variáves (Boa prática quando temos que subir mais de um conjuto de dados (dataframes) em um mesmo dataset)
projeto = 'pythoncurso-123456'
dataset = 'Aula_Python'
tabela = 'Produto_2'
parametro = 'append'

# Aqui passamos as variáveis com os parâmetos que carregamos acima
df.to_gbq(destination_table=f'{projeto}.{dataset}.{tabela}',
          project_id=projeto,
          if_exists=parametro,
          credentials=credencial)

```
**Exemplo 3:**
```python
# Carregando vários arquivos de um projeto (mapeamento da origem dos dados)
produto     = pd.read_excel(r"C:\Arquivos\Origem\arquivos_excel\Produto.xlsx")
itens       = pd.read_excel(r"C:\Arquivos\Origem\arquivos_excel\items.xlsx")
ordens      = pd.read_excel(r"C:\Arquivos\Origem\arquivos_excel\Ordens.xlsx")
categoria   = pd.read_excel(r"C:\Arquivos\Origem\arquivos_excel\Categoria.xlsx")
cliente     = pd.read_csv(r"C:\Arquivos\Origem\arquivos_csv\Clientes.csv", delimiter=',')

# Insira os parâmetros do seu projeto no Google BigQuery e as variáves que irão receber o nome das tabelas onde os dados serão armazenados dentro do BigQuery
projeto         = 'pythoncurso-123456'
dataset         = 'Ecommerce'
bq_produto      = 'TB_PRODUTO'
bq_itens        = 'TB_ITENS'
bq_ordens       = 'TB_ORDENS'
bq_categoria    = 'TB_CATEGORIA'
bq_cliente      = 'TB_CLIENTE'
parametro       = 'replace'

# Carregue suas credenciais para importar os dados para o BigQuery
credencial = service_account.Credentials.from_service_account_file(
    r'C:\caminho\arquivo\pythoncurso-123456-0i0000000f0b.json',
    scopes=['https://www.googleapis.com/auth/bigquery']
)

# Agora para cada conjunto de dados iremos inserir o caminho onde os dados serão carregados
produto.to_gbq(destination_table=f'{projeto}.{dataset}.{bq_produto}',
          project_id=projeto,
          if_exists=parametro,
          credentials=credencial)

itens.to_gbq(destination_table=f'{projeto}.{dataset}.{bq_itens}',
          project_id=projeto,
          if_exists=parametro,
          credentials=credencial)

ordens.to_gbq(destination_table=f'{projeto}.{dataset}.{bq_ordens}',
          project_id=projeto,
          if_exists=parametro,
          credentials=credencial)

categoria.to_gbq(destination_table=f'{projeto}.{dataset}.{bq_categoria}',
          project_id=projeto,
          if_exists=parametro,
          credentials=credencial)

cliente.to_gbq(destination_table=f'{projeto}.{dataset}.{bq_cliente}',
          project_id=projeto,
          if_exists=parametro,
          credentials=credencial)
```

**Resultado Carga Google BigQuery:**


![carga_gbq](carga_gbq.jpg)


### Extração de dados do Google BigQuery

```python
# Importação das bibcliotecas para extrair e manipular os dados do BigQuery com Python
from google.cloud import bigquery
import pandas as pd

# Carregue suas credenciais que permitirá realizar consultas aos dados no BigQuery
credencial = r"C:\Users\casnav\workspace\Udemy\pythoncurso-123456-0e0000000f0b.json"
client = bigquery.Client.from_service_account_json(credencial)

# Desenvolvimento das consultas no Google BigQuery
consulta_produto = """
SELECT * FROM `pythoncurso-455516.Ecommerce.TB_PRODUTO` limit 30
"""

consulta_categoria = """
SELECT * FROM `pythoncurso-455516.Ecommerce.TB_CATEGORIA` limit 30
"""

consulta_cliente = """
SELECT * FROM `pythoncurso-455516.Ecommerce.TB_CLIENTE` limit 30
"""

consulta_itens = """
SELECT * FROM `pythoncurso-455516.Ecommerce.TB_ITENS` LIMIT 30
"""

consulta_ordens = """
SELECT * FROM `pythoncurso-455516.Ecommerce.TB_ORDENS` LIMIT 30
"""

# Executa e traz o resultado das consultas realizadas acima
resultado_consulta_prod = client.query(consulta_produto)
resultado_consulta_catg = client.query(consulta_categoria)
resultado_consulta_clit = client.query(consulta_cliente)
resultado_consulta_ites = client.query(consulta_itens)
resultado_consulta_ords = client.query(consulta_ordens)

# Converte os resultados das consultas e armazena em um Dataframe
df_produto      = resultado_consulta_prod.to_dataframe()
df_categoria    = resultado_consulta_catg.to_dataframe()
df_cliente      = resultado_consulta_clit.to_dataframe()
df_itens        = resultado_consulta_ites.to_dataframe()
df_ordens       = resultado_consulta_ords.to_dataframe()

# Tratamento de datas no dataframe Ordens
df_ordens['created_at'] = df_ordens['created_at'].dt.tz_localize(None)
df_ordens.head()

# Passar os parâmetros de destino onde os dados extraídos serão armazenados
pasta = r"C:\caminho\aulas\Udemy\extracao\\" # Todos os arquivos serão armazenados em uma única pasta
nomearquivoproduto      = "ext_produto.xlsx"
nomearquivocategoria    = "ext_categoria.xlsx"
nomearquivocliente      = "ext_cliente.xlsx"
nomearquivoitens        = "ext_itens.xlsx"
nomearquivoordens       = "ext_ordens.xlsx"

# Armazenamento dos dataframes no excel
df_produto.to_excel(pasta+nomearquivoproduto, index=False)
df_categoria.to_excel(pasta+nomearquivocategoria, index=False)
df_cliente.to_excel(pasta+nomearquivocliente, index=False)
df_itens.to_excel(pasta+nomearquivoitens, index=False)
df_ordens.to_excel(pasta+nomearquivoordens, index=False)
```

