# üìä Integra√ß√£o Python + Google Sheets 

Este projeto demonstra como extrair, transformar e carregar (ETL) dados de um arquivo CSV local para uma planilha do Google Sheets usando Python, pandas e a biblioteca gspread.

O c√≥digo foi desenvolvido em Jupyter Notebook (Sheets API x Python.ipynb) e segue um fluxo que vai desde a limpeza dos dados at√© a atualiza√ß√£o automatizada de uma aba espec√≠fica em uma planilha online.

# üöÄ Funcionalidades

üìÇ Leitura de CSV: importa bases de produ√ß√£o com separador ;.

üßπ Limpeza e padroniza√ß√£o:

Remove duplicados.

Ajusta colunas de c√≥digos (C√≥d. Paciente, C√≥d. Admiss√£o) para texto, removendo sufixos .0.

üìê Transforma√ß√µes:

Sele√ß√£o e renomea√ß√£o de colunas.

Cria√ß√£o de campos como PER√çODO e OBSERVA√á√ÉO.

Convers√£o de datas e indicadores para formatos adequados.

üìä Prepara√ß√£o de DataFrame: organiza colunas na ordem esperada pelo Google Sheets.

‚òÅÔ∏è Integra√ß√£o com Google Sheets:

Autentica√ß√£o via Service Account (arquivo JSON).

Conex√£o com planilha pelo ID.

Escrita dos dados na aba Consolidado_Teste por meio do m√©todo append_row.

# üõ†Ô∏è Tecnologias Utilizadas

Python 3.x

pandas
 ‚Äî manipula√ß√£o de dados.

gspread
 ‚Äî integra√ß√£o com Google Sheets.

oauth2client
 ‚Äî autentica√ß√£o via chave de service account (‚ö†Ô∏è legado, recomenda-se migrar para google-auth).

Google Sheets API

# üìã Estrutura do C√≥digo

Imports: bibliotecas de manipula√ß√£o de dados, autentica√ß√£o e integra√ß√£o.

Leitura e limpeza do CSV.

Transforma√ß√µes e prepara√ß√£o dos dados (rob_hosp).

Configura√ß√£o da API do Google Sheets:

Defini√ß√£o do scope.

Carregamento das credenciais JSON.

Autoriza√ß√£o do cliente.

Conex√£o com a planilha (via spreadsheet_id).

Escrita dos dados: envio das linhas do DataFrame para o Google Sheets.

In [2]:
import pandas as pd
from datetime import datetime, timedelta

https://developers.google.com/sheets/api/quickstart/python?hl=pt-br

1o) Credenciais: Passo a passo video Hashtag (https://www.youtube.com/watch?v=l7pL_Y3fw-o)

2o) Biblioteca Google Python

!pip install --upgrade google-api-python-client google-auth-httplib2 google-auth-oauthlib

1o) QVIS - Produ√ß√£o Geral

In [19]:
df_prod = pd.read_csv(r"caminho para ler o arquivo csv", sep=";")

df_prod = df_prod.drop_duplicates()
df_prod['C√≥d. Paciente'] = df_prod['C√≥d. Paciente'].astype(str)
df_prod['C√≥d. Paciente'] = df_prod['C√≥d. Paciente'].str.rstrip('.0')

df_prod['C√≥d. Admiss√£o'] = df_prod['C√≥d. Admiss√£o'].astype(str)
df_prod['C√≥d. Admiss√£o'] = df_prod['C√≥d. Admiss√£o'].str.rstrip('.0')

  df_prod = pd.read_csv(r"C:\Users\HenriquedaLuzPacheco\Vision One\Pasta P√∫blica - Pasta P√∫blica\ESTRAT√âGIA\Marketing\Bases\Bases CBV\Produ√ß√£o\CBV_ProdGeral_Total_07_02_25.csv", sep=";")


In [None]:
df_prod.head()

Agrega√ß√µes para montar base Indicadores: Colunas Finais

HOSPITAL -	FATOR	- INDICADOR	- M√âTRICA	- ANO	- M√äS	- VALOR	- PER√çODO	- OBSERVA√á√ÉO	- CONCAT	- INDICADOR / OUTROS	- Anomesdia

In [42]:
rob_hosp = df_prod.copy()

# Create 'Anomesdia' column with the first day of the month in the desired format
rob_hosp['Anomesdia'] = pd.to_datetime(rob_hosp['Data Admiss√£o']).dt.strftime('01/%m/%Y')

rob_hosp['Valor R$'] = rob_hosp['Valor Produzido'].astype(float)

# Group by 'Grupo Hospitalar' and 'Anomesdia', then sum 'Valor R$'
rob_hosp = rob_hosp.groupby(['Grupo Hospitalar', 'Anomesdia'], as_index=False)['Valor R$'].sum()

In [None]:
rob_hosp.head()

In [44]:
# Supondo que rob_hosp j√° esteja carregado no seu c√≥digo e com a coluna 'Anomesdia' j√° convertida para datetime.

# Renomeando a coluna 'Grupo Hospitalar'
rob_hosp = rob_hosp.rename(columns={'Grupo Hospitalar': 'HOSPITAL'})

# Adicionando as novas colunas
rob_hosp['FATOR'] = 'FATURAMENTO'
rob_hosp['INDICADOR'] = 'FATURAMENTO TOTAL'
rob_hosp['M√âTRICA'] = 'Receita Bruta Produ√ß√£o'
rob_hosp['Anomesdia'] = pd.to_datetime(rob_hosp['Anomesdia'], errors='coerce')

# Extraindo o ano da coluna 'Anomesdia'
rob_hosp['ANO'] = rob_hosp['Anomesdia'].dt.year
rob_hosp['ANO'] = rob_hosp['ANO'].astype(str)

# Extraindo o m√™s em portugu√™s (abrev. de 3 letras)
rob_hosp['M√äS'] = rob_hosp['Anomesdia'].dt.month_name().str[:3].str.upper()

# Adicionando a coluna 'PER√çODO' com valor 'YTD'
rob_hosp['PER√çODO'] = 'YTD'

# Adicionando a coluna 'OBSERVA√á√ÉO' com valor nulo
rob_hosp['OBSERVA√á√ÉO'] = None  # Ou voc√™ pode usar pd.NA ou np.nan se preferir valores nulos expl√≠citos

# Agrupando por 'HOSPITAL', 'ANO' e 'M√äS', e somando os valores
rob_hosp = rob_hosp.groupby(['HOSPITAL', 'ANO', 'M√äS'], as_index=False)['Valor R$'].sum()

# Mantendo as outras colunas com valores repetidos
rob_hosp['FATOR'] = 'FATURAMENTO'
rob_hosp['INDICADOR'] = 'FATURAMENTO TOTAL'
rob_hosp['M√âTRICA'] = 'Receita Bruta Produ√ß√£o'
rob_hosp['PER√çODO'] = 'YTD'
rob_hosp['OBSERVA√á√ÉO'] = None  # Ou voc√™ pode usar pd.NA ou np.nan

In [None]:
rob_hosp.head()

In [46]:
rob_hosp = rob_hosp[['HOSPITAL', 'FATOR', 'INDICADOR', 'M√âTRICA', 'ANO', 'M√äS', 'Valor R$', 'PER√çODO', 'OBSERVA√á√ÉO']].rename(
    columns={'Valor R$':'VALOR'})

In [None]:
rob_hosp.head()

!pip install gspread
!pip install oauth2client

# LER PLANILHA -> OBTER DADOS DE x ABA E INTERVALO -> GET

In [48]:
import gspread
from oauth2client.service_account import ServiceAccountCredentials

# Usando o escopo adequado para acessar o Google Sheets e Google Drive -> permissoes de acesso
scope = ["https://spreadsheets.google.com/feeds", "https://www.googleapis.com/auth/spreadsheets",
         "https://www.googleapis.com/auth/drive.file", "https://www.googleapis.com/auth/drive"]

# Caminho para o arquivo de chave JSON gerado pela Service Account
creds = ServiceAccountCredentials.from_json_keyfile_name(r"caminho para ler o arquivo de chave json", scope)

# Autentica e cria o cliente
client = gspread.authorize(creds)

# ID da planilha e intervalo (aqui, pegando as primeiras 10 linhas da planilha)
SAMPLE_SPREADSHEET_ID = " id da planilha "
SAMPLE_RANGE_NAME = "Consolidado_Teste!A1:L10"  # Alterando para ler as 10 primeiras linhas

# Acessar a planilha e o intervalo
spreadsheet = client.open_by_key(SAMPLE_SPREADSHEET_ID)
sheet = spreadsheet.worksheet("Consolidado_Teste")

# Ler dados do intervalo especificado
data = sheet.get_all_records()  # Retorna os registros dentro do intervalo

# Convertendo para pandas DataFrame
df = pd.DataFrame(data)

In [None]:
df.head()

# ADICIONAR / ESCREVER VALORES NA PLANILHA -> UPDATE

In [50]:
import gspread
from oauth2client.service_account import ServiceAccountCredentials
import pandas as pd

# Usando o escopo adequado para acessar o Google Sheets e Google Drive -> permissoes de acesso
scope = ["https://spreadsheets.google.com/feeds", "https://www.googleapis.com/auth/spreadsheets",
         "https://www.googleapis.com/auth/drive.file", "https://www.googleapis.com/auth/drive"]

creds = ServiceAccountCredentials.from_json_keyfile_name(r" caminho para ler o arquivo de chave json ", scope)
client = gspread.authorize(creds)

# ID da planilha e nome da aba
SAMPLE_SPREADSHEET_ID = " id da planilha"
sheet = client.open_by_key(SAMPLE_SPREADSHEET_ID).worksheet("Consolidado_Teste")

# Obt√©m todos os valores da aba
all_values = sheet.get_all_values()
first_non_null_row = next((i for i, row in enumerate(all_values) if any(cell for cell in row)), None)

# Defini√ß√£o das colunas na ordem correta
correct_order = [
    'HOSPITAL', 'FATOR', 'INDICADOR', 'M√âTRICA', 'ANO', 'M√äS', 'VALOR', 
    'PER√çODO', 'OBSERVA√á√ÉO'
]

# Certifique-se de que a vari√°vel `rob_hosp_converted` existe antes de us√°-la
if 'rob_hosp' in locals():
    rob_hosp_converted = rob_hosp.copy()

    # Removendo colunas desnecess√°rias, se existirem
    columns_to_drop = ['CONCAT', 'INDICADOR / OUTROS', 'Anomesdia']
    rob_hosp_converted = rob_hosp_converted.drop(columns=[col for col in columns_to_drop if col in rob_hosp_converted.columns], errors='ignore')

    # Convertendo Timestamps para string
    rob_hosp_converted = rob_hosp_converted.applymap(lambda x: x.strftime('%Y-%m-%d') if isinstance(x, pd.Timestamp) else x)

    # Filtrando as colunas na ordem correta
    rob_hosp_converted = rob_hosp_converted[correct_order]

    # Convertendo para lista de listas
    new_data = rob_hosp_converted.values.tolist()

    # Inserindo os dados na planilha
    if first_non_null_row is not None:
        for row in new_data:
            sheet.append_row(row)
        print("Dados adicionados com sucesso!")
    else:
        print("N√£o foi poss√≠vel encontrar a primeira linha n√£o nula.")
else:
    print("Erro: O DataFrame `rob_hosp` n√£o foi definido.")

  rob_hosp_converted = rob_hosp_converted.applymap(lambda x: x.strftime('%Y-%m-%d') if isinstance(x, pd.Timestamp) else x)


Dados adicionados com sucesso!
