<a href="https://colab.research.google.com/github/larissafcerqueira/materias_estudos/blob/main/projeto_etapa1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
%%writefile upload_gcp.py

import subprocess
from google.colab import auth
import gspread
import pandas as pd
from google.cloud import storage

# Instalar as bibliotecas necessárias
def instalar_bibliotecas():
    subprocess.check_call(['pip', 'install', '--upgrade', 'gspread', 'google-cloud-storage', 'pandas'])

# Autenticar o usuário no Google Colab
def autenticar_usuario():
    auth.authenticate_user()

# Puxar dados do Google Sheets e salvar como CSV
def puxar_dados_google_sheets(sheet_id, service_account_file, csv_path):
    # Autentica usando a conta de serviço
    gc = gspread.service_account(filename=service_account_file)
    # Abre a planilha pelo ID e seleciona a primeira aba
    sheet = gc.open_by_key(sheet_id).sheet1
    # Pega todos os dados da planilha
    dados = sheet.get_all_records()
    # Converte para DataFrame
    df = pd.DataFrame(dados)
    # Salva como CSV
    df.to_csv(csv_path, index=False)
    print(f'Dados salvos como CSV em {csv_path}')

# Fazer upload do arquivo CSV para o Google Cloud Storage
def upload_gcp(bucket_nome, origem_nome, destino_blob_nome):
    # Inicializar o cliente do Google Cloud Storage
    client = storage.Client()
    # Obter o bucket onde o arquivo será armazenado
    bucket = client.bucket(bucket_nome)
    # Criar um novo blob no bucket e fazer o upload do arquivo local
    blob = bucket.blob(destino_blob_nome)
    blob.upload_from_filename(origem_nome)
    print(f'Arquivo {origem_nome} enviado para {destino_blob_nome} no bucket {bucket_nome}')

if __name__ == '__main__':
    # Instalar bibliotecas necessárias
    instalar_bibliotecas()

    # Autenticar usuário
    autenticar_usuario()

    # Definir parâmetros
    sheet_id = '1BnX32ZWov03-_eolJ_PmWC5Lnd0FOOrJoguwpYgxWLQ'  # ID da planilha do Google Sheets
    service_account_file = '/content/nomadic-thinker-434414-i9-f5ef582f6cda.json'  # Caminho para o arquivo de credenciais
    csv_path = '/content/dados.csv'  # Caminho onde o CSV será salvo
    bucket_nome = 'analise_dados'  # Nome do bucket no GCP
    destino_blob_nome = 'dados_bruto/dados_sujos.csv'  # Nome do arquivo no bucket

    # Puxar dados do Google Sheets e salvar como CSV
    puxar_dados_google_sheets(sheet_id, service_account_file, csv_path)

    # Fazer upload do CSV para o Google Cloud Storage
    upload_gcp(bucket_nome, csv_path, destino_blob_nome)


Overwriting upload_gcp.py


In [None]:
!python3 upload_gcp.py


Dados salvos como CSV em /content/dados.csv
Arquivo /content/dados.csv enviado para dados_bruto/dados_sujos.csv no bucket analise_dados


In [None]:
# Importar o módulo
import upload_gcp as upload

# Instalar bibliotecas (supondo que upload_gcp já tenha essa função)
upload.instalar_bibliotecas()

# Autenticar o usuário (chama a autenticação para permitir interações com GCP e Google Sheets)
upload.autenticar_usuario()

# Definir parâmetros
sheet_id = '1BnX32ZWov03-_eolJ_PmWC5Lnd0FOOrJoguwpYgxWLQ'  # ID da planilha do Google Sheets
# Atualizando o caminho do arquivo de credenciais com base nas novas credenciais fornecidas
service_account_file = '/content/nomadic-thinker-434414-i9-f5ef582f6cda.json'  # Caminho para o arquivo de credenciais

csv_path = '/content/dados.csv'  # Caminho onde o CSV será salvo
bucket_nome = 'analise_dados'  # Nome do bucket no GCP
destino_blob_nome = 'dados_bruto/dados_sujos.csv'  # Nome do arquivo no bucket

# Puxar dados do Google Sheets e salvar como CSV
upload.puxar_dados_google_sheets(sheet_id, service_account_file, csv_path)

# Fazer upload do CSV para o Google Cloud Storage
upload.upload_gcp(bucket_nome, csv_path, destino_blob_nome)

# Para ter certeza que as credenciais são lidas corretamente, se necessário você pode carregar o arquivo diretamente assim:
import json

# Carregar as credenciais do arquivo JSON
with open(service_account_file) as source:
    info = json.load(source)

print("Credenciais carregadas com sucesso!")


Dados salvos como CSV em /content/dados.csv
Arquivo /content/dados.csv enviado para dados_bruto/dados_sujos.csv no bucket analise_dados
Credenciais carregadas com sucesso!
