<a href="https://colab.research.google.com/github/mayfluf/projeto_sql_koru/blob/main/projeto_kotu.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#Projeto de Engenharia de Dados — Integração com Google Books API

Este projeto tem como objetivo realizar a coleta de dados sobre livros relacionados à programação em Python, utilizando a API pública do Google Books. Os dados extraídos foram organizados em uma planilha CSV, armazenados na nuvem via Google Cloud Storage e posteriormente analisados no BigQuery com SQL.

#Tecnologias Utilizadas
Google Colab --
Google Books API --
Pandas --
Google Cloud Storage --
BigQuery --
SQL

#Etapas do Projeto
1. Coleta de Dados via API
Utilizamos o endpoint da Google Books API para buscar informações sobre livros com o tema "Python Programming". A requisição foi feita diretamente no Google Colab com os seguintes parâmetros:


```
url = "https://www.googleapis.com/books/v1/volumes"
params = {
    "q": "python programming",
    "maxResults": 40  # Selecionamos 40 resultados
}
```

1. 2 - A resposta da API foi tratada em JSON e convertida em um DataFrame com colunas relevantes como título, autores, editora, data de publicação, descrição e número de páginas.

2. Geração do Arquivo CSV
Após o tratamento dos dados, o DataFrame foi exportado para um arquivo .csv diretamente no ambiente do Colab

3. Upload para o Google Cloud Storage
O arquivo CSV gerado foi enviado para um bucket no Google Cloud Storage, utilizando autenticação via google.colab e integração com a biblioteca google.cloud.storage. Isso permitiu o armazenamento seguro e escalável dos dados na nuvem.

4. Integração com BigQuery
Com o arquivo já no bucket, realizamos a importação dos dados para uma tabela no BigQuery. A tabela foi criada com esquema automático e os dados foram carregados diretamente do CSV hospedado no Cloud Storage.

#INTALANDO O PACK PARA API

In [None]:
!pip install requests pandas



#IMPORTANTO BIBLIOTECA

In [None]:
import requests
import pandas as pd

:#IMPORTANDO API DO GOOGLE BOOK

---



In [None]:
#:#IMPORTANDO API DO GOOGLE BOOK e DEFININDO A API E REQUISITOS
url = "https://www.googleapis.com/books/v1/volumes"
params = {
    "q": "python programming",
    "maxResults": 40 # SELECIONAMOS 40 RESULTADOS
}
response = requests.get(url, params=params)
response.raise_for_status()
data = response.json()
#CRIANDO BIBLIOTECA COM INFORMAÇOES DEFINIDAS
books_list = []
if 'items' in data:
    for item in data['items']:
        volume_info = item.get('volumeInfo', {})
        book = {
            'title': volume_info.get('title'),
            'volume': item.get('id'), # USANDO VOLUME COMO ID
            'infoLink': volume_info.get('infoLink') # USANDO O SITE COMO INFORMAÇÃO
        }
        books_list.append(book)
# CRIANDO O DATAFRAME
books_df = pd.DataFrame(books_list)
display(books_df.head())
# SALVANDO EM CSV
csv_google = "google_books.csv"
books_df.to_csv(csv_google, index=False)

print(f"Dataframe salvo {csv_google}")

Unnamed: 0,title,volume,infoLink
0,Python Programming,aJQILlLxRmAC,http://books.google.com/books?id=aJQILlLxRmAC&...
1,Python Programming in Context,C3ymDwAAQBAJ,https://play.google.com/store/books/details?id...
2,Python,TFbyAQAACAAJ,http://books.google.com/books?id=TFbyAQAACAAJ&...
3,Core Python Programming,mh0bU6NXrBgC,http://books.google.com/books?id=mh0bU6NXrBgC&...
4,Learn Python,tQwzEAAAQBAJ,https://play.google.com/store/books/details?id...


Dataframe salvo google_books.csv


#INTEGRANDO NA NUVEM


###INSTALANDO A PACK DA CLOUD E ENVIANDO O ARQUIVO PARA BUCKET NA NUVEM

In [None]:
!pip install google-cloud-storage



INSTALANDO BIBLIOTECAS

In [None]:
from google.colab.auth import authenticate_user
authenticate_user()


In [None]:
from google.cloud import storage

# ESPECIFICANDO A BUCKET PARA ENVIAR O ARQUIVO
bucket_name = 'projeto-tainah-koru'
source_file_name = 'google_books.csv'
destination_blob_name = 'google_books.csv'

# CRIANDO A BUCKET
storage_client = storage.Client()
bucket = storage_client.bucket(bucket_name)
blob = bucket.blob(destination_blob_name)
blob.upload_from_filename(source_file_name)

print(f"Arquivo {source_file_name} enviado {destination_blob_name} para bucket {bucket_name}.")

Arquivo google_books.csv enviado google_books.csv para bucket projeto-tainah-koru.
