# Google Cloud Platform

## Índice

 - Crear una cuenta gratuita GCP, de 90 días y 300\$
 - Crear un bucket en Google Cloud Storage (GCS) y alamcenar ahí toda nuestra información (Códigos, datos, ficheros, documentación...)
 - Crear repositorios de datos en BigQuery y hacer consultas y vistas en BigQuerySQL
 - Crear instancias VertexAI Workbench para abrir notebooks de python, donde también hacer uso de los datos, sean de GCS o BigQuery
 - Conectar workbench con GitHub
 - Visualizacion con Looker
 - Programar acciones con Scheduler o Airflow, Vertex AI

## Crear cuenta gratuita

 - Entra en [GCP](https://cloud.google.com/free?hl=es_419) o teclea en internet GCP Free trier
 - Sigue los pasos para crear la cuenta. Requisitos: Tener cuenta gmail y una tarjeta de crédito, No se te cobrará nada inicialmente, solo en caso de exceder los 90 días o los 300$ de prueba. 

Automáticamente se te habrá creado un proyecto: "My First Proyect". Puedes crear más si lo necesitas.


## Google Cloud Storage

Crear in bucket en GCS:
 - Dentro de GCP, en la barra de búsqueda, escribe "Cloud Storage"
 - Después Create a Bucket
 - Dale un nombre
 - Prueba a crear una carpeta y a subir un fichero csv o cualquier documento para comprobar que funciona bien
 

## BigQuery

 - Busca BigQuery en la barra de búsqueda
 - En el menú de la izquierda tienes un explorador con todos tus objetos BigQuery
 - Niveles jerárquicos: 
   - Repositories, Query, Notebooks, Data Canvases, Data Preparation, Pipelines, External Connections, Datasets
   - **Datasets** contiene los datos, sean tablas o vistas (Proyect_id.dataset.tabla)
   - **Queries** es donde se guardan los códigos con nuestras consultas a los datos (de Datasets)
   
 
 ## Cargar datos en BigQuery
 
 
 - A través de **interfaz**
   - En la parte alta del explorador tenemos el botón Add Data, que nos lleva a un menú en el que tendremos que elegir la fuente de datos (Local, GCS, Google Sheets...)
   - Si no tenemos ningún dataset creado, o queremos crear otro, en este menú podemos hacerlo. Nos pedirá indicar en qué dataset guardar la nueva tabla.
   - En la parte baja de este menú tenemos Advanced Options, donde podemos indicar el delimitador de las columnas de nuestros datos
   - Al clicar en Create, se nos creará una nueva tabla en el dataset, de nuevo en el menú Explorador de la izquierda.
 
 
 - Con **comando SQL**:
   - Comandos SQL (`LOAD DATA`)

```sql
LOAD DATA INTO `proyecto.dataset.tabla`
FROM FILES (
  format = 'CSV',
  uris = ['gs://bucket/archivo.csv']
)

```   

   - Desde **Vertex AI Workbench** (Python)
   
   ```python
    from google.cloud import bigquery

    client = bigquery.Client()

    # Carga desde DataFrame de Pandas
    df.to_gbq(
      destination_table='dataset.tabla',
      project_id='proyecto',
      if_exists='append'  # o 'replace'
    )

    # Carga desde GCS
    job_config = bigquery.LoadJobConfig(
      source_format=bigquery.SourceFormat.CSV,
      skip_leading_rows=1
    )

    load_job = client.load_table_from_uri(
      "gs://bucket/archivo.csv",
      "dataset.tabla",
      job_config=job_config
    )
```

 
## Guardar Query

 - Haz una query de prueba para comprobar que tus datos se cargaron correctamente
 
 ```sql
 select * from `project_id.dataset.table_name`
 ```
 
 - Clica en el botón Save Query e indica un nombre para ella. Verás que se guarda dentro del proyecto en el **nivel jerárquico Queries**
 
 
 
 
 

## Crear instancias Vertex AI Workbench

 - En la barra de búsquedas: VertexAI Workbench
 - Create New
  - Dale un nombre, 
  - Selecciona: 
    - una región y una zona
    - un environment y Operating system
    - Una máquina, dependiendo de la potencia tendrá un costo u otro
 - Una vez creada iníciala clicando en Start, y podrás clicar en Open JupyterLab

## Instalar Python

Normalmente debería venir con python ya instalado e incluso con algunos entornos ya preconfigurados e instalados, pero si no:

Instalar python. Los códigos que se requiere ejecutar para instalar las dependiencias pueden ser ejecutados en:

 - En el notebook abierto a partir de la instancia VertexAI Workbench, en el menú izquierdo en el botón '+' y abre una consola
 - Abrir una CLoud Shell Terminal en la página principal de GCP

 - Actualiza la lista de paquetes
```bash
sudo apt update
```
 - Actualiza los paquetes instalados
```bash
sudo apt upgrade
```
 - Instala Python
```bash
sudo apt install -y python3 python3-pip python3-venv
```
 - Crea un entorno virtual
```bash
python3 -m venv env_consorci
```
 - Activa el entorno virtual
```bash
source env_consorci/bin/activate
```

### Instalar librerías desde requirements.txt


 - Guarda tu fichero requierments.txt en GCS
   - Este fichero contiene los nombres de las librerías que quieres instalar (pandas, matplotlib, scikitlearn...)
   
 - Descarga el fichero a tu instancia
 
```bash
gsutil cp gs://bucket-consorci/requirements.txt .
```

 - Instalar las dependencias

```bash
pip install -r requirements.txt
```

## Clonar Github en nuestro entorno

 - Instalar GitHub

```bash
sudo apt update
sudo apt install -y git
```

 - Abre una terminal dentro del JupyterLab y ejecuta

```bash
git clone https://github.com/bvzq/DS_Consorci_2025
```

El repositorio se descargará en el directorio actual de tu instancia (/home/jupyter/ por defecto).

## Looker Studio

Busca en la barra de búsquedas "Looker Studio" o clica en https://lookerstudio.google.com

 - New Report
 - Add data > BigQuery > project > dataset > table

A partir de aquí, podemos añadir gráficos (Add a Chart), filtros, poner titulos, cambiar la configuraciónde las visualizaciones... Como en PowerBI 