# Primer cuaderno
```
Título original: First notebook
Autor: Bahar Tercan
Fecha de creación: 02-09-2022
Cuaderno de Jupyter traducido y modificado por Martín Sende Pombo.
Fecha de modificación: 27-12-2023
Propósito: Recuperar datos con éxito de tablas BigQuery.
Notas: Según el autor puede ejecutarse en MyBinder.
```
[![Binder](https://mybinder.org/badge_logo.svg)](https://mybinder.org/v2/gh/isb-cgc/Community-Notebooks/HEAD?labpath=SL-Cloud%2FMyBinder_Authentication.ipynb)

In [None]:
# Este bloque de código sólo necesita ejecutarse una vez después de la carga del SO.
#!pip3 install google.cloud
#!pip3 install --upgrade google-auth
#Por favor, no corra las 2 líneas de código previas si ya las ejecutó en MyBinder, pero sí la siguiente.
!pip3 install pandas

In [2]:
# Para poder ejecutar consultas se requiere importar la biblioteca de Python BQ.
from google.cloud import bigquery
import pandas as pd

## Autentificación de Google
Nota del editor: Puede omitir este apartado si ya se autentico en **MyBinder**.

El primer paso es autorizar el acceso a BigQuery y a Google Cloud. Para obtener más información, consulte la ['Quick Start Guide to ISB-CGC'](https://isb-cancer-genomics-cloud.readthedocs.io/en/latest/sections/HowToGetStartedonISB-CGC.html) y puede encontrar métodos de autenticación alternativos [aquí](https://googleapis.dev/python/google-api-core/latest/auth.html). Además, necesita [crear un proyecto de Google Cloud](https://cloud.google.com/resource-manager/docs/creating-managing-projects#console) para poder ejecutar consultas con BigQuery.

### * Si está ejecutando este cuaderno en un entorno de máquina virtual de Google (Compute Engine, App Engine, Cloud Run, Cloud Functions): 
La autenticación debería "simplemente funcionar".

### * Si la ejecución se realiza en un entorno local: 
La forma más sencilla de autenticarse es emplear el SDK de Google Cloud.

In [None]:
#Por favor, no corra este bloque de código si ya lo ejecutó en el cuaderno MyBinder.
#Por favor, asegúrese de haber instalado Cloud SDK.
#Consulte la documentación sobre cómo efectuar la instalción en: https://cloud.google.com/sdk/docs/install

!gcloud auth application-default login

## Consultas de prueba con BigQuery

In [3]:
project_id='my-google-project' #Por favor, sustituya my-google-project por el ID de su propio proyecto.
client = bigquery.Client(project_id)
#client = bigquery.Client(credentials=credentials, project=credentials.project_id)

In [4]:
# Esta celda recupera la puntuación del efecto del gen BRCA1 de la primera entrada de datos para el gen BRCA1 del conjunto de datos CRISPR.
crispr_query="""
SELECT * FROM 
`isb-cgc-bq.DEPMAP.Achilles_gene_effect_DepMapPublic_current`
WHERE Hugo_Symbol='BRCA1'
LIMIT 10
"""
brca1_gene_effect=client.query(crispr_query).result().to_dataframe()
brca1_gene_effect

Unnamed: 0,Entrez_ID,Hugo_Symbol,DepMap_ID,Gene_Effect
0,672,BRCA1,ACH-000172,-0.644604
1,672,BRCA1,ACH-000424,-1.015319
2,672,BRCA1,ACH-000684,-0.89866
3,672,BRCA1,ACH-000701,-0.647532
4,672,BRCA1,ACH-000784,-0.855328
5,672,BRCA1,ACH-000796,-0.601054
6,672,BRCA1,ACH-000831,-0.620437
7,672,BRCA1,ACH-000848,-0.879828
8,672,BRCA1,ACH-000935,-0.810157
9,672,BRCA1,ACH-001536,-0.748078


In [5]:
# Esta celda recupera los 10 primeros registros de expresión del gen BRCA1 del conjunto de datos asociado al Pan-Cancer Atlas.
pancancer_atlas_query="""
SELECT * FROM
`pancancer-atlas.Filtered.EBpp_AdjustPANCAN_IlluminaHiSeq_RNASeqV2_genExp_filtered` 
WHERE Symbol='BRCA1'
LIMIT 10
"""
brca1_gene_exp=client.query(pancancer_atlas_query).result().to_dataframe()
brca1_gene_exp

Unnamed: 0,ParticipantBarcode,SampleBarcode,AliquotBarcode,SampleTypeLetterCode,SampleType,Study,Symbol,Entrez,normalized_count
0,TCGA-58-8386,TCGA-58-8386-11A,TCGA-58-8386-11A-01R-2296-07,NT,Solid Tissue Normal,LUSC,BRCA1,672,101.891
1,TCGA-DD-A1EE,TCGA-DD-A1EE-11A,TCGA-DD-A1EE-11A-11R-A131-07,NT,Solid Tissue Normal,LIHC,BRCA1,672,57.1929
2,TCGA-HM-A3JJ,TCGA-HM-A3JJ-11A,TCGA-HM-A3JJ-11A-12R-A21T-07,NT,Solid Tissue Normal,CESC,BRCA1,672,83.1683
3,TCGA-D3-A8GD,TCGA-D3-A8GD-06A,TCGA-D3-A8GD-06A-11R-A37K-07,TM,Metastatic,SKCM,BRCA1,672,413.683
4,TCGA-EE-A182,TCGA-EE-A182-06A,TCGA-EE-A182-06A-11R-A18T-07,TM,Metastatic,SKCM,BRCA1,672,173.346
5,TCGA-HM-A6W2,TCGA-HM-A6W2-06A,TCGA-HM-A6W2-06A-22R-A33Z-07,TM,Metastatic,CESC,BRCA1,672,795.556
6,TCGA-22-0940,TCGA-22-0940-01A,TCGA-22-0940-01A-01R-0692-07,TP,Primary solid Tumor,LUSC,BRCA1,672,674.271
7,TCGA-25-1316,TCGA-25-1316-01A,TCGA-25-1316-01A-01R-1565-13,TP,Primary solid Tumor,OV,BRCA1,672,292.492624
8,TCGA-2J-AAB4,TCGA-2J-AAB4-01A,TCGA-2J-AAB4-01A-12R-A41B-07,TP,Primary solid Tumor,PAAD,BRCA1,672,191.919
9,TCGA-32-5222,TCGA-32-5222-01A,TCGA-32-5222-01A-01R-1850-01,TP,Primary solid Tumor,GBM,BRCA1,672,299.145


Si fue capaz de ejecutar ambas consultas de prueba correctamente, no debería tener problemas para utilizar los flujos de trabajo de SL-Cloud.