# Módulo 15: Flujos de Trabajo GPS y GBS

## Descripción general


*GPS Unified Pipeline* es un Nextflow Pipeline para el procesamiento de lecturas brutas de secuenciación de *Streptococcus pneumoniae* (archivos FASTQ) por el Proyecto GPS ([Global Pneumococcal Sequencing Project](https://www.pneumogen.net/gps/)) está disponible a través de este enlace: https://github.com/HarryHung/gps-unified-pipeline.

El *GBS Typer Pipeline* es un flujo de trabajo de Nextflow para caracterizar serotipos, MLST, AMR y proteínas de superficie a partir de secuencias de Streptococcus agalactiae (archivos FASTQ) por el [Proyecto JUNO](https://www.gbsgen.net/) y está disponible [aquí](https://github.com/sanger-bentley-group/GBS-Typer-sanger-nf). La línea de producción toma una entrada de lecturas de Streptoccocus agalactiae recortadas y controladas por pares, las procesa en paralelo a través de estos "flujos de trabajo" y combina los resultados para crear un informe principal (y archivos FASTA de alelos de genes MLST y AMR, si procede).

![Intro](./images/gbs.png)

> En este módulo trabajaremos con el GBS Typer Pipeline.

## Detalles de cada flujo de trabajo:

1. MLST con SRST2

Descarga la base de datos MLST para *Streptococcus agalactiae* y utiliza SRST2 para hacer MLST.

2. Serotipado con SRST2

Descarga la [base de datos](https://github.com/swainechen/GBS-SBG) de serotipos GBS y utiliza SRST2 para identificar serotipos (de forma similar a MLST)

3. Tipificación de proteínas de superficie con SRST2

Utiliza una [base de datos](https://github.com/sanger-bentley-group/GBS-Typer-sanger-nf/tree/main/db/0.2.1/GBS_Surface_Gene-DB) de genes de superficie hecha a medida y utiliza SRST2 para identificar proteínas de superficie (de forma similar a MLST)

4. Tipificación de resistencias con SRST2

Utiliza una [base de datos](https://github.com/sanger-bentley-group/GBS-Typer-sanger-nf/tree/main/db/0.2.1/GBS_resTyper_Gene-DB) de genes de resistencia antimicrobiana GBS hecha a medida y ResFinder y utiliza SRST2 para identificar genes AMR

5. Detección de variantes con freebayes

Utiliza [freebayes](https://github.com/freebayes/freebayes) para generar alelos de consenso MLST/resistencia antimicrobiana (en formato FASTA) basados en alineaciones imperfectas de SRST2 (No forma parte del informe principal)

## Ejecución del proceso

>La ejecución del proceso requiere una conexión a Internet.

>Actualmente sólo admite lecturas pareadas (paired-end).

>Este pipeline solo puede ser ejecutado en un ordenador ya que requiere Docker y Nextflow

Los pasos que se explicarán en este tutorial están diseñados para ejecutarse en un ordenador, ya que Google Colab no puede configurarse para este propósito. **Por favor, NO EJECUTE** los siguientes pasos. Estos son solo una guía para que los realice más adelante en su ordenador si tiene un sistema operativo Linux. 

En la carpeta **Módulo 15** encontrará los resultados obtenidos a partir de una ejecución previa realizada en un ordenador. Exploraremos cómo son los archivos de salida.

### Instalación

#### 1. Instalar Docker

Dependiendo de su sistema operativo (Linux, WIndowns, Mac), instale Docker siguiendo las instrucciones detalladas que encontrará [aquí](https://docs.docker.com/desktop/?_gl=1*9l1hj6*_gcl_au*MTc0ODc1MTcxLjE3MjY3NzU0NjM.*_ga*ODEwNzA5MjcxLjE3MjAxOTQ5MDc.*_ga_XJWPQMJYHQ*MTczMjcyMTgzMS4xMC4xLjE3MzI3MjI4NDguNjAuMC4w). 

#### 2. Instalar Nextflow

In [None]:
# No ejecutar
curl -s https://get.nextflow.io | bash

In [None]:
# No ejecutar
# Change the permissions of the nextflow file and make it executable
# Cambie los permisos de nextflow y hágalo ejecutable
chmod +x nextflow

In [None]:
# No ejecutar
# Mueva Nextflow a un directorio que esté en el PATH
# Move Nextflow to a directory that is in the PATH
mkdir -p $HOME/.local/bin/
mv nextflow $HOME/.local/bin/

In [None]:
# No ejecutar
# Confirm that Nextflow is installed
# Confirmar que Nextflow está instalado
nextflow info

#### 3. Clone el respositorio de Pipeline

In [None]:
# No ejecutar
git clone https://github.com/sanger-pathogens/GBS-Typer-sanger-nf.git

### Uso

Vaya al directorio GBS-Typer-sanger-nf:

In [None]:
# No ejecutar
cd GBS-Typer-sanger-nf

Ejecutar con la muestra ERR1795461 utilizada en el Módulo 6: Ensamblaje de genomas. Esto generará informes en un nuevo directorio llamado "results".

In [None]:
# No ejecutar
nextflow run main.nf --reads '/Module_15/GBS-Typer-sanger-nf/ERR1795461_{1,2}.fastq.gz' --results_dir results

### A partir de aquí puede ejecutar los comandos!

### Descargar datos

!wget https://zenodo.org/records/13883141/files/Module_13.tar.gz

### Extraer el archivo .tar.gz

In [None]:
!tar xvf Module_15.tar.gz

Diríjase a la carpeta **results**, donde podrá encontrar los archivos generados tras la ejecución del pipeline GBS-Typer.

In [None]:
%cd Module_15/GBS-Typer-sanger-nf/results

Liste los archivos que se encuentran en la carpeta. Observará que se encuentan los siguientes archivos:

- drug_cat_alleles_variants.txt
- ERR1795461_new_mlst_alleles.fasta
- ERR1795461_new_mlst_pileup.txt
- gbs_res_variants.txt
- gbs_typer_report.txt
- new_mlst_alleles.log
- resfinder_accessions.txt
- serotype_res_incidence.txt
- surface_protein_incidence.txt
- surface_protein_variants.txt

Descargue el archivo  "gbs_typer_report.txt" en su ordenador y ábralo utilizando Excel u otra herramienta de hoja de cálculo:

Este archivo incluye el serotipo, el tipo MLST, las frecuencias alélicas del MLST, la incidencia de genes de resistencia, los tipos de proteínas de superficie y las variantes de resistencia específicas de GBS. Puede encontrar la descripción de cada columna del informe [aquí](https://docs.google.com/spreadsheets/d/1R5FFvACC3a6KCKkTiluhTj492-4cCe74HcCoklqX-X0/edit?gid=0#gid=0), donde la columna de categoría es in_silico_analysis.

[Aquí](https://github.com/sanger-bentley-group/GBS-Typer-sanger-nf?tab=readme-ov-file#outputs) encontrará cómo interpretar los demás archivos que fueron generados.

### Para más información

- La ejecución del flujo de trabajo de tipado PBP y detección de alelos se describe [aquí](https://github.com/sanger-bentley-group/GBS-Typer-sanger-nf)

- Opciones avanzadas para el [cambio de parámetros](https://github.com/sanger-bentley-group/GBS-Typer-sanger-nf)

- Ejemplos de otros pipelines Nextflow alojados en [nf-core](https://nf-co.re/)

- Recursos para construir sus propios pipelines Nextflow:
    - Tutorial: https://training.seqera.io/ 

    - Referencia: https://www.nextflow.io/docs/latest/index.html

