# Módulo 15: Flujos de Trabajo GPS y GBS

## Descripción general


*GPS Unified Pipeline* es un Nextflow Pipeline para el procesamiento de lecturas brutas de secuenciación de *Streptococcus pneumoniae* (archivos FASTQ) por el Proyecto GPS ([Global Pneumococcal Sequencing Project](https://www.pneumogen.net/gps/)) está disponible a través de este enlace: https://github.com/HarryHung/gps-unified-pipeline.

El *GBS Typer Pipeline* es un flujo de trabajo de Nextflow para caracterizar serotipos, MLST, AMR y proteínas de superficie a partir de secuencias de Streptococcus agalactiae (archivos FASTQ) por el [Proyecto JUNO](https://www.gbsgen.net/) y está disponible [aquí](https://github.com/sanger-bentley-group/GBS-Typer-sanger-nf). La línea de producción toma una entrada de lecturas de Streptoccocus agalactiae recortadas y controladas por pares, las procesa en paralelo a través de estos "flujos de trabajo" y combina los resultados para crear un informe principal (y archivos FASTA de alelos de genes MLST y AMR, si procede).

![Intro](./images/gbs.png)

> En este módulo trabajaremos con el GBS Typer Pipeline.

## Detalles de cada flujo de trabajo:

1. MLST con SRST2

Descarga la base de datos MLST para *Streptococcus agalactiae* y utiliza SRST2 para hacer MLST.

2. Serotipado con SRST2

Descarga la [base de datos](https://github.com/swainechen/GBS-SBG) de serotipos GBS y utiliza SRST2 para identificar serotipos (de forma similar a MLST)

3. Tipificación de proteínas de superficie con SRST2

Utiliza una [base de datos](https://github.com/sanger-bentley-group/GBS-Typer-sanger-nf/tree/main/db/0.2.1/GBS_Surface_Gene-DB) de genes de superficie hecha a medida y utiliza SRST2 para identificar proteínas de superficie (de forma similar a MLST)

4. Tipificación de resistencias con SRST2

Utiliza una [base de datos](https://github.com/sanger-bentley-group/GBS-Typer-sanger-nf/tree/main/db/0.2.1/GBS_resTyper_Gene-DB) de genes de resistencia antimicrobiana GBS hecha a medida y ResFinder y utiliza SRST2 para identificar genes AMR

5. Detección de variantes con freebayes

Utiliza [freebayes](https://github.com/freebayes/freebayes) para generar alelos de consenso MLST/resistencia antimicrobiana (en formato FASTA) basados en alineaciones imperfectas de SRST2 (No forma parte del informe principal)

## Ejecución del proceso

>La ejecución del proceso requiere una conexión a Internet.

>Actualmente sólo admite lecturas pareadas (paired-end).

### Instalación

#### 1. Instalar condacolab

In [None]:
!pip install -q condacolab
import condacolab
condacolab.install()

In [None]:
!conda config --add channels bioconda

#### 2. Instalar nextflow

In [None]:
!conda create -n nextflow nextflow
!conda activate nextflow

#### 3.  Descarga del pipeline en el directorio "Data"

In [None]:
!git clone https://github.com/sanger-pathogens/GBS-Typer-sanger-nf.git

### Uso

Entra en el directorio GBS-Typer-sanger-nf:

In [None]:
%cd GBS-Typer-sanger-nf

Ejecutar con dos muestras 20280_5#40 y 20280_5#47 de "assignment_s.agalactiae" en "Section_tree". Esto generará informes en un nuevo directorio llamado "my_samples".

In [None]:
!nextflow run main.nf --reads '../Section_three/assignment_s.agalactiae/20280_5#4*_{1,2}.fastq.gz' --results_dir my_samples

Esto debería tardar unos 20 minutos, dependiendo de su sistema. Cuando se haya completado con éxito, usted debe ver:

Abra "gbs_typer_report.txt" en el directorio my_samples (utilizando Excel u otra herramienta de hoja de cálculo):

Cada columna puede explicarse a partir del diccionario aquí donde la columna "category" es "in_silico_analysis".

### Para más información

- La ejecución del flujo de trabajo de tipado PBP y detección de alelos se describe [aquí](https://github.com/sanger-bentley-group/GBS-Typer-sanger-nf)

- Opciones avanzadas para el [cambio de parámetros](https://github.com/sanger-bentley-group/GBS-Typer-sanger-nf)

- Ejemplos de otros pipelines Nextflow alojados en [nf-core](https://nf-co.re/)

- Recursos para construir sus propios pipelines Nextflow:
    - Tutorial: https://training.seqera.io/ 

    - Referencia: https://www.nextflow.io/docs/latest/index.html

