# {transition="slide" transition-speed="slow"}

:::{.title-center}
Filogenia Molecular 
:::

:::{.center}
Edición 2023
:::

:::{.half-image}
![](www/IIBCE-logo.jpg){fig-alt="icon iibce" fig-align="center"}
:::

:::{.author}
Mathias Mangino<br>
Customer Success, RStudio<br>
:::


# ***Trypanosoma cruzi*** {transition="slide" transition-speed="slow"}

:::: {.columns}

::: {.column width="60%"}

::: {.incremental}
- Es el agente etiológico de la `enfermedad de Chagas` o tripanosomiasis americana.

- Esta enfermedad afecta a 6-7 millones de personas principalmente en América Latina, con un número creciente de casos en países no endémicos como Canadá, Estados Unidos y algunos países europeos.

- El genoma de *T. cruzi* se expandió y `es 2.3 veces más grande` que el de *T. brucei y T. rangeli*.  

- Aproximadamente el 52% del genoma de *T. cruzi* está compuesto por secuencias de ADN repetitivas.

- Las familias multigenicas son una de las cuasas de la expansión y diversificación dramáticas de las secuencias repetitivas.

- En particular las familias multigénicas que codifican proteínas, como las proteínas (TS, MASP, mucinas, gp63, RHS y DGF-1)
:::

:::

::: {.column width="40%"}
![](www/try_pic.jpg){fig-alt="pic try" fig-align="rigth"}
<br>(Kingwell, 2022)
:::

::::

## Retrotransposon Hot Spot (RHS) {transition="slide" transition-speed="slow"}

Algunas familias de retrotransposones se insertan en regiones especificas de las RHS, generando seudogenes  de RHS.
Se han evidenciado múltiples RHS en multiples genomas de diferentes tripanosomas.
Las proteínas RHS de *T. brucei* comparten una region N-terminal conservada y la region C-terminal es variable. Se identificaron por primera vez en *T. brucei* y se clasificaron en `seis subfamilias (RHS1 a RHS6)` en función de la región C-terminal.

En *T. brucei* se ha investigado el papel de la familia RHS, y se ha sugieren que las RHS están involucradas en el control de la expansión de los retroelementos.
Se ha planteo la hipótesis de que los seudogenes RHS en *T. brucei* son una fuente de siARN antisentido que regula la expresión de la familia RHS. Estudios más recientes propusieron que 
La familia de las RHS podría estar involucrada en la modelización de la cromatina, la elongación de la transcripción y la exportación de ARNm en *T. brucei*.

## Materiales {transition="slide" transition-speed="slow"}

:::: {.columns}

::: {.column width="50%"}

* Materiales para obtener secuencias
  - Uso de BLAST, específicamente la aplicación rpsblast para identificar dominios conservados, con un e-value de 1×10^-5.
  - Descarga y construcción de perfiles con bases de datos de dominios conservados como CDD, Pfam, SMART, KOG, COG, PRK y TIGR.

<br>

* Ingredientes obtenidos
  - 139 secuencias aminoacídicas de RHS tras la eliminación de falsos positivos

:::
::: {.column width="50%"}

**Comando para crear los perfiles** 


```{bash, eval=FALSE}
#| message: false
#| warning: false
#| code-fold: true
#| echo: true

makeprofiledb -title todos -in todos.pn -out todos -threshold 9.82 -scale 100.0 -dbtype rps -index true

```


<br>
**Busqueda mediante perfiles de dominios conservados en nuestras trascriptos** 


```{bash, eval=FALSE}
#| message: false
#| warning: false
#| code-fold: true
#| echo: true

rpsblast -query secuencias.fasta -db /home/ruta/ncbi_dataset/CDD_rhs/todos -evalue 1e-5 -max_target_seqs 1 -max_hsps 1 -outfmt '6 std qlen slen' -out salida.txt

```


:::

::::

## Materiales {transition="slide" transition-speed="slow"}

:::: {.columns}

::: {.column width="45%"}

* Materiales para filogenia
  - Alineamientos múltiples realizados con `MUSCLE`.
  - Uso de `RAxML v8.2.9` con el método de máxima verosimilitud `(ML)`, empleando el modelo PROTGAMMAAUTO seleccionado según el criterio de Akaike (AIC) y generando `1000 réplicas bootstrap`.
  - Visualización de la filogenia con `Figtree` v1.4.2.
  
:::
::: {.column width="45%"}

* Alineamientos múltiples realizados con `MAFFT`


```{bash, eval=FALSE}
#| message: false
#| warning: false
#| code-fold: true
#| echo: true

mafft secuencias_entrada.fasta > secuencias_salida.fasta

```


* Se uso `iqtree2` con el método de `ML`, empleando el modelo Q.mammal+F+I+I+R5 seleccionado según el criterio de Akaike (AIC), criterio bayesiano y generando `1000 réplicas bootstrap`.


```{bash, eval=FALSE}
#| message: false
#| warning: false
#| code-fold: true
#| echo: true

iqtree2 -s secuenica_salida.fasta -B 1000

```


* Visualización de la filogenia con `Figtree`

:::
::::

## Resultados {transition="slide" transition-speed="slow"}

:::: {.columns}

::: {.column width="50%"}

![](www/phy_ber.jpeg){fig-alt="phy ber" fig-align="left" width="80%"}
(Bernardo et al., 2020)

<br>

Asumen que los grupos se forman cuando los valores de bootstrap superan el umbral de 75. Categorizaron exitosamente 74 secuencias en 10 grupos, mientras que las 65 secuencias con valores de bootstrap por debajo del umbral no se categorizaron.

:::
::: {.column width="50%"}

![](www/phy_own.png){fig-alt="phy ber" fig-align="left" width="70%"}

:::

::::

## Before we talk about Quarto {transition="slide" transition-speed="slow"}

![](www/phy_own2.png){fig-alt="phy ber" fig-align="center" width="600"}

# Your turn! To get started {background-image="www/paper.png" background-size="cover"}

- [quarto.org](https://quarto.org/)  
- [gt](https://gt.rstudio.com/index.html)  
- [gtExtras](https://jthomasmock.github.io/gtExtras/) 
- [palmerpenguins](https://allisonhorst.github.io/palmerpenguins/)


<br>
code at <https://github.com/jeremy-allen/quarto-demo>

:::{.credit}
Photo by <a href="https://unsplash.com/@kellysikkema?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">Kelly Sikkema</a> on <a href="https://unsplash.com/s/photos/paper?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">Unsplash</a>
:::

:::{.author}
Jeremy Allen<br>
Customer Success, RStudio<br>
twitter: @jeremy_data
:::
