# Análisis de factores de transcripción: Red Transcripcional

* Autores: Mercedes Brenes Álvarez-Elena Cortés Tapias
* Fecha: Enero 2020
* Contacto: mebreal@gmail.com - elena.cortes.t@gmail.com


# 1. Introducción y objetivos

Las redes de co-expresión génica permiten conocer si los genes que se coexpresan mantienen también relaciones de regulación. Esta redes de co-expresión se forman a partir de análisis de ChIP-Seq. Los nodos de esta red correponden a los diferentes genes y las aristas indican las relaciones de expresión entre los nodos. 
Cuando analizamos un factor de transcripción podemos obtener sus genes dianas. Si este análisis se repite para varios factores podemos obtener una red de co-expresión. Esta red será dirigida donde un factor de transcripción se une a un promotor, provocando la expresión de un gen. Incluso se podría dar el caso de interferir con una ruta metabólica y conseguir una integración de ambas rutas. 

El objetivo del proyecto es conocer los genes diana de diez factores de transcripción de *Arabidopsis thaliana*. Con estos genes diana se formará una red de co-expresión génica. 

# 2. Factores de transcripción

En el siguiente apartado presentamos la función de los factores de transcripción de *Arabidopsis thaliana* elegidos. Además, adjuntamos el archivo de parámetros de cada uno donde se encuentran los SRA de cada muestra.

- LFY: Factor implicado en el inicio de la floración. [Factor LFY](params_1.sh)


- MYB3R3: Es un factor implicado en el ciclo celular. Se asocia a la duplicación de ADN y a genes implicados en la fase G2 y mitosis del ciclo. [Factor MYB3R3](params_2.sh)

- PRR5: Participa en el ciclo circadiano. [Factor PRR5](params_3.sh)

- TOC1: Controla los elementos oscilatorios del ciclo circadiano mediante represión.[Factor TOC1](params_4.sh)

- LEC1: Factor implicado en el desarrollo de la semilla. Se centra en la fase de maduración donde se acumulan macromoléculas.  [Factor LEC1](params_5.sh)

- FUL: Es un factor implicado en el desarrollo del pistilo. [Factor FUL](params_6.sh)


- TCP4: Participa en la fotomorfogénesis y ayuda a la apertura del cotiledón.[Factor TCP4](params_7.sh)

- ENAP-1: Este factor participa en la respuesta a etileno.[Factor ENAP-1](params_8.sh)

- PIF50x: Participa en la respuesta adaptativa de las plantas al ambiente [Factor PIFSOX](params_9.sh)

- LHY: Es otro factor del ciclo circadiano relacionado con los componentes oscilatorios. [Factor LHY](params_10.sh)

# 3. Resultados: Red co-expresión génica

El fichero de entrada del script es un archivo ATG.txt que contiene los identificadores de los diferentes factores de transcripción que se van a utilizar para el estudio. A partir de él se va a generar una matriz de adyacencia formada por 0 pero que contenga 1 donde exista una diana para nuestro factor de transcripción.

Se construye la red transcripcional a partir de su matriz de adyacencia y se guarda en formato gml. La red es excesivamente grande y por motivos de recursos computacionales y de tiempo trabajaremos con una red inducida que contiene los factores de transcripción y las aristas entre ellos.

Entre los análisis se realiza una busqueda de subgrafos o patrones no aleatorios denominados motivos de red. Un **motivo de red** es un subgrafo que aparece un número de veces significativamente mayor en la red de interés que en redes aleatorias que cumplen las mismas propiedades.

También se realiza un análisis para comprobar que la red inducida no es libre de escala ya que una red de transcripción génica no puede ser de libre escala.



## **3.1. Cálculo del grado de los nodos**

Para comprobar que nuestra red inducida es no libre de escala se calcula el grado de nodos. Se obtiene un **p valor** de **0,5361** con el que no podemos concluir con seguridad que se trate de una red no libre de escala pero lo asumiremos de aquí en adelante para poder continuar con el estudio.

![degreeddistribution.png](attachment:degreeddistribution.png)

## **3.2. Número de genes autorregulados**

Por lo tanto, las redes aleatorias que cumplen las mismas propiedades que nuestra red de interés son las generadas según el modelo de Erdos-Renyi. La función erdos.renyi.game genera redes aleatorias que siguen una distribución de Poisson con un número de nodos y aristas dado. Aplicando esta función para generar una red aleatoria obtenemos lo siguiente:

![randomplot2.png](attachment:randomplot2.png)

Con esta red aleatoria podemos observar 2 genes que presentan autorregulación además de las relaciones de regulación que existen entre todos los demás nodos de la red. A través del estudio realizado en R, y que se puede comprobar en el script correspondiente, obtuvimos el número de genes autorregulados en la red siendo 2 para la red aleatoria, como hemos podido comprobar en la visualización anterior, y 4 para la red de factores de transcripción.

A continuación podemos visualizar la red a través del programa **Cytoscape**:

![cytoscape.png](attachment:cytoscape.png)

## 3.3. Autorregulación

Se comprueba con la matriz de adyacencia, sumando los elementos de la diagonal, si existe correlación entre ellos y se determina la significancia respecto a las matrices generadas de forma aleatoria.
Se obtuvo un p-valor de **0,0685** que consideramos significativo y por lo tanto afirmamos que en nuestra red existen motivos de autorregulación.



## 3.4. Motivos de red de tres nodos

La función graph.motifs recibe como entrada una red y un tamaño de subgrafo k y devuelve el número de veces que se encuentra cada subgrafo con k nodos en la red. 
Para nuestro estudio, vamos a determinar el número de motivos que hay en la red y los compararemos con los de la red aleatoria para determinar si son o no significativos.

De todos los posibles subgrafos solo tienen sentido los dos que se muestran a continuación:

![subgrafo3.png](attachment:subgrafo3.png)

![subgrafo13.png](attachment:subgrafo13.png)

El **p-valor** que se obtiene de ambos subgrafos es igual a **1** lo que indica que los motivos no son significativos ya que se muestran en mucha mayor proporción en las redes generadas aleatoriamente que en nuestra red. Puede que esto se deba a que al elegir de forma aleatoria los factores de transcripción de este estudio no haya suficiente relación entre ellos.

# 4. Bibliografía

- Adams S, Grundy J, Veflingstad SR, Dyer NP et al. Circadian control of abscisic acid biosynthesis and signalling pathways revealed by genome-wide analysis of LHY binding targets. New Phytol 2018 Nov;220(3):893-907.
- Goslin, K., Zheng, B., Serrano-Mislata, A., Rae, L., Ryan, P. T., Kwaśniewska, K., … Graciet, E. (2017). Transcription factor interplay between LEAFY and APETALA1/CAULIFLOWER during floral initiation. Plant Physiology, 174(2), 1097–1109. https://doi.org/10.1104/pp.17.00098  
- Kobayashi, K., Suzuki, T., Iwata, E., Nakamichi, N., Suzuki, T., Chen, P., … Ito, M. (2015). Transcriptional repression by MYB 3R proteins regulates plant organ growth . The EMBO Journal, 34(15), 1992–2007. https://doi.org/10.15252/embj.201490899
- Nakamichi, N., Kiba, T., Kamioka, M., Suzukie, T., Yamashino, T., Higashiyama, T., … Mizuno, T. (2012). Transcriptional repressor PRR5 directly regulates clock-output pathways. Proceedings of the National Academy of Sciences of the United States of America, 109(42), 17123–17128. https://doi.org/10.1073/pnas.1205156109
- Huang, W., Pérez-García, P., Pokhilko, A., Millar, A. J., Antoshechkin, I., Riechmann, J. L., & Mas, P. (2012). Mapping the core of the Arabidopsis circadian clock defines the network structure of the oscillator. Science, 335(6077), 75–79. https://doi.org/10.1126/science.1219075
- Pelletier, J. M., Kwong, R. W., Park, S., Le, B. H., Baden, R., Cagliari, A., … Harada, J. J. (2017). LEC1 sequentially regulates the transcription of genes involved in diverse developmental processes during seed development. Proceedings of the National Academy of Sciences of the United States of America, 114(32), E6710–E6719. https://doi.org/10.1073/pnas.1707957114
- Bemer, M., Van Mourik, H., Muiño, J. M., Ferrándiz, C., Kaufmann, K., & Angenent, G. C. (2017). FRUITFULL controls SAUR10 expression and regulates Arabidopsis growth and architecture. Journal of Experimental Botany, 68(13), 3391–3403. https://doi.org/10.1093/jxb/erx184
- Dong, J., Sun, N., Yang, J., Deng, Z., Lan, J., Qin, G., … Wei, N. (2019). The transcription factors tcp4 and pif3 antagonistically regulate organ-speciﬁc light induction of saur genes to modulate cotyledon opening during de-etiolation in arabidopsis. Plant Cell, 31(5), 1155–1170. https://doi.org/10.1105/tpc.18.00803
- Paquetes de R: igraph