# Escuela de Otoño en CC, CICESE, 2017
---
## Taller de Biocomputación: ARN, estructura secundaria y grafos
## M.C. Hugo Armando Guillén Ramírez


---
# Introducción
El objetivo de este taller es convertir la secuencia y estructura secundaria de una molécula de ARN en un representación basada en grafos. 

La molécula que usaremos para estos ejercicios es el micro ARN [`Xenoturbella bocki miR-92a stem-loop`](https://en.wikipedia.org/wiki/Mir-92_microRNA_precursor_family).

[]() | []()
-- | --
**Secuencia** | `CGGUGGUUUGUCGGGCCAGGUCGGUGCCAUGUUCUGUUAGAUAGUGUAAUAUUGCACUCGUCCCGGCCUGACAAAACACACG` 
**Estructura secundaria** | `(((((..((((((((((.((.((((((.(((((((((...))))...))))).)))).)).)).))))))))))..))).))`
**Energía Libre Mínima (MFE)** | -38.40 kcal/mol
**Diagrama** | ![miR-92a](mirna.png)

In [None]:
import sys
import os
from os import path
from matplotlib import pyplot as plt
import networkx as nx

secuencia = 'CGGUGGUUUGUCGGGCCAGGUCGGUGCCAUGUUCUGUUAGAUAGUGUAAUAUUGCACUCGUCCCGGCCUGACAAAACACACG'
secundaria = '(((((..((((((((((.((.((((((.(((((((((...))))...))))).)))).)).)).))))))))))..))).))'

---
# Actividad 1
Determine si una cadena en formato `dot-bracket` tiene sus paréntesis balanceados.

[]() | []()
-- | --
**Entrada** | Una cadena `s` formada de puntos y paréntesis
**Salida** | Un valor booleano que indique si los paréntesis están balanceados o no.
**Ejemplos** | `..()` es balanceada, `..(().` y `()())` no lo son.

In [None]:
def is_balanced(s):
    return False

In [None]:
#Prueba aquí tu función
print(is_balanced('..()'))
print(is_balanced('..(().'))
print(is_balanced('()())'))
print(is_balanced(secundaria))

---
# Actividad 2
Liste las posiciones hacen match entre sí en una cadena en formato `dot-bracket`.

[]() | []()
-- | --
**Entrada** | Una cadena `s` formada de puntos y paréntesis
**Salida** | Una lista de 2-tuplas cuyo primer elemento sea un índice en la cadena. Para el segundo elemento: si el caracter en el índice que indica el primer elemento es un punto, el valor del segundo debe ser -1. En caso contrario, debe corresponder al índice donde el paréntesis hace match.
**Ejemplos** | `..()` devuelve la lista `[(0,-1), (1,-1), (2,3), (3,2)]`


In [None]:
def match_list(s):
    return []

In [None]:
#Prueba aquí tu función
print(match_list('..()'))
print(match_list(secundaria))

---
# Actividad 3
En la representación `Bracketed Graph`, los vértices representan los índices de las bases de la molécula, y estos se conectan por aristas si:
1. Las bases son adyacentes en la secuencia.
2. Las bases están pareadas en la estructura secundaria.

Desarrollar una función que reciba como entrada una secuencia de ARN `seq`, su estructura secundaria `ss`, y devuelva la lista de adyacencia de su representación `Bracketed Graph`.

Ejemplo: las entradas `seq = gcaagc` y `ss = ((..))` deben generar la lista `[(0,1), (1,2), (2,3), (3,4), (4,5), (0,5), (1, 4)]`

In [None]:
def bracketedgraph(seq,ss):
    return []

In [None]:
#Prueba aquí tu función
print(bracketedgraph('gcaagc','((..))'))
print(bracketedgraph(secuencia,secundaria))

---
# Actividad extra
Visualiza tu grafo utilizando la librería `networkx`. Puedes crear el grafo llamando la función `add_edges_from` pasando como parámetro la salida de la función `bracketedgraph`.

In [None]:
def plot_bracketedgraph(seq,ss):
    bgraph = bracketedgraph(seq,ss)
    G = nx.Graph()    
    G.add_edges_from(bgraph)
    print("#Nodos:",G.order())
    print("#Aristas:",G.size())
    print("Nodos:",G.nodes())
    print("Aristas:",G.edges())
    nx.draw(G,with_labels = True)
    plt.show()

In [None]:
print(plot_bracketedgraph(secuencia,secundaria))