# Programación Dinámica

La programación dinámica es una técnica para resolver problemas de optimización que exhiben las siguientes propiedades:

    1 Puede ser descompuesto en sub-problemas traslapados.
    2 Contienen sub-estructuras óptimas
    3 El número de sub-problemas es relativamente bajo
    

# Secuenciamiento de ADN


El alineamiento de secuencias es una manera de analizar estructuras evolutivas entre genes o proteínas. Dadas dos secuencias de ADN $S_1=[A,C,G,T,C,A,T,C,A ]$ y $S_2=[T,A,G,T,G,T,C,A]$ nos interesa encontrar la sub-cadena común más larga. Podemos formalizar el problema de secuenciamiento como encontrar el alineamiento de sub-cadenas con el mínimo costo. 

La noción de similitud entre sub-cadenas se puede definir como encontrar una secuencia creciente de indices $I=[i_1,i_2,\ldots\,i_k]$ tal que $x_{i_j}=y_j$ para todo $x_{i_j} \in S_1$ y $y_j \in S_2$.

La solución de fuerza bruta consiste en enumerar todas las sub-cadenas posibles. Sin enbargo, este número crece exponencialmente con el tamaño de la cadena. 

In [9]:
from itertools import combinations as comb

S_1='ACCG'
S_2='CCAGCA'

def LCS_BF(X,Y):
    n=min(len(X),len(Y))
    sol={}
    for k in range(1,n):
        sub_str_1=set(comb(X, k))
        sub_str_2=set(comb(Y, k))
        sol_k={k:sub_str_1 & sub_str_2}
        sol.update(sol_k)
    return sol

print(len(LCS_BF(S_1,S_2)))

3


In [10]:
def LCS_DP(X , Y):
    m = len(X)
    n = len(Y)
    L = [[None]*(n+1) for i in xrange(m+1)]
    for i in range(m+1):
        for j in range(n+1):
            if i == 0 or j == 0 :
                L[i][j] = 0
            elif X[i-1] == Y[j-1]:
                L[i][j] = L[i-1][j-1]+1
            else:
                L[i][j] = max(L[i-1][j] , L[i][j-1])
    return L[m][n]

In [11]:
print(LCS_DP(S_1,S_2))

3
