# Algoritmia
## Práctica 8
En esta práctica se trabaja con el problema de la subsecuencia común más larga.

En el cuerpo de cada función o método a implementar hay una instrucción "pass", se debe sustituir por la implementación adecuada. La implementación debe ser propia, sin incluir código ajeno o realizado conjuntamente. No se debe modificar el resto del código proporcionado.

Para cada clase o función que se pide se proporcionan algunos tests. Las implementaciones deberían superar estos tests.

## Preámbulo
No se puede importar de otros módulos, salvo que se consulte previamente con el profesor. 

In [1]:
# Importaciones
import unittest

## Subsecuencia común más larga
### Función `subsecuencia_comun_mas_larga`

In [2]:
def subsecuencia_comun_mas_larga(x, y):
    """
    Dadas dos cadenas x e y devuelve una que es subsecuencia de ambas y que 
    tiene la longitud máxima de todas las subsecuencias comunes.
    """
    #Inicialización de varibles.
    res=[]
    sub = []
    i=len(y)-1
    j=len(x)-1
    #Se rellena la matriz
    rellenarMatriz(x,y,sub)
    #Se obtiene la subsecuencia comun mas larga
    while sub[i][j]!=0:
        if y[i] == x[j]:
            res.insert(0,x[j])
            i-=1
            j-=1
        else:
            if sub[i-1][j] <= sub[i][j-1]:
                j-=1
            else:
                i-=1
    return res


#Función Auxiliar
def rellenarMatriz(x,y,sub):
    #Inicializar Matriz a ceros
    for i in range(len (y)+1):
        sub.append([])
        for j in range(len(x)+1):
            sub[i].append(0)
    #Rellenar Matriz con valores
    for i in range(len(y)):
        for j in range(len(x)):
            if y[i] == x[j]:
                aux = sub[i-1][j-1] + 1
            else:
                aux=max(sub[i-1][j], sub[i][j-1])
            sub[i][j]=aux
       

## Función `es_subsecuencia`
Función que se usará en los tests

In [3]:
def es_subsecuencia(subsecuencia, secuencia):
    """Indica si el primer argumento es subsecuencia del segundo"""
    
    it = iter(secuencia)   
    return all(c in it for c in subsecuencia)

### Tests para `es_subsecuencia`

In [4]:
class TestEsSubsecuencia(unittest.TestCase):

    def test_positivos(self):
        
        for subsecuencia, secuencia in (
                ("GTTC", "GTTCCTAATA"),
                ("CCTA", "GTTCCTAATA"),
                ("AATA", "GTTCCTAATA"),
                ("GTCAT", "GTTCCTAATA"),
                ("TCTAA", "GTTCCTAATA"),
                ("GTTCCTAATA", "GTTCCTAATA"),
        ):
            self.assertTrue(es_subsecuencia(subsecuencia, secuencia))
            
    def test_negativos(self):
        
        for subsecuencia, secuencia in (
                ("GTTCCTTATA", "GTTCCTAATA"),
                ("GGTTCCTAATA", "GTTCCTAATA"),            
                ("GTTCCTAATAA", "GTTCCTAATA"),
                ("GG", "GTTCCTAATA"), 
                ("AC", "GTTCCTAATA"), 
                ("TGTCCTAATA", "GTTCCTAATA"),
                ("ATAA", "GTTCCTAATA"), 

        ):
            self.assertFalse(es_subsecuencia(subsecuencia, secuencia))                 

### Tests para `subsecuencia_comun_mas_larga`

In [5]:
class TestSubsecuenciaComunMasLarga(unittest.TestCase):

    def test_subsecuencia_comun_mas_larga(self):
        
        for s1, s2, longitud in (
            ("GTTCCTAATA", "CGATAATTGAGA", 6),
            ("ACDAADDADDDDCCBCBCAD", "ADBDBBCDBDAABBDDDCBB", 11),
            ("BBDABCCADCCADADDCACAACBA", "DBCBBDCBADABBBCCCDCACAADDACADD", 17),
            ("01111000000111100011", "10010100000100101111", 14),
            ('TTTATTTCGTCTAACTTATGACGTCCCTTCACGATCCAA',
             'TGGCCGGTTATTCAAGAGCGATATGTGCTATAAAGTGCC', 23)
        ):    
            for x, y in ((s1, s2), (s2, s1)):
                subsecuencia = subsecuencia_comun_mas_larga(x, y)
                self.assertEqual(len(subsecuencia), longitud)
                for secuencia in x, y:
                    self.assertTrue(es_subsecuencia(subsecuencia, secuencia))                 

## Todas las subsecuencias comunes más largas 
Variante en la que en vez de devolver una única subsecuencia se devuelven todas
### Función `subsecuencias_comunes_mas_largas`

In [6]:
def subsecuencias_comunes_mas_largas(x, y):
    """
    Dadas dos cadenas x e y devuelve un conjunto con todas las subsecuencias de 
    ambas que tienen longitud máxima.
    """
    #Inicialización de variables
    sub = []
    #Se rellena la matriz
    rellenarMatriz(x,y,sub)
    #Se obtienen las subsecuencias comunes mas largas de manera recursiva
    res = subsecuencias_comunes_mas_largas_recursivo(x, y, len(y)-1, len(x)-1, sub)
    return set(res)

#Función Auxiliar
def subsecuencias_comunes_mas_largas_recursivo(x, y, numFilas, numColum, sub):
    
    if numFilas == -1 or numColum == -1:
        return [""]
    #Cuando no coinciden los caracteres
    if x[numColum] != y[numFilas]:
        #Cuando el numero de la izquierda es mayor que el de arriba
        if sub[numFilas - 1][numColum] < sub[numFilas][numColum - 1]:
            return subsecuencias_comunes_mas_largas_recursivo(x, y, numFilas, numColum - 1, sub)
        #Cuando el numero de arriba es mayor que el de la izquierda
        if sub[numFilas - 1][numColum] > sub[numFilas][numColum - 1]:
            return subsecuencias_comunes_mas_largas_recursivo(x, y, numFilas - 1, numColum, sub)
        #Cuando son iguales
        if sub[numFilas - 1][numColum] == sub[numFilas][numColum - 1]:
            #Se obtienen las subsecuencias de arriba y la izquierda.
            secuArriba = subsecuencias_comunes_mas_largas_recursivo(x, y, numFilas - 1, numColum, sub)
            secuIzq = subsecuencias_comunes_mas_largas_recursivo(x, y, numFilas, numColum - 1, sub)
            subsecuencias = secuArriba + secuIzq
            return subsecuencias
     
    #Cuando coinciden los caracteres se concatenan las letras de las secuencias a las subsecuencias.
    subsec = subsecuencias_comunes_mas_largas_recursivo(x, y, numFilas - 1, numColum - 1, sub)
    for i in range(len(subsec)):
        subsec[i] += x[numColum]
    return subsec
         
        
        

    

    

### Tests para `subsecuencias_comunes_mas_largas`

In [7]:
class TestSubsecuenciasComunesMasLarga(unittest.TestCase):

    def test_subsecuencias_comunes_mas_largas(self):
        
        for s1, s2, longitud, numero in ( 
                ("GTTCCTAATA", "CGATAATTGAGA", 6, 3),
                ("ACDAADDADDDDCCBCBCAD", "ADBDBBCDBDAABBDDDCBB", 11, 4),
                ("BBDABCCADCCADADDCACAACBA", "DBCBBDCBADABBBCCCDCACAADDACADD", 
                 17, 1),
                ("01111000000111100011", "10010100000100101111", 14, 10),
                ('TTTATTTCGTCTAACTTATGACGTCCCTTCACGATCCAA',
                 'TGGCCGGTTATTCAAGAGCGATATGTGCTATAAAGTGCC', 23, 20)
            
        ):    
            for x, y in ((s1, s2), (s2, s1)):
                subsecuencias = subsecuencias_comunes_mas_largas(x, y)
                self.assertTrue(isinstance(subsecuencias, set))
                self.assertEqual(len(subsecuencias), numero)
                for subsecuencia in subsecuencias:
                    self.assertEqual(len(subsecuencia), longitud)
                    for secuencia in x, y:
                        self.assertTrue(es_subsecuencia(subsecuencia, secuencia))               

## Ejecución de tests

In [8]:
if __name__ == '__main__':
    unittest.main(argv=['first-arg-is-ignored'], exit=False)

....
----------------------------------------------------------------------
Ran 4 tests in 0.156s

OK
