In [None]:
# força bruta

# identifiquem 'combinations' com la funció que necessitem
from itertools import combinations

def subsequencia_comu_v1(paraula1, paraula2):
  seq = []
  max_long = 0

  # generem totes les subsequencies de la primera paraula i les guardem en una llista
  for i in range(1,len(paraula1)+1):
    for j in combinations(paraula1,i):
      seq.append(j)

  # generem totes les de la segona, per cada una mirem si estava a la llista anterior
  # i guardem la llargada si hi era
  for i in range(1,len(paraula2)+1):
    for j in combinations(paraula2,i):
      if j in seq:
        max_long = i
  return max_long

print(subsequencia_comu_v1('STUTVST', 'TVUSTS'))
print(subsequencia_comu_v1('atatata', 'atatat'))
print(subsequencia_comu_v1('atatatatatatatatatatat', 'atatatatata'))
%timeit subsequencia_comu_v1('STUTVST', 'TVUSTS')
%timeit subsequencia_comu_v1('atatata', 'atatat')
%timeit subsequencia_comu_v1('atatatatatatatatatatat', 'atatatatata')

4
6
11
10000 loops, best of 3: 121 µs per loop
10000 loops, best of 3: 72.4 µs per loop
1 loop, best of 3: 4.96 s per loop


In [None]:
# versió amb dues funcions i usant un conjunt

from itertools import combinations

def subsequencia_comu_v2(paraula1, paraula2):
  seq = set()
  max_long = 0

  # generem totes les de la primera paraula i les guardem en una llista
  for i in range(1,len(paraula1)+1):
    for j in combinations(paraula1,i):
      seq.add(j)

  # generem totes les de la segona, mirem si estava a la llista anterior
  # i comprovem quina és la més llarga
  for i in range(1,len(paraula2)+1):
    for j in combinations(paraula2,i):
      if j in seq:
        max_long = i
  return max_long

%timeit subsequencia_comu_v2('STUTVST', 'TVUSTS')
%timeit subsequencia_comu_v2('atatata', 'atatata')
%timeit subsequencia_comu_v2('atatatatatatatatatatat', 'ata')

10000 loops, best of 3: 26.4 µs per loop
10000 loops, best of 3: 34 µs per loop
1 loop, best of 3: 911 ms per loop


In [None]:
# no hem de fer càlculs innecessaris!
# 1) només arribarem fins a la longitud de la parala més curta!
# 2) fem servir un set per no repetir elements de la primera llista

def extreure_sub_sequencies_long_j(paraula,i):
    seq = set()
    for j in combinations(paraula,i):
        seq.add(j)
    return seq

def subsequencia_comu_v2(paraula1, paraula2):
    maxlen = 0
    seq1 = set()
    seq2 = set()
    for i in range(1,min(len(paraula1)+1, len(paraula2)+1)):
        seq1 = extreure_sub_sequencies_long_j(paraula1,i)
        seq2 = extreure_sub_sequencies_long_j(paraula2,i)
        intersect = seq1.intersection(seq2)
        if len(intersect):
            for i in intersect:
                if len(i)>maxlen:
                    maxlen = len(i)
    return maxlen
        
%timeit subsequencia_comu_v2('STUTVST', 'TVUSTS')
%timeit subsequencia_comu_v2('atatata', 'atatata')
%timeit subsequencia_comu_v2('atatatatatatatatatatat', 'atatatatata')

10000 loops, best of 3: 39.2 µs per loop
10000 loops, best of 3: 45 µs per loop
1 loop, best of 3: 376 ms per loop


In [None]:
def subsequencia_comu_v3(cadena1, cadena2):
    """
    En aquest algorisme s'optimitzen els càlculs amb una taula on es guarden
    les solucions parcials
    """
    
    longcad1 = len(cadena1)
    longcad2 = len(cadena2)
    
    # Cal definir fila dins el bucle perquè altrament totes les files són la mateixa
    taula_solucions=[[0] * (longcad1 + 1) for i in range(longcad2 + 1)]
        
    # La casella[i][j] guarda el valor de longitud de la
    # subseqüència més llarga entre cadena1[0:j] i cadena2[0:i]
    
    for j in range(1, longcad1+1):
        for i in range(1, longcad2+1):
            temp = max(taula_solucions[i-1][j],  taula_solucions[i][j-1])
            if cadena1[j-1] == cadena2[i-1]:
                taula_solucions[i][j] = taula_solucions[i-1][j-1]+1
            else:
                taula_solucions[i][j] = temp

    return taula_solucions[longcad2][longcad1]
print(subsequencia_comu_v3('STUTVST', 'TVUSTS'))
print(subsequencia_comu_v3('atatata', 'atatat'))
print(subsequencia_comu_v3('atatatatatatatatatatat', 'atatatatata'))
%timeit subsequencia_comu_v3('STUTVST', 'TVUSTS')
%timeit subsequencia_comu_v3('atatata', 'atatat')
%timeit subsequencia_comu_v3('atatatatatatatatatatat', 'atatatatata')

4
6
11
10000 loops, best of 3: 22.4 µs per loop
100000 loops, best of 3: 20.5 µs per loop
10000 loops, best of 3: 106 µs per loop


In [None]:
[1,1,1,1,2,3,3]


[1, 1, 1, 1, 2, 3, 3]

In [None]:
[1,2,3]

[1, 2, 3]

In [None]:
f = set()
f.add(1)
f.add(1)

In [None]:
f

{1}

In [None]:
1 in f

True

In [None]:
l = [1,1,1,1,2,3,3]
9 in l

False

In [None]:
j = set(l)
type(j)

set