In [1]:
import numpy as np

In [13]:
def levenshtein_distance2(x, y):
    current_row = np.zeros((1+len(x)))
    previous_row = np.zeros((1+len(x)))
    
    current_row[0] = 0
    for i in range(1, len(x)+1):
        current_row[i] = current_row[i-1] + 1
    for j in range(1, len(y)+1):
        previous_row, current_row = current_row, previous_row
        current_row[0] = previous_row[0] + 1
        for i in range(1, len(x)+1):
            current_row[i] = min(current_row[i-1] + 1,
            previous_row[i] + 1,
            previous_row[i-1] + (x[i-1] != y[j-1]))
    return current_row[len(x)]

levenshtein_distance2('zzzz','a')


4.0

In [3]:
class TrieNode(object):
    """
    Nodo interno de un Trie

    Attributes
    ----------
    indice : int
        Identificador del nodo (en orden)

    char : char
        Letra que guarda el nodo

    children : TrieNode[] <- lista
        Numero de nodos del trie

    father : TrieNode
        Padre del nodo

    word_finished : bool
        Indica si el TrieNode completa una palabra

    word : str
        Palabra guardada por el TrieNode

    counter: int
        Numero de palabras que pasan por el TrieNode

    """
    def __init__(self, char):
        self.indice = 0
        self.char = char
        self.children = []
        self.father = None
        self.word_finished = False
        self.word= None
        self.counter = 1
        self.depth = 0

    
    def toString(self):
        word2 = ""
        res = ""
        if(self.word_finished):
            word2 = str(self.word)
        if self.indice != 0 :
            res =  str(self.indice)+"\t" + str(self.father.indice)+"\t" +self.char + "\t" + str(self.counter) + "\t"+str(self.word_finished)+"\t" + word2 + "\n"
        else: 
            res =  str(self.indice)+"\tN\t" +self.char + "\t" + str(self.counter) + "\t"+str(self.word_finished)+"\t" + word2 + "\n"

        for node in self.children:
            res = res + node.toString()
        return res  
        


class Trie(object):
    """
    Estructura de datos Trie

    Attributes
    ----------
    size : int
        Numero de nodos del trie
    node : TrieNode
        Nodo raiz del Trie
    dictionary : dictionary[int:TrieNode]
        diccionario que vincula el indice con el nodo para accesos mas rápidos
    """
    def __init__(self):
        self.size = 0
        self.node = TrieNode('')
        self.dictionary = {0 : self.node}
        
    def add(self, word):
        """
        Añade una palabra al Trie

        Parameters
        ----------
        word : str
            palabra a añadir
    
        """
        node = self.node
        for char in word:
            found_in_child = False
            for child in node.children:
                if child.char == char:
                    node.counter += 1
                    node = child
                    found_in_child = True
                    break
            
            if not found_in_child:
                new_node = TrieNode(char)
                node.children.append(new_node)
                node.counter += 1
                new_node.father = node
                new_node.depth = node.depth+1
                node = new_node
                self.size += 1
                node.indice = self.size
#                 Inserta elemento en tabla hash
                self.dictionary[node.indice] = node
                
        node.word_finished = True
        node.word = word

    def toString(self):
        """
        Devuelve un string que describe el Trie

        Returns
        -------
        str
    
        """
        node = self.node
        return node.toString()

    def pull(self,ind):
        """
        Dado un indice devuelve el TrieNode asociado

        Parameters
        ----------
        ind : int
            indice del nodo a devolver

        Returns
        -------
        TrieNode
    
        """
        return self.dictionary[ind+1]



In [28]:
def expandir(pos,id_trie,dist):

    # Condiciones casos base:
    fin_palabra = pos >= len(palabra)
    fin_trie = trie.pull(id_trie).children == [] 
    
    # Condicion añadir palabra
    anyadir_palabra = trie.pull(id_trie).word_finished == True and dist < max_dist
    
    # tal vez se añadan palabras repetidas
    if fin_trie or fin_palabra:
        if anyadir_palabra:
            return {trie.pull(id_trie).word: dist+1}
        else:
            return {}
    # Se han de hacer condiciones separadas porque puede que solo se avance
    # en la palabra y por lo tanto se añada dos veces la palabra del trie


    if anyadir_palabra:
        palabras = {trie.pull(id_trie).word: dist+1}
    else:
        palabras = {}
    
    id_trie_sig = trie.pull(id_trie).children
    
    palabras.update( expandir(pos+1,id_trie,dist+1) )
    palabras.update( expandir(pos,id_trie+1,dist+1) ) # Se esta asumendo que el trie solo tiene una palabra
    if(palabra[pos] == trie.pull(id_trie).char): # La primera letra del trie esta en 1
        palabras.update( expandir(pos+1,id_trie+1,dist) )
    else:
        palabras.update( expandir(pos+1,id_trie+1,dist+1) ) 
    
    
    return palabras

trie = Trie()
trie.add("bocatas")
# trie.add("bazokas")
palabra = 'bazoka'
max_dist = 4;
print(trie.toString())

expandir(0,0,0)

0	N		2	False	
1	0	b	2	False	
2	1	o	2	False	
3	2	c	2	False	
4	3	a	2	False	
5	4	t	2	False	
6	5	a	2	False	
7	6	s	1	True	bocatas



{}

In [24]:
a = {'a':1}
a.update({'b':2})

In [25]:
a

{'a': 1, 'b': 2}

In [23]:
print(b)

None
