# EDIT DISTANCE
**Problema:** date due stringhe $a$ e $b$, individuare una strategia per calcolare il numero minimo di operazioni necessario a trasformare $a$ in $b$, avendo come possibili operazioni l'inserimento di un carattere, la cancellazione di un carattere, e la sostituzione di un carattere.

## SOLUZIONE 1

- Se $a$ è nulla allora occorre aggiungere un numero di caratteri pari alla lunghezza di $b$
- Se $b$ è nulla allora occorre aggiungere un numero di caratteri pari alla lunghezza di $a$
- Se l'ultimo carattere di $a$ e $b$, allora il costo è quello che calcoliamo per le sottostringhe $a_{-1}$ e $b_{-1}$
- Se infine gli ultimi caratteri di $a$ e $b$ sono diversi, occorre fare un'operazione per l'ultimo carattere più il costo inferiore per le tre coppie di sottostringhe da cui è possibile arrivare all'ultimo carattere

In [6]:
def edist(a, b, cost=0):
    if len(a) == 0:
        return len(b)
    elif len(b) == 0:
        return len(a)
    elif a[-1] == b[-1]:
        return edist(a[:-1], b[:-1], cost + 1)
    else:
        return 1 + min([
            edist(a[:-1], b, cost + 1),
            edist(a, b[:-1], cost + 1),
            edist(a[:-1], b[:-1], cost + 1),
        ])

In [7]:
edist('casa', 'casto')

2

## SOLUZIONE 2

In [None]:
import numpy as np

In [None]:
def ddist(a, b):
    m = np.zeros((len(a)+1, len(b)+1))
    for v in range(len(b) + 1):
        m[0][v] = v
    for v in range(len(a) + 1):
        m[v][0] = v
    return m

In [None]:
x = ddist('casa', 'casto')

In [1]:
import numpy as np

In [90]:
def D(a, b):
    row = range(0, len(b)+1)
    col = range(0, len(a)+1)
    m = np.zeros((len(a)+1, len(b)+1))
    m[0,:] = row
    m[:,0] = col
    for i, x in enumerate(a):
        iM = i + 1
        for j, y in enumerate(b):
            jM = j + 1 
            if x == y:
                cost = 0
            else:
                cost = 1
            cost += min([
                m[iM-1,jM-1], 
                m[iM,jM-1]+(1-cost),
                m[iM-1,jM]+(1-cost),
            ])
            m[iM,jM] = cost
    return m

In [91]:
r = D('casa', 'casto')

array([[0., 1., 2., 3., 4., 5.],
       [1., 0., 1., 2., 3., 4.],
       [2., 1., 0., 1., 2., 3.],
       [3., 2., 1., 0., 1., 2.],
       [4., 3., 2., 1., 1., 2.]])

In [8]:
import numpy as np

In [34]:
a, b = 'roma', 'romano'

In [35]:
m = np.zeros((len(a)+1, len(b)+1))

In [36]:
m.shape

(5, 7)

In [37]:
first_row = list(range(0, len(b)+1))
first_col = list(range(0, len(a)+1))

In [38]:
m[0,:] = first_row
m[:,0] = first_col

In [41]:
for i, x in enumerate(a):
    i_row = i + 1
    for j, y in enumerate(b):
        i_col = j + 1
        z = min([m[i_row-1,i_col], m[i_row,i_col-1], 
             m[i_row-1,i_col-1]])
        if x == y:
            cost = 0 + z
        else:
            cost = 1 + z
        m[i_row,i_col] = cost

In [45]:
k = m[:3,:3]

In [49]:
np.cov(k)

array([[ 1.        ,  0.        , -1.        ],
       [ 0.        ,  0.33333333,  0.        ],
       [-1.        ,  0.        ,  1.        ]])

In [50]:
np.linalg.eig(k)

(array([ 2.73205081, -2.        , -0.73205081]),
 array([[-6.27963030e-01, -7.07106781e-01,  3.25057584e-01],
        [-4.59700843e-01,  1.64352863e-16, -8.88073834e-01],
        [-6.27963030e-01,  7.07106781e-01,  3.25057584e-01]]))