In [None]:
def levenshtein_distance(source, target):
    """
    Tính khoảng cách Levenshtein giữa hai chuỗi.
    source: chuỗi nguồn (str)
    target: chuỗi đích (str)
    return: khoảng cách Levenshtein (int)
    """
    # Lấy độ dài của source và target
    n = len(source)
    m = len(target)

    # Tạo ma trận khoảng cách (n+1) x (m+1)
    D = [[0 for _ in range(m + 1)] for _ in range(n + 1)]

    # Khởi tạo hàng và cột đầu tiên
    for i in range(1, n + 1):
        D[i][0] = i  # Chi phí xóa ký tự từ source
    for j in range(1, m + 1):
        D[0][j] = j  # Chi phí chèn ký tự vào source để thành target

    # Tính các ô còn lại của ma trận
    for i in range(1, n + 1):
        for j in range(1, m + 1):
            # Nếu ký tự hiện tại giống nhau, chi phí thay thế là 0, ngược lại là 2
            substitution_cost = 0 if source[i - 1] == target[j - 1] else 2

            # Tính khoảng cách tối thiểu cho ô D[i][j]
            D[i][j] = min(D[i - 1][j] + 1,  # Xóa
                          D[i][j - 1] + 1,  # Chèn
                          D[i - 1][j - 1] + substitution_cost)  # Thay thế

    # Trả về khoảng cách Levenshtein
    return D[n][m]

# Chạy thử nghiệm hàm
source = "intention"
target = "execution"

distance = levenshtein_distance(source, target)
print(f"Khoảng cách Levenshtein giữa '{source}' và '{target}' là: {distance}")

Khoảng cách Levenshtein giữa 'intention' và 'execution' là: 8


In [None]:
import numpy as np

def del_cost(char):
    return 1  # Cost for deletion

def ins_cost(char):
    return 1  # Cost for insertion

def sub_cost(source_char, target_char):
    return 2 if source_char != target_char else 0  # Cost for substitution

def MinEditDistance(source, target):
    n = len(source)
    m = len(target)

    # Create distance matrix D[n+1][m+1] and backtrace matrix
    D = np.zeros((n + 1, m + 1))
    backtrace = [["" for _ in range(m + 1)] for _ in range(n + 1)]


    # Initialization: the zeroth row and column
    D[0, 0] = 0
    backtrace[0][0] = ''  # Starting point # Changed line: Access using [0][0] instead of [0, 0]

    for i in range(1, n + 1):
        D[i, 0] = D[i - 1, 0] + del_cost(source[i - 1])  # Deletion cost
        backtrace[i][0] = backtrace[i][0] + '↑'  # Record deletion # Changed line: Access using [i][0] instead of [i, 0]

    for j in range(1, m + 1):
        D[0, j] = D[0, j - 1] + ins_cost(target[j - 1])  # Insertion cost
        backtrace[0][j] = backtrace[0][j]+ '←'  # Record insertion # Changed line: Access using [0][j] instead of [0, j]

    # Recurrence relation
    for i in range(1, n + 1):
        for j in range(1, m + 1):
            deletion = D[i - 1, j] + del_cost(source[i - 1])
            substitution = D[i - 1, j - 1] + sub_cost(source[i - 1], target[j - 1])
            insertion = D[i, j - 1] + ins_cost(target[j - 1])

            D[i, j] = min(deletion, substitution, insertion)

            # Update backtrace matrix with directional indicators
            if D[i, j] == deletion:
                backtrace[i][j] = backtrace[i][j] + '↑'  # Move ↑ (deletion) # Changed line: Access using [i][j] instead of [i, j]
            elif D[i, j] == substitution:
                backtrace[i][j] = backtrace[i][j] + '↖'   # Move diagonally (substitution) # Changed line: Access using [i][j] instead of [i, j]
            else:
                backtrace[i][j] = backtrace[i][j] + '←'   # Move ← (insertion) # Changed line: Access using [i][j] instead of [i, j]

    # Termination
    return D[n, m], D, backtrace

# Example usage
source = "kitten"
target = "sitting"
min_distance,D, backtrace_matrix = MinEditDistance(source, target)

print("Minimum Edit Distance:", min_distance)

Minimum Edit Distance: 5.0


In [None]:
source, target = 'intention', 'execution'
MinEditDistance(source,target)

(8.0,
 array([[ 0.,  1.,  2.,  3.,  4.,  5.,  6.,  7.,  8.,  9.],
        [ 1.,  2.,  3.,  4.,  5.,  6.,  7.,  6.,  7.,  8.],
        [ 2.,  3.,  4.,  5.,  6.,  7.,  8.,  7.,  8.,  7.],
        [ 3.,  4.,  5.,  6.,  7.,  8.,  7.,  8.,  9.,  8.],
        [ 4.,  3.,  4.,  5.,  6.,  7.,  8.,  9., 10.,  9.],
        [ 5.,  4.,  5.,  6.,  7.,  8.,  9., 10., 11., 10.],
        [ 6.,  5.,  6.,  7.,  8.,  9.,  8.,  9., 10., 11.],
        [ 7.,  6.,  7.,  8.,  9., 10.,  9.,  8.,  9., 10.],
        [ 8.,  7.,  8.,  9., 10., 11., 10.,  9.,  8.,  9.],
        [ 9.,  8.,  9., 10., 11., 12., 11., 10.,  9.,  8.]]),
 [['', '←', '←', '←', '←', '←', '←', '←', '←', '←'],
  ['↑', '↑', '↑', '↑', '↑', '↑', '↑', '↖', '←', '←'],
  ['↑', '↑', '↑', '↑', '↑', '↑', '↑', '↑', '↑', '↖'],
  ['↑', '↑', '↑', '↑', '↑', '↑', '↖', '↑', '↑', '↑'],
  ['↑', '↖', '←', '↖', '←', '←', '↑', '↑', '↑', '↑'],
  ['↑', '↑', '↑', '↑', '↑', '↑', '↑', '↑', '↑', '↑'],
  ['↑', '↑', '↑', '↑', '↑', '↑', '↖', '←', '←', '↑'],
  ['↑', '↑', '↑