In [None]:
def levenshtein_distance(s1, s2):
    """Calculate the Levenshtein distance between two strings of words"""
    if len(s1) < len(s2):
        return levenshtein_distance(s2, s1)
    if len(s2) == 0:
        return len(s1)
    
    previous_row = range(len(s2) + 1)
    for i, c1 in enumerate(s1):
        current_row = [i + 1]
        for j, c2 in enumerate(s2):
            insertions = previous_row[j + 1] + 1
            deletions = current_row[j] + 1
            substitutions = previous_row[j] + (c1 != c2)
            current_row.append(min(insertions, deletions, substitutions))
        previous_row = current_row
    
    return previous_row[-1]

# Original text words
original = "Lassen Sie mich diese Geschichte an der Stelle beginnen an der sie hätte enden sollen Um 16.44 Uhr an einem extrem heißen Sommertag in einer kleinen Einbahnstraße in der Heerstraßensiedlung im Südwesten Berlins Ich saß hinter dem Lenkrad eines Hundertzwanzigtausend Euro Geländewagens von der albernen Sorte die in echtem Gelände etwa so offroad tauglich ist wie ein Liegefahrrad im Dschungel der von einem völlig bescheuerten Kleinkriminellen aufgebrochen worden war Ich war dabei einen Brief zu schreiben Auf meinem Schoß lag eine in Papier eingewickelte langstielige blaue Hortensie und um meinen Hals schlackerte ein lederner Hosengürtel Die Frau die sich mir und damit dem parkenden Stadtpanzer näherte steckte in brombeerfarbenen Yogashorts die so eng anlagen dass sie sie wohl vor einem Tannenbaumtrichter gespannt hatte und hindurchgesprungen war um in sie reinzukommen An den eher zierlichen Füßen klebten Joggingschuhe in Neonquietschpink Ein tailliertes aus Schweiß absorbierendem Slimfit Stoff gedrechseltes Oberteil mit dem Aufdruck Save our Planet komplettierte ihr Sportoutfit".split()

# Transcript text words
transcript = "Lassen Sie mich diese Geschichte an der Stelle beginnen an der sie hätte enden sollen Um 16.44 Uhr an einem extrem heißen Sommertag in einer kleinen Einbahnstraße in der Herrstraßensiedlung im Südwesten Berlins Ich saß hinter dem Lenkrad eines 120.000 Euro Geländewagens von der albernen Sorte die im echten Gelände etwa so offroadtauglich ist wie ein Liegefahrrad im Dschungel der von einem völlig bescheuerten Kleinkriminellen aufgebrochen worden war Ich war dabei einen Brief zu schreiben Auf meinem Schoß lag eine in Papier eingewickelte langstielige blaue Hortensie und um meinen Hals schlackerte ein lederner Hosengürtel Die Frau die sich mir und damit dem parkenden Stadtpanzer näherte steckte in Brombeerfarbenen Yogashorts die so eng anlagen dass sie sie wohl vor einem Tannenbaumtrichter gespannt hatte und hindurchgesprungen war um in sie reinzukommen An den erzieherlichen Füßen klebten Joggingschuhe in Neon Queech Pink Ein tailliertes aus schweißabsorbierendem Slimfit Stoff gedrechseltes Oberteil mit dem Aufdruck Save Our Planet kompletierte ihr Sportoutfit".split()

# Calculate Levenshtein distance
distance = levenshtein_distance(original, transcript)

# Calculate WER
wer = distance / len(original)

# Find differences
differences = []
for i, (orig_word, trans_word) in enumerate(zip(original, transcript)):
    if orig_word != trans_word:
        differences.append(f"Original: '{orig_word}' -> Transcript: '{trans_word}'")

print(f"Number of words in original: {len(original)}")
print(f"Number of words in transcript: {len(transcript)}")
print(f"Levenshtein distance: {distance}")
print(f"Word Error Rate (WER): {wer:.4f}")
print("\nKey differences:")
for diff in differences:
    print(diff)