<div style="background-color:#262626; text-align: center;">
<img src="https://fiapfunctions.blob.core.windows.net/datasets/capa.png">
</div>

#  Word Error Rate (WER) 

O **WER** foi desenvolvido e é usado para verificar a precisão do mecanismo de reconhecimento de voz. Ele funciona calculando a distância entre os resultados do motor (chamados de hipótese), e o texto real (chamado de referência).

[Levenshtein distance](https://en.wikipedia.org/wiki/Levenshtein_distance)

A função de distância é baseada na distância de Levenshtein (para encontrar a distância de edição entre palavras). O WER, assim como a distância de Levenshtein, define a distância pela quantidade de operações mínimas que devem ser feitas para ir da referência à hipótese. Ao contrário da distância de Levenshtein, no entanto, as operações são em palavras e não em caracteres individuais. 

In [None]:
def calculate_wer(reference, hypothesis):
    """
        Calculation of WER with Levenshtein distance.
        Works only for iterables up to 254 elements (uint8).
        O(nm) time and space complexity.

        >>> calculate_wer("who is there".split(), "is there".split())
        1
        >>> calculate_wer("who is there".split(), "".split())
        3
        >>> calculate_wer("".split(), "who is there".split())
        3
    """
    # initialisation
    import numpy
    d = numpy.zeros((len(reference) + 1) * (len(hypothesis) + 1),
                    dtype=numpy.uint8)
    d = d.reshape((len(reference) + 1, len(hypothesis) + 1))
    for i in range(len(reference) + 1):
        for j in range(len(hypothesis) + 1):
            if i == 0:
                d[0][j] = j
            elif j == 0:
                d[i][0] = i

    # computation
    for i in range(1, len(reference) + 1):
        for j in range(1, len(hypothesis) + 1):
            if reference[i - 1] == hypothesis[j - 1]:
                d[i][j] = d[i - 1][j - 1]
            else:
                substitution = d[i - 1][j - 1] + 1
                insertion = d[i][j - 1] + 1
                deletion = d[i - 1][j] + 1
                d[i][j] = min(substitution, insertion, deletion)

    return d[len(reference)][len(hypothesis)] / float(len(reference)) 

In [None]:
ground_truth = "i like monthy python what do you mean african or european swallow"

hypothesis = "i like monthy python what do you african mean or european sawllow"

In [None]:
calculate_wer(ground_truth, hypothesis)