# Лабораторная работа 1. Подсчет ошибки распознавания

WER (Word Error Rate) является метрикой для оценки качества систем распознавания речи. Она показывает процент ошибочных слов в гипотезе распознавания по сравнению с эталонным текстом. WER учитывает три типа ошибок: вставки, удаления и замены. 
$$ WER = {I + D + S \over D + S + C} $$
где I, D, S - количество втавок, удалений и замен, соответственно. C - количество правильно распознанных слов

Лабораторная работа состоит из трех частей. Первая часть (функция подсчета WER) обязательная, остальные дополнительные. Всего за работу можно получить максимум 20 баллов. 4 за сдачу в срок и 16 за задания: 
* функция подсчета WER (тест 1.a, 1.b) - 8 баллов
* функция подсчета WER и ошибки пунктуации (тест 2.a) - 4 балла
* функция подсчета SA-WER (тест 3.а) - 4 балла

# 1. Word Error Rate (8 баллов)

## 1.a. подсчет WER 


Функция должна принимать две строки в качестве входных данных: эталонный текст и распознанный текст. Эталонный текст - это то, что произносится в аудиозаписи, а гипотеза распознавания - это текст, полученный от системы распознавания речи. Для корректного вычисления ошибки распознавания необходимо удалить все символы пунктуации и привести все слова к нижнему регистру.



In [4]:
import string
import pymorphy2

In [16]:
def calculate_wer(reference_text: str, recognized_text: str) -> float:
    # Приведение текста к нижнему регистру, удаление символов пунктуации и разбивка на слова
    translator = str.maketrans("", "", string.punctuation)
    reference_words = reference_text.translate(translator).lower().split()
    recognized_words = recognized_text.translate(translator).lower().split()
    
    #recognized_words = [i[:-2] for i in recognized_words]
    #reference_words = [i[:-2] for i in reference_words]
    
    #morph = pymorphy2.MorphAnalyzer()
    #reference_words = [morph.parse(word)[0].normal_form for word in reference_words]
    #recognized_words = [morph.parse(word)[0].normal_form for word in recognized_words]
    
    print(reference_words)
    print(recognized_words)
    
    # расстояние Левенштейна 
    
    # Инициализация матрицы для подсчета расстояния между словами
    distance_matrix = [[0] * (len(recognized_words) + 1) for _ in range(len(reference_words) + 1)]
    # Наполнение первой строки матрицы
    for i in range(len(reference_words) + 1):
        distance_matrix[i][0] = i

    # Наполнение первого столбца матрицы
    for j in range(len(recognized_words) + 1):
        distance_matrix[0][j] = j

    #Заполнение матрицы расстояний методом динамического программирования
    for i in range(1, len(reference_words) + 1):
        for j in range(1, len(recognized_words) + 1):
            diff = 1 if reference_words[i-1] != recognized_words[j-1] else 0
            distance_matrix[i][j] = min(
                    distance_matrix[i - 1][j] + 1,      # Deletion
                    distance_matrix[i][j - 1] + 1,      # Insertion
                    distance_matrix[i - 1][j - 1] + diff   # Substitution
                )


    # Расчет WER  (в процентах)
    print(distance_matrix)
    wer = (distance_matrix[-1][-1] / len(reference_words)) * 100
    return wer

wer = calculate_wer('Я ел солонину', 'Я ел слона')
print(f"Word Error Rate: {wer:.2f}%")

['я', 'ел', 'солонину']
['я', 'ел', 'слона']
[[0, 1, 2, 3], [1, 0, 1, 2], [2, 1, 0, 1], [3, 2, 1, 1]]
Word Error Rate: 33.33%


In [6]:
wer = calculate_wer('Здесь', 'Сдесь')
print(f"Word Error Rate: {wer:.2f}%")

['здесь']
['сдесь']
Word Error Rate: 100.00%


In [7]:
wer = calculate_wer('Здесь красивый котик', 'Сдесь красивая собачка')
print(f"Word Error Rate: {wer:.2f}%")

['здесь', 'красивый', 'котик']
['сдесь', 'красивая', 'собачка']
Word Error Rate: 100.00%


In [8]:
wer = calculate_wer('я сегодня учусь в универе', 'я с завтра учусь универе')
print(f"Word Error Rate: {wer:.2f}%")

['я', 'сегодня', 'учусь', 'в', 'универе']
['я', 'с', 'завтра', 'учусь', 'универе']
Word Error Rate: 60.00%


In [9]:
def assert_wer(ref, hyp, ideal_wer):
    wer = calculate_wer(ref, hyp)
    assert round(wer, 2) == round(ideal_wer, 2), f"for '{hyp=}' and '{ref=}' {ideal_wer=}, calculate_wer {wer=}"
    
def test_wer():
    assert_wer('привет студент', 'привет студент', 0)
    assert_wer('привет! Студент.', 'Привет, студент?', 0)
    assert_wer('привет студент', 'студент', 50)
    assert_wer('привет студент', '', 100)
    assert_wer('привет студент', 'студент привет', 100)
    assert_wer('привет', 'привет студент', 100)
    assert_wer('привет студент привет как дела', 'студент привет', 60)
    assert_wer('привет студент привет как дела', 'привет как дела', 40)
    assert_wer('привет студент привет как дела ', 'привет студент дела ', 40)
    assert_wer('привет студент привет как дела '*100, 'привет студент дела '*100, 40)

    print(f"Test 1.a passed")
    
test_wer() 
    

['привет', 'студент']
['привет', 'студент']
['привет', 'студент']
['привет', 'студент']
['привет', 'студент']
['студент']
['привет', 'студент']
[]
['привет', 'студент']
['студент', 'привет']
['привет']
['привет', 'студент']
['привет', 'студент', 'привет', 'как', 'дела']
['студент', 'привет']
['привет', 'студент', 'привет', 'как', 'дела']
['привет', 'как', 'дела']
['привет', 'студент', 'привет', 'как', 'дела']
['привет', 'студент', 'дела']
['привет', 'студент', 'привет', 'как', 'дела', 'привет', 'студент', 'привет', 'как', 'дела', 'привет', 'студент', 'привет', 'как', 'дела', 'привет', 'студент', 'привет', 'как', 'дела', 'привет', 'студент', 'привет', 'как', 'дела', 'привет', 'студент', 'привет', 'как', 'дела', 'привет', 'студент', 'привет', 'как', 'дела', 'привет', 'студент', 'привет', 'как', 'дела', 'привет', 'студент', 'привет', 'как', 'дела', 'привет', 'студент', 'привет', 'как', 'дела', 'привет', 'студент', 'привет', 'как', 'дела', 'привет', 'студент', 'привет', 'как', 'дела', 'при

## 1.b. Построение выравнивания
Реализованная в части 1.a. функция выдает только суммарное значение ошибки распознавания, не давая понимания, в чем состоят основные проблемы распознавания. 

Значение WER получается из трех видов ошибок: 
* вставка (insertion)
* удаление (deletion)
* замена (substitution)

Каждый тип ошибок имеет свое значение и указывает на определенные недостатки системы. Например, большое количество вставок означает, что ASR слышит речь там где ее нет. А большое количество удалений показывает, что целевая речь пропускается и не транскрибируется. 

Кроме числовых значений каждой ошибки, для анализа результатов работы системы может пригодиться выравнивание эталонной текстовки и гипотезы распознавания относительно друг друга. 

пример выравнивания: 

```
>>> tabulate(ali)

Я сегодня  ***   учуcь  в  универе
Я    с    завтра учусь *** универе  
C    S      I      C    D    C    
```

Реализуйте функцию, которая кроме числового значения WER возвращает выравнивание, а также значения каждого типа ошибок распознавания (вставки, удаления, замены).

In [10]:
!pip install tabulate
from tabulate import tabulate
# используйте tabulate для отладки

Collecting tabulate
  Downloading tabulate-0.9.0-py3-none-any.whl (35 kB)
Installing collected packages: tabulate
Successfully installed tabulate-0.9.0

[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m23.3.1[0m[39;49m -> [0m[32;49m23.3.2[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpython3.10 -m pip install --upgrade pip[0m


In [12]:
def calculate_wer_with_alignment(reference_text: str, recognized_text: str):
    
    # Перенесите сюда код из задания 1.a.
    # Приведение текста к нижнему регистру, удаление символов пунктуации и разбивка на слова
    translator = str.maketrans("", "", string.punctuation)
    reference_words = reference_text.translate(translator).lower().split()
    recognized_words = recognized_text.translate(translator).lower().split()

    # расстояние Левенштейна 
    
    # Инициализация матрицы для подсчета расстояния между словами
    distance_matrix = [[0] * (len(recognized_words) + 1) for _ in range(len(reference_words) + 1)]
    # Наполнение первой строки матрицы
    for i in range(len(reference_words) + 1):
        distance_matrix[i][0] = i

    # Наполнение первого столбца матрицы
    for j in range(len(recognized_words) + 1):
        distance_matrix[0][j] = j

    #Заполнение матрицы расстояний методом динамического программирования
    for i in range(1, len(reference_words) + 1):
        for j in range(1, len(recognized_words) + 1):
            diff = 1 if reference_words[i-1] != recognized_words[j-1] else 0
            distance_matrix[i][j] = min(
                    distance_matrix[i - 1][j] + 1,      # Deletion
                    distance_matrix[i][j - 1] + 1,      # Insertion
                    distance_matrix[i - 1][j - 1] + diff   # Substitution or Correct
                )
    

    # Расчет WER  (в процентах)
    wer = (distance_matrix[-1][-1] / len(reference_words)) * 100

    # используя distance_matrix восстановите путь (набор операций), который соответстует найденому WER
    # ali[0] =  разбитый по словам референс. Втавки отабражаются в эталонном выравнивании с помощью "***"
    # ali[1] = разбитая по словам гипотеза.
    # ali[2] = аннотация 
    
    i = len(reference_words)
    j = len(recognized_words)
    ali =[[],[],[]]
    deletion = 0
    insertion = 0
    substitution = 0
    correct = 0
    
    while i > 0 or j > 0:
        
        diff = 1 if reference_words[i-1] != recognized_words[j-1] else 0
        
        if (distance_matrix[i][j] == distance_matrix[i][j - 1] + 1) and j > 0:
            ali[0].append('***')
            ali[1].append(recognized_words[j - 1])
            ali[2].append('I')
            insertion += 1
            j -= 1
            
        elif(distance_matrix[i][j] == distance_matrix[i - 1][j] + 1) and i > 0:
            ali[0].append(reference_words[i - 1])
            ali[1].append("***")
            ali[2].append('D')
            deletion += 1
            i -= 1
            
        else:
            ali[0].append(reference_words[i - 1])
            ali[1].append(recognized_words[j - 1])
            if diff:
                ali[2].append('S')
                substitution += 1
            else:
                ali[2].append('C')
                correct += 1
            i -= 1
            j -= 1
        
    ali = [list(reversed(i)) for i in ali]    
    assert len(ali[0]) == len(ali[1]) == len(ali[2]), f"wrong ali {ali}"
    
    return {"wer" : wer,
            "cor": correct, 
            "del": deletion,
            "ins": insertion,
            "sub": substitution,
            "ali": ali}


In [13]:
def assert_wer_with_alignment(ref, hyp, ideal_report):
    report = calculate_wer_with_alignment(ref, hyp)
    for k, v in ideal_report.items():
        if isinstance(v, float):
            assert round(v, 2) == round(report[k], 2), f"for '{hyp=}' and '{ref=}' {ideal_report=}, calculate_wer {report=}"
        else:
            assert v == report[k], f"for '{hyp=}' and '{ref=}' {ideal_report=}, calculate_wer {report=}"

    
def test_wer_with_alignment():
    assert_wer_with_alignment('привет студент', 'привет студент',  {
            "wer" : 0,
            "cor": 2, 
            "del": 0,
            "ins": 0,
            "sub": 0,
            "ali": [["привет", "студент"],["привет", "студент"],['C', 'C']]})
    assert_wer_with_alignment('привет студент', 'студент', {
            "wer" : 50,
            "cor": 1, 
            "del": 1,
            "ins": 0,
            "sub": 0,
            "ali": [["привет", "студент"],["***", "студент"],['D', 'C']]})
    assert_wer_with_alignment('привет', 'привет студент', {
            "wer" : 100,
            "cor": 1, 
            "del": 0,
            "ins": 1,
            "sub": 0,
            "ali": [["привет", "***"],["привет", "студент"],['C', 'I']]})
    assert_wer_with_alignment('привет студент', 'пока студент',  {
            "wer" : 50,
            "cor": 1, 
            "del": 0,
            "ins": 0,
            "sub": 1,
            "ali": [["привет", "студент"],["пока", "студент"],['S', 'C']]})

    print(f"Test 1.b passed")
    
test_wer_with_alignment() 

Test 1.b passed


# 2. WER с пунктуацией (4 балла)
Попробуйте модифицировать WER таким образом, чтобы получившаяся метрика учитавала ошибки расстановки знаков препинания. 

Для этого надо ввести ограничение в алгоритм подсчета distance_matrix таким образом, чтобы запретить делать замену знака препинания на слово и наоборот.

Пример выравнивания 
```
Я сегодня  .   ***   ***  А ты  
Я    с    *** завтра  ?   А ты  
C    S    D_p   I    I_p  C  C    
```
Здесь суффикс _p в аннотации к ошибкам означает **ошибки пунктуации**


Задание: 
Напишите функцию, которая кроме стандартного WER считает дополнительно PunctuaionErrorRate (PER) по формуле

$$ PER = {I_p + D_p + S_p \over D_p + S_p + C_p} $$


In [39]:
#!pip install nltk
import nltk
nltk.download('punkt')

[nltk_data] Downloading package punkt to
[nltk_data]     /Users/anastasiazorkina/nltk_data...
[nltk_data]   Unzipping tokenizers/punkt.zip.


True

In [103]:
def calculate_wer_per(reference_text: str, recognized_text: str):
    # Приведение текста к нижнему регистру, удаление символов пунктуации и разбивка на слова
    reference_words = nltk.wordpunct_tokenize(reference_text.lower())
    recognized_words = nltk.wordpunct_tokenize(recognized_text.lower())
    
    # расстояние Левенштейна 
    
    # Инициализация матрицы для подсчета расстояния между словами
    distance_matrix = [[0] * (len(recognized_words) + 1) for _ in range(len(reference_words) + 1)]
    # Наполнение первой строки матрицы
    for i in range(len(reference_words) + 1):
        distance_matrix[i][0] = i

    # Наполнение первого столбца матрицы
    for j in range(len(recognized_words) + 1):
        distance_matrix[0][j] = j

    #Заполнение матрицы расстояний методом динамического программирования
    for i in range(1, len(reference_words) + 1):
        for j in range(1, len(recognized_words) + 1):
            if (reference_words[i-1] in string.punctuation and recognized_words[j-1] not in string.punctuation) or (reference_words[i-1] not in string.punctuation and recognized_words[j-1] in string.punctuation):
                one_is_punkt = 1
            else:
                one_is_punkt = 0
            diff = 1 if reference_words[i-1] != recognized_words[j-1] else 0
            
            distance_matrix[i][j] = min(
                    distance_matrix[i - 1][j] + 1,      # Deletion
                    distance_matrix[i][j - 1] + 1,      # Insertion
                    distance_matrix[i - 1][j - 1] + diff if not one_is_punkt else float('inf')# Substitution or Correct
                )

    print(distance_matrix)
    i = len(reference_words)
    j = len(recognized_words)
    ali =[]
    deletion = 0
    insertion = 0
    substitution = 0
    correct = 0
    deletion_p = 0
    insertion_p = 0
    substitution_p = 0
    correct_p = 0
    
    while i > 0 or j > 0:
        
        diff = 1 if reference_words[i-1] != recognized_words[j-1] else 0
        
        if(distance_matrix[i][j] == distance_matrix[i - 1][j] + 1) and i > 0:
            if reference_words[i - 1] in string.punctuation:
                ali.append('D_p')
                deletion_p += 1
            else:
                ali.append('D')
                deletion += 1
            i -= 1
            
        elif (distance_matrix[i][j] == distance_matrix[i][j - 1] + 1) and j > 0:
            if recognized_words[j - 1] in string.punctuation:
                ali.append('I_p')
                insertion_p += 1
            else:
                ali.append('I')
                insertion += 1
            j -= 1
            
        else:
            if reference_words[i - 1] in string.punctuation:
                if diff:
                    ali.append('S_p')
                    substitution_p += 1
                else:
                    ali.append('C_p')
                    correct_p += 1
            else:
                if diff:
                    ali.append('S')
                    substitution += 1
                else:
                    ali.append('C')
                    correct += 1    
            i -= 1
            j -= 1
        
    ali.reverse()   
    wer = (insertion +  deletion + substitution)/(deletion + substitution + correct)
    per = (insertion_p +  deletion_p + substitution_p)/(deletion_p + substitution_p + correct_p)
    
    return {"wer" : wer*100,
            "per": per*100, 
            "ali": ali}


In [104]:
print(calculate_wer_per('привет студент.', '.студент?'))

[[0, 1, 2, 3], [1, 2, 2, 3], [2, 3, 2, 3], [3, 2, 3, 3]]
{'wer': 50.0, 'per': 200.0, 'ali': ['I_p', 'D', 'C', 'S_p']}


In [105]:
def assert_wer_per(ref, hyp, ideal_report):
    report = calculate_wer_per(ref, hyp)
    for k, v in ideal_report.items():
        if isinstance(v, float):
            assert round(v, 2) == round(report[k], 2), f"for '{hyp=}' and '{ref=}' {ideal_report=}, calculate_wer {report=}"
        else:
            assert v == report[k], f"for '{hyp=}' and '{ref=}' {ideal_report=}, calculate_wer {report=}"

    
def test_wer_per():
    assert_wer_per('привет студент.', 'привет студент',  {
            "wer" : 0,
            "per": 100})
    assert_wer_per('привет студент.', 'студент.', {
            "wer" : 50,
            "per": 0,})
    assert_wer_per('привет студент.', 'привет. студент',  {
            "wer" : 0,
            "per": 200})
    assert_wer_per('привет студент.', '.студент?', {
            "wer" : 50,
            "per": 200, })

    print(f"Test 2 passed")
    
test_wer_per() 

[[0, 1, 2], [1, 0, 1], [2, 1, 0], [3, 2, 1]]
[[0, 1, 2], [1, 1, 2], [2, 1, 2], [3, 2, 1]]
[[0, 1, 2, 3], [1, 0, 1, 2], [2, 1, 2, 1], [3, 2, 1, 2]]
[[0, 1, 2, 3], [1, 2, 2, 3], [2, 3, 2, 3], [3, 2, 3, 3]]
Test 2 passed


# 3. Speaker-attributed Word Error Rate (4 балла)

В задаче распознавания диалоговых данных, когда говорят два диктора, важно не только распознать правильно каждое слово, но и отнести его к правильному диктору. Чаще всего такой результат получается с помощью комбинации двух независимых систем: распознавания речи и диаризация. 

При подсчете ошибки распознавания диалоговых систем в формулу WER добавляется еще один тип ошибки - S_I (speaker incorrect).

$$ SA{\text -}WER = \min{I + D + S + S_I \over D + S + C + S_I} $$

Кроме подсчета самой ошибки, sa-wer решает еще одну задачку - поиск маппинга из эталонных названий спикеров (например, имен) в предсказанные (чаще всего Idшники). Это необходимо, тк система диаризации не знает, какие названия у спикеров в эталоне. При подсчете SA-WER проверяются все возможные мапинги спикеров и выбирается тот, который соответствует минимальному значению ошибки. 



In [26]:
import itertools

In [63]:
def calculate_sawer(reference_text, reference_speakers, recognized_text, recognized_speakers):
    # В отличие от прошлых функций на вход sawer подаются уже разбитые на слова произнесения
    # Кроме списка слов, дополнительно передается список меток спикеров
    assert isinstance(reference_text, list)
    assert isinstance(recognized_text, list)
    assert len(reference_text) == len(reference_speakers)
    assert len(recognized_text) == len(recognized_speakers)
    
    # TODO  посчитайте sawer с учетом мапинга спикеров
    # для этого посчитайте значение ошибки для каждого варианта мапинга меток дикторов 
    # и выберете тот, который соответствует минимальному SA-WER
    
    reference_words = reference_text
    recognized_words = recognized_text
    
    # расстояние Левенштейна 
    
    # Инициализация матрицы для подсчета расстояния между словами
    distance_matrix = [[0] * (len(recognized_words) + 1) for _ in range(len(reference_words) + 1)]
    # Наполнение первой строки матрицы
    for i in range(len(reference_words) + 1):
        distance_matrix[i][0] = i

    # Наполнение первого столбца матрицы
    for j in range(len(recognized_words) + 1):
        distance_matrix[0][j] = j

    #Заполнение матрицы расстояний методом динамического программирования
    for i in range(1, len(reference_words) + 1):
        for j in range(1, len(recognized_words) + 1):
            diff = 1 if reference_words[i-1] != recognized_words[j-1] else 0
            distance_matrix[i][j] = min(
                    distance_matrix[i - 1][j] + 1,      # Deletion
                    distance_matrix[i][j - 1] + 1,      # Insertion
                    distance_matrix[i - 1][j - 1] + diff   # Substitution or Correct
                )
    

    # [A, B, C]  [1, 2, 3]
    all_reference_speakers = set(reference_speakers)
    all_recognized_speakers = set(recognized_speakers)
    max_id = max(all_recognized_speakers) + 1
    while len(all_reference_speakers) > len(all_recognized_speakers):
        all_recognized_speakers.add(max_id)
        max_id += 1
    
    all_recognized_speakers = list(all_recognized_speakers)
    all_reference_speakers = list(all_reference_speakers)
    all_permutations = list(itertools.permutations(all_recognized_speakers, len(all_reference_speakers)))

    all_maps = []
    for permutation in all_permutations:
        map = {}
        for ref, rec in zip(all_reference_speakers, permutation):
            map[ref] = rec
        all_maps.append(map)

    min_sawer = None
    best_ali = [[],[],[]]

    for map in all_maps:
                
        # используя distance_matrix восстановите путь (набор операций), который соответстует найденому WER
        # ali[0] =  разбитый по словам референс. Втавки отабражаются в эталонном выравнивании с помощью "***"
        # ali[1] = разбитая по словам гипотеза.
        # ali[2] = аннотация 
        
        i = len(reference_words)
        j = len(recognized_words)
        deletion = 0
        insertion = 0
        substitution = 0
        correct = 0
        speaker_incorrect = 0
        ali = [[],[],[]]
        
        while i > 0 or j > 0:

            diff = 1 if reference_words[i-1] != recognized_words[j-1] else 0

            if (distance_matrix[i][j] == distance_matrix[i][j - 1] + 1) and j > 0:
                ali[0].append('***')
                ali[1].append(recognized_words[j - 1])
                ali[2].append('I')
                insertion += 1
                j -= 1

            elif(distance_matrix[i][j] == distance_matrix[i - 1][j] + 1) and i > 0:
                ali[0].append(reference_words[i - 1])
                ali[1].append("***")
                ali[2].append('D')
                deletion += 1
                i -= 1

            else:
                ali[0].append(reference_words[i - 1])
                ali[1].append(recognized_words[j - 1])
                if diff:
                    ali[2].append('S')
                    substitution += 1
                #  Если слова равны, проверяем диктора
                elif map[reference_speakers[i-1]] != recognized_speakers[j-1]:
                    ali[2].append('S_I')
                    speaker_incorrect+=1
                else:
                    ali[2].append('C')
                    correct += 1
                i -= 1
                j -= 1
        
        sawer = 100*(insertion+deletion+substitution+speaker_incorrect)/(deletion+substitution+correct+speaker_incorrect)
        if min_sawer == None or sawer < min_sawer:
            min_sawer = sawer
            best_ali = [list(reversed(i)) for i in ali]  
    
    print(min_sawer, best_ali)
    return {"sawer" : min_sawer, 
            "ali": best_ali}


In [64]:
def assert_sawer(reference_text, reference_speakers, recognized_text, recognized_speakers, ideal_report):
    report = calculate_sawer(reference_text, reference_speakers, recognized_text, recognized_speakers)
    for k, v in ideal_report.items():
        assert v == report[k]

    
def test_sawer():
    assert_sawer(['привет', 'студент'], ['A', 'B'], ['привет', 'студент'], [1, 2],  {
            "sawer" : 0})
    assert_sawer(['привет', 'студент'], ['A', 'A'], ['привет', 'студент'], [1, 2],  {
            "sawer" : 50})
    assert_sawer(['привет', 'студент'], ['A', 'A'], ['привет', 'студент'], [0, 0],  {
            "sawer" : 0})
    assert_sawer(['привет', 'с'], ['A', 'B'], ['привет', 'студент'], [1, 2],  {
            "sawer" : 50})
    assert_sawer(['привет', 'с'], ['A', 'B'], ['привет'], [1],  {
            "sawer" : 50})
    assert_sawer(['привет'], ['A'], ['привет', 'студент'], [1, 0],  {
            "sawer" : 100})
    assert_sawer(['привет'], ['A'], ['привет', 'студент'], [0, 0],  {
            "sawer" : 100})

    print(f"Test 3 passed")
    
test_sawer()

0.0 [['привет', 'студент'], ['привет', 'студент'], ['C', 'C']]
50.0 [['привет', 'студент'], ['привет', 'студент'], ['C', 'S_I']]
0.0 [['привет', 'студент'], ['привет', 'студент'], ['C', 'C']]
50.0 [['привет', 'с'], ['привет', 'студент'], ['C', 'S']]
50.0 [['привет', 'с'], ['привет', '***'], ['C', 'D']]
100.0 [['привет', '***'], ['привет', 'студент'], ['C', 'I']]
100.0 [['привет', '***'], ['привет', 'студент'], ['C', 'I']]
Test 3 passed
