## Поиск наиболее близкого имени участника ##

In [1]:
# conda install -c conda-forge python-levenshtein
# или pip install python-levenshtein

import Levenshtein

In [2]:
# что было написано в заявке
claim_list = [
    'Шехавцова Анна',
    'Гречихина Наталья',
    'Козлова Алена',
    'Груздева Алина',
    'Кущенко Анна',
    'Чистякова Анастасия'
]

In [3]:
# результат расшифровки речи диктора
speech_recognition = [
    'кучменко она',
    'кущенко оксана',
    'груздь алина',
    'рычихина наталья',
    'шиховцева на',
    'чистова анастасия'
]

### Используем библиотеку Levenshtein ###

In [4]:
# считаем метрики для всех возможных комбинаций
for recognized_name in speech_recognition:
    for real_name in claim_list:
        print('{},{},{}'.format(recognized_name, real_name, Levenshtein.distance(recognized_name, real_name)))

кучменко она,Шехавцова Анна,11
кучменко она,Гречихина Наталья,14
кучменко она,Козлова Алена,11
кучменко она,Груздева Алина,10
кучменко она,Кущенко Анна,5
кучменко она,Чистякова Анастасия,15
кущенко оксана,Шехавцова Анна,11
кущенко оксана,Гречихина Наталья,15
кущенко оксана,Козлова Алена,11
кущенко оксана,Груздева Алина,11
кущенко оксана,Кущенко Анна,5
кущенко оксана,Чистякова Анастасия,14
груздь алина,Шехавцова Анна,11
груздь алина,Гречихина Наталья,14
груздь алина,Козлова Алена,9
груздь алина,Груздева Алина,5
груздь алина,Кущенко Анна,10
груздь алина,Чистякова Анастасия,16
рычихина наталья,Шехавцова Анна,14
рычихина наталья,Гречихина Наталья,3
рычихина наталья,Козлова Алена,14
рычихина наталья,Груздева Алина,14
рычихина наталья,Кущенко Анна,14
рычихина наталья,Чистякова Анастасия,12
шиховцева на,Шехавцова Анна,6
шиховцева на,Гречихина Наталья,14
шиховцева на,Козлова Алена,9
шиховцева на,Груздева Алина,9
шиховцева на,Кущенко Анна,10
шиховцева на,Чистякова Анастасия,13
чистова анастасия

In [5]:
# сгруппируем результаты в словарь
results = {}
for recognized_name in speech_recognition:
    entry = {}
    for real_name in claim_list:
        entry[real_name] = Levenshtein.distance(recognized_name, real_name)
    results[recognized_name] = entry
results

{'кучменко она': {'Шехавцова Анна': 11,
  'Гречихина Наталья': 14,
  'Козлова Алена': 11,
  'Груздева Алина': 10,
  'Кущенко Анна': 5,
  'Чистякова Анастасия': 15},
 'кущенко оксана': {'Шехавцова Анна': 11,
  'Гречихина Наталья': 15,
  'Козлова Алена': 11,
  'Груздева Алина': 11,
  'Кущенко Анна': 5,
  'Чистякова Анастасия': 14},
 'груздь алина': {'Шехавцова Анна': 11,
  'Гречихина Наталья': 14,
  'Козлова Алена': 9,
  'Груздева Алина': 5,
  'Кущенко Анна': 10,
  'Чистякова Анастасия': 16},
 'рычихина наталья': {'Шехавцова Анна': 14,
  'Гречихина Наталья': 3,
  'Козлова Алена': 14,
  'Груздева Алина': 14,
  'Кущенко Анна': 14,
  'Чистякова Анастасия': 12},
 'шиховцева на': {'Шехавцова Анна': 6,
  'Гречихина Наталья': 14,
  'Козлова Алена': 9,
  'Груздева Алина': 9,
  'Кущенко Анна': 10,
  'Чистякова Анастасия': 13},
 'чистова анастасия': {'Шехавцова Анна': 13,
  'Гречихина Наталья': 12,
  'Козлова Алена': 12,
  'Груздева Алина': 14,
  'Кущенко Анна': 14,
  'Чистякова Анастасия': 4}}

### Выводим результаты ###

In [6]:
for k, v in results.items():
    best_match = sorted(v.items(), key = lambda x: x[1])[0]
    print(f'{k}:\n\t{best_match[0]} (расстояние Левенштейна {best_match[1]})')

кучменко она:
	Кущенко Анна (расстояние Левенштейна 5)
кущенко оксана:
	Кущенко Анна (расстояние Левенштейна 5)
груздь алина:
	Груздева Алина (расстояние Левенштейна 5)
рычихина наталья:
	Гречихина Наталья (расстояние Левенштейна 3)
шиховцева на:
	Шехавцова Анна (расстояние Левенштейна 6)
чистова анастасия:
	Чистякова Анастасия (расстояние Левенштейна 4)
