Skip to content

TripleAVerAlpha/telegram_collecting_information

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Telegram Бот для сбора голосового датасета

Задача:
Собрать датасет голосового ввода для обучения нейронной сети по распознаванию голоса

Результаты:
Разработан Telegram бот разбивающий входной файл на короткие фразы и предоставляющий их пользователю для озвучивания. Все голосовые сообщения сохраняются в папку Data в формате .WAV (Данный формат требовался на выходе для обучения уже готовой нейронной сети). Так же для удобства дальнейшего использования все файлы собраны в таблицу, которая хранит длительность, путь к файлу и расшифровку. После требуется лишь прочитать manifest.csv и собрать из этого Tensorflow.Dataset. Так же реализовано сохранение прогресса пользователя, что позволяет не держать бота всегда включенным, а включать лишь по требованию.

Внедрение:
Бот опробован и с его помощью уже успешно собран Датасет из 400 наименований, пополнивший открытый Датасет.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages