Skip to content

Styml/labTalkNet

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

18 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

labTalkNet

Информация о проекте Данный проект основан на работе NVIDIA https://arxiv.org/abs/2005.05514 «TalkNet: Fully-Convolutional Non-Autoregressive Speech Synthesis Model» за авторством Stanislav Beliaev, Yurii Rebryk, Boris Ginsburg. TalkNet это свёрточная неавторегрессионная нейронная модель для синтеза речи. Модель состоит из двух сверточных сетей с прямой связью.

Актуальность

Данный проект создает практически неотличимый от настоящей речи искусственную запись речи. Это может быть весьма удобно для начитки текста дикторам, издательствам аудиокниг и конечно же, для студентов. Кроме этого это может весьма помочь людям c ограниченными возможностями.

Структура проекта

Конечная реализация будет в таком виде: На сервере будет развернуто веб-приложение на основе (flask or smth) где можно будет ввести текст и выбрать требуемый голос для генерации. После ввода текст будет передан на вход модуля нейронной сети, обученной на воспроизведение наших голосов. В результате будет выдаваться .mp3 или .wav файл, который можно будет воспроизвести на самом сайте или же скачать для дальнейшего использования.

todo

WIP: На неделе постараюсь закончить.

шо куда

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published