labTalkNet

Информация о проекте Данный проект основан на работе NVIDIA https://arxiv.org/abs/2005.05514 «TalkNet: Fully-Convolutional Non-Autoregressive Speech Synthesis Model» за авторством Stanislav Beliaev, Yurii Rebryk, Boris Ginsburg. TalkNet это свёрточная неавторегрессионная нейронная модель для синтеза речи. Модель состоит из двух сверточных сетей с прямой связью.

Актуальность

Данный проект создает практически неотличимый от настоящей речи искусственную запись речи. Это может быть весьма удобно для начитки текста дикторам, издательствам аудиокниг и конечно же, для студентов. Кроме этого это может весьма помочь людям c ограниченными возможностями.

Структура проекта

Конечная реализация будет в таком виде: На сервере будет развернуто веб-приложение на основе (flask or smth) где можно будет ввести текст и выбрать требуемый голос для генерации. После ввода текст будет передан на вход модуля нейронной сети, обученной на воспроизведение наших голосов. В результате будет выдаваться .mp3 или .wav файл, который можно будет воспроизвести на самом сайте или же скачать для дальнейшего использования.

todo

WIP: На неделе постараюсь закончить.

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
.vscode		.vscode
app		app
images		images
README.md		README.md
Synthesize_TalkNet.ipynb		Synthesize_TalkNet.ipynb
requirements.txt		requirements.txt
run.py		run.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

labTalkNet

Актуальность

Структура проекта

todo

About

Releases

Packages

Contributors 2

Languages

Styml/labTalkNet

Folders and files

Latest commit

History

Repository files navigation

labTalkNet

Актуальность

Структура проекта

todo

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages