Инструмент для удобной работы с транскриптами Speech-To-Text Whisper, Яндекс Облака, Google Cloud. Основан на https://github.com/samFredLumley/aws-transcription-editor от https://github.com/samFredLumley Поставляется как есть, без каких либо гарантий. Я.Транскрипт не связан с компанией Яндекс.
Демо: https://ya-transcript.ulitin.ru
Ручное распознавание дает возможность познакомиться ближе с материалом записи, но занимает значительное время. Автоматическое распознавание быстрее и дешевле, но оно не идеально, к тому же происходит потеря информации, так как получившийся текст не связан с аудио.
Я.Транскрипт связывает преимущества ручного и автоматического распознавания. Позволяет быстро находить нужные места и прослушивать фрагменты точечно, редактировать транскрипт, а так же размечать фрагменты тегами.
Подобные редакторы есть в сервисах вроде сониксэйай, но стоимость распознования в них в разы выше.
- Связь текста и аудио
- Автоскролл
- Автосохранение в хранилище браузера
- Анотирование выделенного текста
- Зайдите на https://colab.research.google.com/drive/1wNmfq8rP8Y0xlCC2gX2vQhAnY8J_vhUs?usp=sharing вам потребуется гугл аккаунт
- Запустите первый блок для установки необходимых пакетов
- Запустите второй блок и выберите аудиофайлы
- Когда все будет готово, файлы json загрузятся в вашу папку загрузки
- Откройте https://ya-transcript.ulitin.ru
- Загрузите аудио и json к нему
- Вы должны увидеть расшифровку Подробнее о функциях смотрите в справке редактора
- Клонируйте репозиторий:
git clone https://github.com/likeleto/ya-transcript
cd ya-transcript
- Запустите сервер
http-server
- Откройте http://localhost:8080/