speech-recognition

This repository contains my attempt to use two famous speech recognition frameworks (Kaldi, CMU Sphinx4) for Arabic Language using the publicly-available dataset "Arabic Corpus of Isolated Words"

speech-recognition automatic-speech-recognition kaldi arabic asr arabic-nlp arabic-language cmu-sphinx cmusphinx arabic-numbers arabic-numerals kaldi-asr pykaldi

Updated Jan 15, 2020
Shell

srinivr / kaldi-long-audio-alignment

Star

Long audio alignment using Kaldi

speech-recognition automatic-speech-recognition speech-to-text kaldi transcription asr speechrecognition split-audio longaudio-alignment audio-segments speech-transcription

Updated Apr 22, 2021
Shell

foamliu / Listen-Attend-Spell-v2

Star

PyTorch implementation of Listen Attend and Spell Automatic Speech Recognition (ASR).

speech-recognition

Updated Jul 25, 2019
Shell

olami-developers / olami-api-quickstart-curl-samples

Star

OLAMI API Quickstart cURL Samples (in bash)

nlp shell api bash natural-language-processing cloud sdk ai curl natural-language chatbot nlu artificial-intelligence voice-recognition speech-recognition speech-to-text voice-control voice-assistant natural-language-understanding

Updated Jan 26, 2018
Shell

shreyanspagariya / sankshep

Star

Video Summarization - Summarized a video lecture and converted it to a slideshow using Speech-to-text, Keyword extraction and OpenCV Shot detection.

python opencv json cplusplus google-cloud video-summarization speech-recognition summarization shell-script speech-to-text keyword-extraction shotdetection google-speech-recognition

Updated Apr 13, 2018
Shell

IS2AI / ISSAI_SAIDA_Kazakh_ASR

Star

the first industrial-scale open-source Kazakh speech corpus. KSC2 corpus subsumes the previously introduced two corpora: KSC and KazakhTTS2 and supplements additional data from other sources. KSC2 contains around 1.2k hours of high-quality transcribed data comprising over 600k utterances.

speech-synthesis speech-recognition speech-to-text speechrecognition

Updated Jul 30, 2021
Shell

hmeutzner / kaldi-avsr

Star

Kaldi-based audio-visual speech recognition

deep-neural-networks speech-recognition kaldi avsr asr audio-visual-speech-recognition

Updated Apr 13, 2022
Shell

Improve this page

Add a description, image, and links to the speech-recognition topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the speech-recognition topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

speech-recognition

Here are 67 public repositories matching this topic...

kaldi-asr / kaldi

rhasspy / rhasspy

goodatlas / zeroth

AdolfVonKleist / Phonetisaurus

jcsilva / docker-kaldi-android

robmsmt / ASR-Audio-Data-Links

matteo-convertino / vosk-build-model

symblai / getting-started-samples

opensource-spraakherkenning-nl / Kaldi_NL

Tinkoff / asterisk-voicekit-modules

srvk / srvk-eesen-offline-transcriber

T-vK / Termux-DeepSpeech

va-stepanov / vosk-model-ru-adaptation

Anwarvic / Arabic-Speech-Recognition

srinivr / kaldi-long-audio-alignment

foamliu / Listen-Attend-Spell-v2

olami-developers / olami-api-quickstart-curl-samples

shreyanspagariya / sankshep

IS2AI / ISSAI_SAIDA_Kazakh_ASR

hmeutzner / kaldi-avsr

Improve this page

Add this topic to your repo