malaysian-stt-benchmarks

Benchmarking Malaysian Speech-to-Text models, HuggingFace space at https://huggingface.co/spaces/mesolitica/malaysian-stt-leaderboard

Dataset

📈 We evaluate models based on 3 datasets,

We filtered test set that contain numbers because malaya-speech transducer trained on normalized numbers.
We lower case because malaya-speech transducer trained on lower case.
We removed punctuation because malaya-speech transducer trained without punctuation.

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
fleurs-my-ms		fleurs-my-ms
imda-tts		imda-tts
malaya-speech-test-set		malaya-speech-test-set
README.md		README.md