-
Notifications
You must be signed in to change notification settings - Fork 1.7k
Open
Description
I'm working with Armenian language.
Before transcription I've converted Hugging Face whisper medium model which was fine tuned on Armenian data, using ct2-transformers-converter --model model/path --output_dir converted/model/path
While transcribing audio less than 30 seconds it transcribes only first 10-12 seconds, if audio is longer it cuts audio into 30 second chunks but again transcribes only first 10-12 seconds of every chunk.
here's an audio example and it's output
40712_0_26_967d2ae73de8f0b2198575b7387edb204b31893d78487a036b1f932f304053fd.mp4
[0.00s -> 18.04s] առողջապահության նախարարությունը մշակել են նոր ռազմավարությունը այս անգամ առողջության առաջնային պահպանման օղակի առնչվող առողջապահության փոխնախարարի խոսքով հինգամյա նոր ռազմավարությունը ոչ �
Reactions are currently unavailable
Metadata
Metadata
Assignees
Labels
No labels