-
Notifications
You must be signed in to change notification settings - Fork 136
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Transcription contains duplicated fragments #16
Comments
This is probably due to the fact that whisper use temperature fallback and beam search, while it's currently not supported by whisper-timestamped (see issue #10, it's WIP). Can you please try whisper with options
and tell if you see the duplicate fragments? If you see it, then your problem will be solved when issue #10 will be solved |
@romanzoniit You can now use option |
I think this issue is solved. Don't hesitate to re-open if it's still an issue after my last comments |
how to use this in python, not in console |
It's explained in the README
|
Tested on the 'medium' model
Got duplicate fragments
But whisper recognized it well.
{"text": " Вместе с вами мы будем делать оборудование. И мы будем делать оборудование, чтобы вы могли увидеть, что это такое. И мы будем делать оборудование, чтобы вы могли увидеть, что это такое. И мы будем делать оборудование, чтобы вы могли увидеть, что это такое. И мы будем делать оборудование, чтобы вы могли увидеть, что это такое. И мы будем делать оборудование, чтобы вы могли увидеть, что это такое. И мы будем делать оборудование, чтобы вы могли увидеть, что это такое. И мы будем делать оборудование, чтобы вы могли увидеть, что это такое. И мы будем делать оборудование, чтобы вы могли увидеть, что это такое. И мы будем делать оборудование, чтобы вы могли увидеть, что это такое. И мы будем делать оборудование, чтобы вы могли увидеть, что это такое. И мы будем делать оборудование, чтобы вы могли увидеть, что это такое. И мы будем делать оборудование, чтобы вы могли увидеть, что это такое. И мы будем делать оборудование, чтобы вы могли увидеть, что это такое. И мы будем делать оборудование, чтобы вы могли увидеть, что это такое. И мы будем делать оборудование, чтобы вы могли увидеть, что это такое. И мы будем делать оборудование, чтобы вы могли увидеть, что это такое. И мы будем делать оборудование, чтобы вы могли увидеть, что это такое. И мы будем делать оборудование, чтобы вы могли увидеть, что это такое. И мы будем делать оборудование, чтобы вы могли увидеть, что это такое. И мы будем делать оборудование, чтобы вы могли увидеть, что это такое.",
whisper:
{ "text": " Ну, одна, двухкомнатная интересует. Ну, я мужчина один. Тридцать три года русский. Сегодня вечером. Да, да, да. Да, да, но длительный срок. Ну, полгода, год. Нету, нету. Да, да, да. Борис. Да, конечно, какая вот, 50%. Да, да, да, я в курсе. Спасибо большое.",
The text was updated successfully, but these errors were encountered: