SpeechDoctor

This project detects VAD and ASR for an audio file.

Implemented with OpenAI's Whisper and VOSK models for counting the nubmer of words and sentences, timestamps

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
.gitignore		.gitignore
README.md		README.md
SpeechDoctor2.ipynb		SpeechDoctor2.ipynb
Word.py		Word.py
converted_e29i0_ShanIndaAMAccent_enhanced.mp3		converted_e29i0_ShanIndaAMAccent_enhanced.mp3
converted_e29i0_ShanIndaAMAccent_enhanced_resampled_mono.wav		converted_e29i0_ShanIndaAMAccent_enhanced_resampled_mono.wav
final.ipynb		final.ipynb
pause_json_data.json		pause_json_data.json
pause_json_data_audioanalysis.json		pause_json_data_audioanalysis.json
requirements.txt		requirements.txt
sentence_json_data_audioanalysis.json		sentence_json_data_audioanalysis.json

Provide feedback