In [1]:
import os
import json
from dotenv import load_dotenv
load_dotenv() 

from SpeechProcessor import SpeechProcessor

In [2]:
processor = SpeechProcessor(
    # api_key="your_api_key", 
    enable_logging=False, 
    speech_model='nano' #  or 'best'
    )

audio_file_path = "from_yt/IT_sample.mp3"

In [3]:
# 1. Transcribe the audio file
transcription_result = processor.transcribe(audio_file_path)
print(json.dumps(transcription_result, indent=4, ensure_ascii=False))

{
    "filename": "IT_sample.mp3",
    "detected_language": "it",
    "transcript": "Ciao a tutti e bentornati oppure benvenuti sul mio canale, in questo video condivido con voi alcuni momenti e pensieri degli ultimi giorni."
}


In [4]:
# 2. Translate the transcription to French
translation_result = processor.translate(transcription_result, target_lang="fr")
print(json.dumps(translation_result, indent=4, ensure_ascii=False))

{
    "filename": "IT_sample.mp3",
    "original": "Ciao a tutti e bentornati oppure benvenuti sul mio canale, in questo video condivido con voi alcuni momenti e pensieri degli ultimi giorni.",
    "detected_language": "it",
    "translation": "Bonjour à tous et bon retour ou bienvenue sur ma chaîne, dans cette vidéo je partage avec vous quelques moments et réflexions de ces derniers jours.",
    "target_language": "fr"
}


In [5]:
# 3. Transcribe and translate the audio file to French in one step
transcribe_translate_result = processor.transcribe_and_translate(audio_file_path, target_lang="fr")
print(json.dumps(transcribe_translate_result, indent=4, ensure_ascii=False))

{
    "filename": "IT_sample.mp3",
    "original": "Ciao a tutti e bentornati oppure benvenuti sul mio canale, in questo video condivido con voi alcuni momenti e pensieri degli ultimi giorni.",
    "detected_language": "it",
    "translation": "Bonjour à tous et bon retour ou bienvenue sur ma chaîne, dans cette vidéo je partage avec vous quelques moments et réflexions de ces derniers jours.",
    "target_language": "fr"
}


In [6]:
ogg_files = [os.path.join('from_yt', file) for file in os.listdir('from_yt') if file.endswith('.ogg') or file.endswith('.mp3')]
for file in ogg_files:
    full_process_result = processor.transcribe_and_translate(file, "fr")
    print(json.dumps(full_process_result, indent=4, ensure_ascii=False))
    print()

{
    "filename": "JA_sample.mp3",
    "original": "今日は何時に起きましたか?私は朝8時くらいに起きましたそして、もう1回寝て、さっき、さっき、",
    "detected_language": "ja",
    "translation": "À quelle heure t'es-tu réveillé aujourd'hui ? Je me suis réveillé vers 8 heures du matin et puis je me suis rendormi et tout à l'heure, tout à l'heure.",
    "target_language": "fr"
}

{
    "filename": "EN_sample.mp3",
    "original": "In 1999, when people thought they had seen it all in CGI. A film called the Matrix arrived right in the very first scene, before you barely settled down in your seat. Schw.",
    "detected_language": "en",
    "translation": "En 1999, quand les gens pensaient avoir tout vu en CGI, un film intitulé Matrix est arrivé dès la toute première scène, avant même que vous ne vous installiez à votre place. Schw.",
    "target_language": "fr"
}

{
    "filename": "IT_sample.mp3",
    "original": "Ciao a tutti e bentornati oppure benvenuti sul mio canale, in questo video condivido con voi alcuni momenti e pensieri d