# Solution Notebook - Key Features of Speech AI

*Focus on **Video Translator** key functions: generate SRT file, manage silences during translation, surimpose audio on video*

## Instruction

### 3 - Surimpose audio on video

- Import dependencies and load environment variables

In [1]:
import os
import requests
from pydub import AudioSegment
from dotenv import load_dotenv
from moviepy.editor import *

# access the environment variables from the .env file
load_dotenv('/workspace/.env')

inputs_path = "/workspace/inputs"
outputs_path = "/workspace/outputs"

- Define voice dubbing fucntion

In [2]:
# voice dubbing in the new language
def add_audio_on_video(translated_audio, video_input, video_title):

    videoclip = VideoFileClip(video_input)
    audioclip = AudioFileClip(translated_audio)

    new_audioclip = CompositeAudioClip([audioclip])
    new_videoclip = f"{outputs_path}/videos/{video_title}.mp4"
    
    videoclip.audio = new_audioclip
    videoclip.write_videofile(new_videoclip)
    
    return new_videoclip

- Get audio transcription from **TTS** model

In [3]:
# TTS function
def synthetize(output_nmt, video_input, video_title, voice_type):

    output_audio = 0
    output_audio_file = f"{outputs_path}/audios/{video_title}.wav"
    for sentence in range(len(output_nmt)):
        
        # add silence between audio sample
        if sentence==0:
            duration_silence = output_nmt[sentence][1]
        else:
            duration_silence = output_nmt[sentence][1] - output_nmt[sentence-1][2]
        silent_segment = AudioSegment.silent(duration = duration_silence)
        output_audio += silent_segment
        
        # create tts transcription
        data = {
            "encoding": 1,
            "language_code": "de-DE",
            "sample_rate_hz": 16000,
            "text": output_nmt[sentence][0],
            "voice_name": f"German-DE-{voice_type}"
        }
        
        # get response from endpoint
        response = requests.post(
            os.environ.get('TTS_DE_DE_ENDPOINT'), 
            json=data, 
            headers= {
                'accept': 'application/json',
                "Authorization": f"Bearer {os.environ.get('OVH_AI_ENDPOINTS_ACCESS_TOKEN')}",
            }
        )

        if response.status_code == 200:
            output_audio += AudioSegment(
            response.content,
            sample_width=2,
            frame_rate=16000,
            channels=1,
        )
        else:
            print("Error:", response.status_code)

    # export new audio as wav file
    output_audio.export(output_audio_file, format="wav")
    
    # add new voice on video
    voice_dubbing = add_audio_on_video(output_audio_file, video_input, video_title)
    
    return voice_dubbing

<img src="../images/audio_silence_generation_riva.png"  width=800 />

- Play input video sample

In [4]:
from IPython.display import Video

video_input = "video_ovhcloud_en_1.mp4"
Video(f"/workspace/workshop-mastering-speech-ai/samples/video_samples/{video_input}", embed=True)

- Translation output from **NMT API** model

In [5]:
# text translation
output_nmt = [
    ['Ist Ihr Domainname derzeit bei einem anderen Registrar und Sie möchten ihn zu Ovh Cloud übertragen? Dies können Sie über ein Transferverfahren tun.', 
     1080, 
     8040], 
    ['Bevor Sie beginnen, sehen Sie sich die Liste der Voraussetzungen in der Beschreibung dieses Videos an.', 
     12320, 
     17240], 
    ['Es ist perfekt. Lass uns anfangen.', 
     18160, 
     20200], 
    ['1. Es ist wichtig, dass die mit dem Domainnamen verbundenen Informationen aktuell sind. \
    Falls nicht, kontaktieren Sie bitte den aktuellen Domainnamen-Registrar und korrigieren Sie diese.', 
     21320, 
     31080], 
    ['Der zweite Schritt ist die Entsperrung des Domainnamens. Dieser Vorgang wird durch den aktuellen Domainnamen-Registrar durchgeführt.', 
     33280, 
     39960], 
    ['Wenn Sie nicht sicher sind, wie Sie diesen Schritt ausführen sollen, wenden Sie sich bitte an das Kundensupport-Team, \
    um Unterstützung bei diesem Schritt zu erhalten.', 
     40800, 
     46680], 
    ['Sobald Sie freigeschaltet sind, erhalten Sie einen Transfercode.', 
     49040, 
     51600], 
    ['Dieser Code wird manchmal auch als verschiedene Namen bezeichnet, wie Transfer Code, Auth Code, Auth Information oder Epp Code.', 
     52600, 
     60240], 
    ['Wenn Sie diesen Code haben, können Sie die ⁇ bertragung Ihres Domainnamens auf Ovh Cloud beantragen. \
    Der Vorgang ist einfach: Sie müssen ihn auf unserer Website bestellen. Das System erkennt, dass der Domainname existiert, und bietet an, \
    ihn zu übertragen. Nach den Validierungsschritten werden Sie aufgefordert, Ihren Transfercode anzugeben. Geben Sie diesen in das entsprechende Feld ein.', 
     61240, 
     80520], 
    ['Sie erhalten dann eine Bestellung, die ⁇ berweisung beginnt erst, wenn die Zahlung erfolgt ist.', 
     81920, 
     86920], 
    ['Von diesem Punkt, Sie werden in der Lage sein, den Transfer Fortschritt über die Ovh Cloud Control Panel verfolgen.', 
     87720, 
     92760], 
    ['Um dies zu tun, können Sie den Abschnitt Web Cloud aufrufen.', 
     93640,
     96080], 
    ['Klicken Sie auf den betreffenden Domainnamen und dann auf die laufende Operation.', 
     96920, 
     100800], 
    ['Sobald die Bestellung bezahlt wurde, erhält der Domainnamen-Registrar eine Validierungsanfrage, woraufhin der Transfer beginnt.', 
     101880, 
     108800], 
    ['Die Operation kann durchschnittlich fünf Tage dauern.', 
     109840, 
     112240], 
    ['Wenn der Registrar eine Ablehnung ausstellt, wenden Sie sich bitte an das Kundensupport-Team, um herauszufinden, warum.', 
     113080, 
     118800], 
    ['Sie müssen dann die ⁇ bertragungsanforderung aus dem Tracking Space neu starten.', 
     119640, 
     123000], 
    ['Wenn das Verfahren reibungslos verläuft, wird Ihr Domainname nun über Ovh Cloud verwaltet und Sie können ihn über das Ovh Cloud Control Panel verwalten.', 
     124160, 
     131200], 
    ['Und natürlich, wenn Sie mehr über das Thema in diesem Video erkunden möchten, lesen Sie bitte unsere Anleitungen in der Beschreibung.', 
     132000, 
     138520]
]
print("Translation output - NMT:\n\n", output_nmt)

Translation output - NMT:

 [['Ist Ihr Domainname derzeit bei einem anderen Registrar und Sie möchten ihn zu Ovh Cloud übertragen? Dies können Sie über ein Transferverfahren tun.', 1080, 8040], ['Bevor Sie beginnen, sehen Sie sich die Liste der Voraussetzungen in der Beschreibung dieses Videos an.', 12320, 17240], ['Es ist perfekt. Lass uns anfangen.', 18160, 20200], ['1. Es ist wichtig, dass die mit dem Domainnamen verbundenen Informationen aktuell sind.     Falls nicht, kontaktieren Sie bitte den aktuellen Domainnamen-Registrar und korrigieren Sie diese.', 21320, 31080], ['Der zweite Schritt ist die Entsperrung des Domainnamens. Dieser Vorgang wird durch den aktuellen Domainnamen-Registrar durchgeführt.', 33280, 39960], ['Wenn Sie nicht sicher sind, wie Sie diesen Schritt ausführen sollen, wenden Sie sich bitte an das Kundensupport-Team,     um Unterstützung bei diesem Schritt zu erhalten.', 40800, 46680], ['Sobald Sie freigeschaltet sind, erhalten Sie einen Transfercode.', 49040, 51

- Get results from **TTS API**

In [6]:
text_to_audio = synthetize(output_nmt, 
                           f"/workspace/workshop-mastering-speech-ai/samples/video_samples/{video_input}", 
                           video_input[:-4], 
                            "Male-1"
)
text_to_audio

Moviepy - Building video /workspace/outputs/videos/video_ovhcloud_en_1.mp4.
MoviePy - Writing audio in video_ovhcloud_en_1TEMP_MPY_wvf_snd.mp3


                                                                      

MoviePy - Done.
Moviepy - Writing video /workspace/outputs/videos/video_ovhcloud_en_1.mp4



                                                                 

Moviepy - Done !
Moviepy - video ready /workspace/outputs/videos/video_ovhcloud_en_1.mp4


'/workspace/outputs/videos/video_ovhcloud_en_1.mp4'

- Play the resulting video

In [7]:
from IPython.display import Video

Video(f"{outputs_path}/videos/{video_input}", embed=True)