# Video Text Detection and Translation

## Introduction

In this notebook, we will use Google Cloud APIs to perform text detection and translation on a video file. The process involves:

1. **Text Detection**: Using Google Cloud's Video Intelligence API to detect text within the video.
2. **Text Translation**: Using Google Cloud's Translation API to translate the detected text into a target language.
3. **Output**: Writing the detected and translated text along with timestamps to a text file.

Note: it take very long time to translate video visual text content into text.

In [None]:
from google.cloud import videointelligence_v1 as videointelligence
from google.cloud import translate_v2 as translate
import os
import time
from pathlib import Path


src_path = "TestingSamples/video_sample_3.mp4"
dst_path = "TestingOutputs/video_sample_3.txt"
log_path = "TestingLogs/google_video_to_text_testing_results.txt"

os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = 'kaleidoo-435715-96fdd3ef71f6.json'

def detect_text(video_path):
    client = videointelligence.VideoIntelligenceServiceClient()

    with open(video_path, "rb") as video_file:
        input_content = video_file.read()

    features = [videointelligence.Feature.TEXT_DETECTION]

    operation = client.annotate_video(
        request={"features": features, "input_content": input_content}
    )

    print("Processing video for text detection...")
    result = operation.result(timeout=300)

    text_annotations = []
    for annotation_result in result.annotation_results:
        for text_annotation in annotation_result.text_annotations:
            for segment in text_annotation.segments:
                start_time = segment.segment.start_time_offset.total_seconds()
                end_time = segment.segment.end_time_offset.total_seconds()
                text_annotations.append({
                    "start_time": start_time,
                    "end_time": end_time,
                    "text": text_annotation.text
                })

    return text_annotations

def translate_text(text, target_language='he'):
    client = translate.Client()

    translation = client.translate(text, target_language=target_language)
    return translation['translatedText']

def main():

    start_time = time.time()

    video_path = src_path
    text_annotations = detect_text(video_path)

    with open(dst_path, 'w', encoding='utf-8') as file:
        for annotation in text_annotations:
            file.write(f"Detected text: {annotation['text']} (from {annotation['start_time']}s to {annotation['end_time']}s)\n")
            translated_text = translate_text(annotation['text'])
            file.write(f"Translated text: {translated_text}\n")

    end_time = time.time()

    print("Done processing.")
    print(f"Time to process = {end_time-start_time}")

    with open(log_path, 'a', encoding = 'utf-8') as file:
        file.write(f"Time to process - {Path(src_path).name}: {end_time-start_time}\n")

if __name__ == "__main__":
    main()

Time to process = 345.0896027088165

Detected text: סאל תשלח תשובות אוטומטיות | (from 54.3s to 57.4s)
Translated text: סאל תשלח תשובות אוטומטיות |
Detected text: וומטיות - (from 59.5s to 59.8s)
Translated text: וומטיות -
Detected text: סשלח תשובות אוטומטיות (from 62.6s to 92.6s)
Translated text: סשלח תשובות אוטומטיות
Detected text: סשלח תשובות אוטומטיות (from 97.3s to 159.4s)
Translated text: סשלח תשובות אוטומטיות
Detected text: וובות אוטו Yossi Demri (from 60.8s to 61.4s)
Translated text: וובות אוטו Yossi Demri
Detected text: A שעת התחלה: יום 09/07/20211 (from 72.2s to 72.5s)
Translated text: A שעת התחלה: יום 09/07/20211
Detected text: קבל את אפליק A (from 81.1s to 86.1s)
Translated text: קבל את אפליק A
Detected text: קבל את אפליק A (from 91.2s to 96.2s)
Translated text: קבל את אפליק A
Detected text: O אנשי הקשר שלי בלבד סכל אדם מחוץ לארגון שלי (from 127.7s to 127.7s)
Translated text: O אנשי הקשר שלי בלבד סכל אדם מחוץ לארגון שלי
Detected text: 00 (from 15.6s to 18.6s)
Translated text: 00
Detected text: 00 (from 24.9s to 25.2s)
Translated text: 00
Detected text: WWwW.Y4PC.CO.IL (from 11.6s to 11.6s)
Translated text: WwwW.Y4PC.CO.IL
Detected text: השב אוטומוזית לאנשים מחוץ לארגון שלי (from 129.2s to 129.2s)
Translated text: השב אוטומוזית לאנשים מחוץ לארגון שלי
Detected text: קובץ בית שליחה/קבלה (from 41.0s to 41.9s)
Translated text: קובץ בית שליחה/קבלה
Detected text: ס אל תשלח תשובות אוטומטיות (from 53.4s to 53.7s)
Translated text: ס אל תשלח תשובות אוטומטיות
Detected text: ס אל תשלח תשובות אוטומטיות (from 58.4s to 59.2s)
Translated text: ס אל תשלח תשובות אוטומטיות
Detected text: ס אל תשלח תשובות אוטומטיות (from 60.0s to 61.6s)
Translated text: ס אל תשלח תשובות אוטומטיות
Detected text: קבל את אפליק. אנשי הקשר שלי בלבד סכל אדם מחוץ לארגון שלי (from 127.2s to 127.2s)
Translated text: קבל את אפליק. אנשי הקשר שלי בלבד סכל אדם מחוץ לארגון שלי
Detected text: שלח בטווwמן זה בלבד: (from 56.9s to 56.9s)
Translated text: שלח בטווwמן זה בלבד:
Detected text: למיילים. (from 62.6s to 105.4s)
Translated text: למיילים.
Detected text: פרטי חשבון (from 42.3s to 42.7s)
Translated text: פרטי חשבון
Detected text: פרטי חשבון (from 42.8s to 52.5s)
Translated text: פרטי חשבון
Detected text: יציאה (from 42.8s to 52.5s)
Translated text: יציאה
Detected text: דרות חשב השב אוטומטית פעם אחת לכל שולח באמצעות ההודעות הבאות: (from 65.9s to 69.8s)
Translated text: דרות חשב השב אוטומטית פעם אחת לכל שולח באמצעות ההודעות הבאות:
Detected text: דרות חשב השב אוטומטית פעם אחת לכל שולח באמצעות ההודעות הבאות: (from 69.9s to 75.0s)
Translated text: דרות חשב השב אוטומטית פעם אחת לכל שולח באמצעות ההודעות הבאות:
Detected text: דרות חשב השב אוטומטית פעם אחת לכל שולח באמצעות ההודעות הבאות: (from 91.2s to 97.2s)
Translated text: דרות חשב השב אוטומטית פעם אחת לכל שולח באמצעות ההודעות הבאות:
Detected text: דרות חשב השב אוטומטית פעם אחת לכל שולח באמצעות ההודעות הבאות: (from 105.5s to 116.5s)
Translated text: דרות חשב השב אוטומטית פעם אחת לכל שולח באמצעות ההודעות הבאות:
Detected text: דרות חשב השב אוטומטית פעם אחת לכל שולח באמצעות ההודעות הבאות: (from 120.8s to 159.4s)
Translated text: דרות חשב השב אוטומטית פעם אחת לכל שולח באמצעות ההודעות הבאות:
Detected text: A (from 162.8s to 164.9s)
Translated text: א
Detected text: A (from 174.7s to 174.8s)
Translated text: א
Detected text: ר זמין להשיב ל Yossi Demri (from 105.5s to 106.3s)
Translated text: ר זמין להשיב ל Yossi Demri
Detected text: ר זמין להשיב ל Yossi Demri (from 107.5s to 116.5s)
Translated text: ר זמין להשיב ל Yossi Demri
Detected text: ר זמין להשיב ל Yossi Demri (from 121.8s to 122.4s)
Translated text: ר זמין להשיב ל Yossi Demri
Detected text: ר זמין להשיב ל Yossi Demri (from 126.4s to 131.7s)
Translated text: ר זמין להשיב ל Yossi Demri
Detected text: ר זמין להשיב ל Yossi Demri (from 146.8s to 151.9s)
Translated text: ר זמין להשיב ל Yossi Demri
Detected text: ר זמין להשיב ל Yossi Demri (from 157.1s to 159.4s)
Translated text: ר זמין להשיב ל Yossi Demri
Detected text: םשלח בטווח זמן זה בלבד: (from 62.6s to 64.2s)
Translated text: םשלח בטווח זמן זה בלבד:
Detected text: םשלח בטווח זמן זה בלבד: (from 65.9s to 70.6s)
Translated text: םשלח בטווח זמן זה בלבד:
Detected text: PRESS STA! (from 24.7s to 24.7s)
Translated text: לחץ על STA!
Detected text: תצוגה עזרה ? ספר לי (from 41.0s to 41.9s)
Translated text: תצוגה עזרה ? ספר לי
Detected text: F.www.Y4PC.CO.IL (from 10.6s to 10.6s)
Translated text: F.www.Y4PC.CO.IL
Detected text: SUBSCRIBE (from 16.7s to 19.0s)
Translated text: הירשם
Detected text: השב (from 40.4s to 42.2s)
Translated text: השב
Detected text: וובות אוטו (from 52.6s to 55.7s)
Translated text: וובות אוטו
Detected text: וובות אוטו (from 61.5s to 63.4s)
Translated text: וובות אוטו
Detected text: וובות אוטו (from 63.5s to 102.9s)
Translated text: וובות אוטו
Detected text: וובות אוטו (from 103.0s to 105.4s)
Translated text: וובות אוטו
Detected text: וובות אוטו (from 105.5s to 131.7s)
Translated text: וובות אוטו
Detected text: וובות אוטו (from 135.1s to 136.0s)
Translated text: וובות אוטו
Detected text: וובות אוטו (from 136.1s to 146.9s)
Translated text: וובות אוטו
Detected text: וובות אוטו (from 152.0s to 159.4s)
Translated text: וובות אוטו
Detected text: שאינך זמין להשיב להודעות דואר אלקטרוני. (from 42.8s to 52.5s)
Translated text: שאינך זמין להשיב להודעות דואר אלקטרוני.
Detected text: שעת סיום: שב (from 83.7s to 83.8s)
Translated text: שעת סיום: שב
Detected text: XX/XX (from 62.6s to 105.4s)
Translated text: XX/XX
Detected text: סאל תשלח תשובות אוטומטיות (from 52.6s to 53.3s)
Translated text: סאל תשלח תשובות אוטומטיות
Detected text: סאל תשלח תשובות אוטומטיות (from 53.8s to 54.2s)
Translated text: סאל תשלח תשובות אוטומטיות
Detected text: סאל תשלח תשובות אוטומטיות (from 59.3s to 59.9s)
Translated text: סאל תשלח תשובות אוטומטיות

and so on...

